基于黑龙江省佳木斯市孟家岗林场的12块样地65株人工红松解析木的955个枝解析数据,以Poisson回归模型和负二项回归模型作为备选模型,构建了人工红松二级枝条数量分布模型,并采用AIC、Pseudo-R2、均方根误差(RMSE)和Vuong检验对模型的拟合优度进行比较.结果表明: 每轮一级枝条分布数量集中在3~5个,均值为4个,一级枝条分布数量与人工红松自身的枝条属性相关.一级标准枝上二级枝条分布的离散程度较大,利用全部子回归技术构建二级枝条分布数量模型,最终选择以负二项回归模型为基础的E(Y)=exp(β0+β1lnRDINC+β2RDINC2+β3HT/DBH+β4CL+β5DBH)作为二级枝条分布数量最优预测模型(β为参数;RDINC为相对着枝深度;HT为树高;DBH为胸径;CL为冠长).最优模型的Pseudo-R2为0.79,平均偏差接近于0,平均绝对偏差<7.对于所建立的模型,lnRDINC、CL和DBH的参数为正值,RDINC2和HT/DBH的为负值,随着RDINC增大,在树冠内二级枝条分布数量存在最大值.总的来说,所建立的人工红松二级枝条分布数量模型的预测精度为96.4%,可以很好地预估该研究区域人工红松二级枝条分布数量,为以后枝条的光合作用和生物量的研究提供了理论基础.
Based on the measurement of 955 branch samples of 65 Korean pine (Pinus koraiensis) trees in 12 plots from Mengjiagang forest farm, Heilongjiang Province, and by using Poisson model and negative binomial model, the second-order branch count models for Korean pine were developed in this paper. AIC, PseudoR2, RMSE and Vuong test were selected to compare the goodnessoffit statistics of the models. The results indicated that the first-order branch count in a whorl was 3 to 5, with mean value of 4, and the firstorder branch count in a whorl for Korean pine plantation associated with its own characteristics. The secondorder branch count of the firstorder standard branch had a large discrete degree. All subset regression techniques were used to develop the second-order branch count model. The negative binomial regression model E(Y)=exp(β0+β1lnRDINC+β2RDINC2+β3HT/DBH+β4CL+β5DBH) was selected as the optimal second-order branch count model (β represented the parameter, RDINC represented the relative depth into crown from tree apex, HT represented the total tree height, DBH represented the tree diameter at breast height, CL represented the crown length). PseudoR2 of the optimal model was 0.79, the mean error was close to 0 and the mean absolute error was less than 7. For the developed model, the parameter values of lnRDINC, CL and DBH were negative, and the parameter values of RDINC2 and HT/DBH were positive. With the increase of RDINC, the number of second-order branch had a peak value in the tree crown. On the whole, the precision of the second-order branch count model for Korean pine plantation was 96.4%, which would be suitable for predicting the secondorder branch count for the study area and provide a theoretic basis for branch photosynthesis and biomass research.
全 文 :黑龙江省红松人工林枝条分布数量模拟
郑 杨 董利虎 李凤日∗
(东北林业大学林学院, 哈尔滨 150040)
摘 要 基于黑龙江省佳木斯市孟家岗林场的 12 块样地 65 株人工红松解析木的 955 个枝
解析数据,以 Poisson回归模型和负二项回归模型作为备选模型,构建了人工红松二级枝条数
量分布模型,并采用 AIC、Pseudo⁃R2、均方根误差(RMSE)和 Vuong 检验对模型的拟合优度进
行比较.结果表明: 每轮一级枝条分布数量集中在 3~5 个,均值为 4 个,一级枝条分布数量与
人工红松自身的枝条属性相关.一级标准枝上二级枝条分布的离散程度较大,利用全部子回
归技术构建二级枝条分布数量模型,最终选择以负二项回归模型为基础的 E(Y)= exp(β0 +
β1 lnRDINC+β2RDINC2+β3HT / DBH+β4CL+β5DBH)作为二级枝条分布数量最优预测模型(β 为
参数;RDINC为相对着枝深度;HT为树高;DBH为胸径;CL 为冠长) .最优模型的 Pseudo⁃R2为
0.79,平均偏差接近于 0,平均绝对偏差<7.对于所建立的模型,lnRDINC、CL 和 DBH 的参数为
正值,RDINC2和 HT / DBH的为负值,随着 RDINC增大,在树冠内二级枝条分布数量存在最大
值.总的来说,所建立的人工红松二级枝条分布数量模型的预测精度为 96.4%,可以很好地预
估该研究区域人工红松二级枝条分布数量,为以后枝条的光合作用和生物量的研究提供了理
论基础.
关键词 红松林; 一级枝条分布; 二级枝条分布; Poisson回归模型; 负二项回归模型
本文由国家自然科学基金项目(31570626)和中央高校基本科研业务费专项资金项目(2572015BX03)资助 This work was supported by the Na⁃
tional Natural Science Foundation of China (31570626) and the Fundamental Research Funds for the Central Universities of the People’ s Republic of
China (2572015BX03).
2015⁃12⁃07 Received, 2016⁃04⁃21 Accepted.
∗通讯作者 Corresponding author. E⁃mail: fengrili@ 126.com
Branch quantity distribution simulation for Pinus koraiensis plantation in Heilongjiang Pro⁃
vince, China. ZHENG Yang, DONG Li⁃hu, LI Feng⁃ri∗ (School of Forestry, Northeast Forestry
University, Harbin 150040, China) .
Abstract: Based on the measurement of 955 branch samples of 65 Korean pine (Pinus koraiensis)
trees in 12 plots from Mengjiagang forest farm, Heilongjiang Province, and by using Poisson model
and negative binomial model, the second⁃order branch count models for Korean pine were developed
in this paper. AIC, Pseudo⁃R2, RMSE and Vuong test were selected to compare the goodness⁃of⁃fit
statistics of the models. The results indicated that the first⁃order branch count in a whorl was 3 to 5,
with mean value of 4, and the first⁃order branch count in a whorl for Korean pine plantation associ⁃
ated with its own characteristics. The second⁃order branch count of the first⁃order standard branch
had a large discrete degree. All subset regression techniques were used to develop the second⁃order
branch count model. The negative binomial regression model E ( Y) = exp ( β0 + β1 lnRDINC +
β2RDINC2+β3HT / DBH+β4 CL+β5DBH) was selected as the optimal second⁃order branch count
model (β represented the parameter, RDINC represented the relative depth into crown from tree
apex, HT represented the total tree height, DBH represented the tree diameter at breast height, CL
represented the crown length). Pseudo⁃R2 of the optimal model was 0.79, the mean error was close
to 0 and the mean absolute error was less than 7. For the developed model, the parameter values of
lnRDINC, CL and DBH were negative, and the parameter values of RDINC2 and HT / DBH were
positive. With the increase of RDINC, the number of second⁃order branch had a peak value in the
tree crown. On the whole, the precision of the second⁃order branch count model for Korean pine
plantation was 96.4%, which would be suitable for predicting the second⁃order branch count for the
应 用 生 态 学 报 2016年 7月 第 27卷 第 7期 http: / / www.cjae.net
Chinese Journal of Applied Ecology, Jul. 2016, 27(7): 2172-2180 DOI: 10.13287 / j.1001-9332.201607.021
study area and provide a theoretic basis for branch photosynthesis and biomass research.
Key words: Pinus koraiensis; first⁃order branch distribution; second⁃order branch distribution;
Poisson regression model; negative binomial regression model.
树冠主要由枝条和叶组成,其中枝条为树木进
行光合作用和呼吸作用提供了重要的支撑.枝条作
为树冠的重要组成部分,其分布直接影响着树冠的
大小和形状,以及树冠的动态变化和木材质量[1-3] .
因此,研究枝条的分布有助于更好地理解树木的生
长机制,以及树木在林分中的生产力和生长活力.
从树木枝条分布数量的数据结构上分析,可以
把它归类为计数模型,而 Poisson回归模型和负二项
回归模型作为计数模型分析的两种基本方法,逐渐
从医疗和经济学领域延伸到了生物学[4] .虽然 Pois⁃
son回归模型和负二项回归模型都属于离散型概率
函数,但与 Poisson 回归模型相比,负二项回归模型
更适合于解决数据离散的问题[5-8] .迄今为止,国外
许多学者利用 Poisson 回归和负二项回归模型对一
级枝条数量进行大量且深入的研究.例如, Hein
等[2]在对挪威云杉(Picea abies)的每轮枝个数进行
模拟时选择了伴随 log 链接函数的 Poisson 分布;
Beaulieu等[5]在对加拿大短叶松(Pinus banksiana)
进行枝条数量的模拟时将枝长和胸径变量引入具有
混合效应的 Poisson回归模型中;Nemec等[9]利用混
合 Poisson模型建立 4种针叶树的枝条数量、枝条大
小和枝条垂直分布的模型;Nemec 等[10]运用 Gam⁃
ma⁃Poisson模型描述并估计了美国黑松(Pinus cont⁃
orta)当年生芽的分布. Sattler 等[11] 发现,白云杉
(Picea glauca)每米段上的枝条数量符合 Poisson 分
布;Kint 等[12] 利用 Poisson 分布对夏栎 (Quercus
robur)和欧洲山毛榉(Fagus sylvatica)枝条的计数数
据进行了广义线性模型和广义线性混合模型的模拟.
然而,国内外对于二级枝分布数量的研究未见
报道.肖锐等[13]从分枝概率和分枝角度等方面对樟
子松(Pinus sylvestris var. mongolica)人工林的一级
和二级枝进行了探索.刘兆刚等[14]构建了人工樟子
松一级枝条个数的预估模型,选用相对着枝深度、胸
径和树高变量描述一级枝条个数的变化规律.周元
满等[15]从水平和垂直分布格局上分析了红海榄
(Rhizophora styosa)天然林的一级和二级枝的分枝
规律.从树木的分枝结构角度考虑,一级枝上延伸出
来的即为二级枝,而二级枝作为一级枝的附属和扩
展,对树冠冠形、树木生理活动乃至树木的整体结构
和基本规律有着重要作用.本研究以人工红松为例,
选用 Poisson 回归模型和负二项回归模型对其一级
和二级枝条分布数量进行模拟,并采用全部子回归
的方法选取模拟枝条分布数量的最优模型,然后对
所建立模型进行独立性检验,为枝条分布数量的预
估提供理论依据.
1 研究地区与研究方法
1 1 研究区概况
研究区位于黑龙江省佳木斯市孟家岗林场
(46°20′30″—46°30′50″ N,130°32′42″—130°52′36″ E),地
处完达山西麓余脉,地势较为平缓.该区属东亚大陆
性季风气候,极端最高温和最低温分别为 35.6 和
-34.7 ℃,全年日照 1955 h,无霜期 120 d,海拔 170~
575 m,年平均降水量 550 mm.土壤类型以暗棕壤为
主,暗棕壤又以典型暗棕壤分布最广,其次为白浆化
暗棕壤,还有少量白浆土、草甸土、沼泽土及泥炭土.
植被属老爷岭植物区的小兴安岭⁃张广才岭亚区,目
前主要乔木树种包括红松、云杉、樟子松、落叶松
(Larix olgensis)等,灌木和藤本植物包括胡枝子
(Lespedeza bicolor)、毛榛子(Corylus mandshurica)、
五味子(Schisandra chinensis)、刺五加(Acanthopanax
senticosus)等.该林场以人工林为主,其中人工林面
积约占林场全部森林面积的 73%,蓄积量占 71%.其
中,人工林中红松林的面积和蓄积量分别占人工林
的 16%和 10%.
1 2 数据来源
本文数据来自于 2010 年在孟家岗林场设置的
12块红松人工林标准地,标准地面积为 0.06 hm2 .红
松人工林分主要林分因子见表 1.标准地设置后,对
标准地进行每木检尺.依据每木检尺的结果按照等
断面积径级标准木法将每块标准地内的林木划分为
5级,每级选取 1株红松解析木,12块标准地共得到
60株红松解析木.2014年在其中的 5 号标准地用同
样的方法选取了 5 株红松.因此,本研究共获得 65
株红松解析木数据.对每株解析木每一轮的所有枝
条进行编号,统计其一级枝条的个数,并测定每个枝
条的总着枝深度(RDINC)、基径(BD)、枝长(BL)等
枝条特征变量.每轮都选取一个中等大小、长势正常
的枝条作为一级标准枝,记录该标准枝上二级枝的
轮数及个数.因此,对于每株解析木都统计了每轮一
37127期 郑 杨等: 黑龙江省红松人工林枝条分布数量模拟
表 1 红松人工林林分因子统计
Table 1 Statistics of stand variables for Korean pine plantation
变量
Variable
最小值
Minimum
最大值
Maximum
平均值
Mean
标准差
SD
变异系数
CV (%)
年龄 Age 32.0 46.0 37.7 3.8 10.1
平均胸径 Mean DBH (cm) 15.3 21.8 18.9 2.3 12.5
平均树高 Mean tree height (m) 9.7 14.6 12.2 1.3 10.6
平均冠长 Mean crown length (m) 4.6 8.6 6.5 1.1 16.8
平均冠幅 Mean crown width (m) 1.7 2.9 2.2 0.4 18.7
林分密度 Density ( trees·hm-2) 650.0 1633.0 1064.8 329.5 31.0
坡度 Slope (°) 5.0 15.0 12.5 3.6 28.8
海拔 Altitude (m) 194.6 262.8 236.9 22.3 9.4
级枝条的个数和一级标准枝上二级枝条的个数.由
于红松的第一轮上的所有枝条是当年生枝,当年生
枝上不生长二级枝条(二级枝个数为 0),因此数据
处理时,将这 65株红松第一轮枝上二级枝个数为 0
的数据全部剔除.将 65 株解析木按 4 ∶ 1 的比例分
为建模数据和拟合数据.人工红松解析木和枝条分
布数量信息详见表 2,每轮一级枝条分布数量和一级
标准枝上二级枝条分布数量见图 1.每轮一级枝条分
布数量最小值为 1,最大值为 10,且都集中在每轮 3~
5个,所占比例达到 70%以上.因此,每轮一级枝条分
布的数量离散程度很小.在每轮一级标准枝条上二级
枝条分布的数量为 0~77,数据呈较离散状态.
1 3 数据处理
1 3 1 Poisson 回归模型 Poisson 回归模型是分析
计数型数据的一种最简单的方法[16-20],其概率密度
方程为:
F(yi)= P(Yi = yi)= (λyi / yi!)e
-λi (1)
式中:P(Yi = yi)是在一段时间内事件 Yi发生次数的
概率,本研究中,其为红松枝条分布数量发生的概
率;λ i为 Poisson分布的期望,而且方差与期望相等,
即 E(Yi)= λ i,Var(Yi)= λ i;自变量 xi与 λ i之间通过
连接函数 λ i = exp( xiβ)连接,xi为自变量(RDINC、
HT / DBH、CL、CW和 DBH 等);β 为参数向量,随机
变量 yi的值呈现出从 0到无穷大的整数变化,也就是
枝条个数从 0起按整数变化;当 y = 0时,表示红松枝
条分布数量为 0 的概率;当 y = 1 时,即 P(y = 1) =
λe-λ,表示红松枝条分布数量为 1 的概率;当y= k
时,即 P(y= k)= λ
y
y!
e-λ =λ
k
k!
e-a,表示有 k 个枝条个数
的概率.
Poisson回归模型的基本形式为:
E(Y)= μ=λ=exp(β0+β1x1+…+βmxp) (2)
式中:μ为人工红松枝条分布数量;βm为回归系数;
xm为解释变量.
1 3 2负二项( negative binomial, NB)回归模型
Poisson回归模型要求数据的均值和方差相等,但实
际数据往往不符合这一条件,若方差大于均值,就产
表 2 人工红松解析木和枝条分布信息统计
Table 2 Statistics of sampling trees and branch distribution for Korean pine plantation
树木因子
Tree factor
建模数据 Fitting data
样本数
Sample
size
最小值
Minimum
最大值
Maximum
平均值
Mean
标准差
SD
变异系数
CV
(%)
检验数据 Validation data
样本数
Sample
size
最小值
Minimum
最大值
Maximum
平均值
Mean
标准差
SD
变异系数
CV
(%)
胸径
DBH (cm)
52 12.30 27.30 20.08 3.70 18.4 13 12.90 26.30 20.19 3.70 18.3
树高
Tree height (HT, cm)
52 9.50 16.10 12.22 1.45 11.9 13 10.20 14.70 12.31 1.35 11.0
冠长
Crown length (CL, m)
52 3.50 9.90 6.53 1.62 24.8 13 3.50 8.90 6.12 1.68 27.5
冠幅
Crown width ( CW, m)
52 1.30 3.70 2.28 0.63 27.7 13 1.33 3.65 2.38 0.68 28.5
高径比
HT / DBH
52 0.44 0.83 0.62 0.10 16.4 13 0.48 0.97 0.63 0.12 18.7
一级枝个数
Number of first⁃order branch
843 1 10 3.80 1.49 39.5 211 1 10 3.80 1.50 39.5
二级枝个数
Number of second⁃order branch
775 1 77 27.40 15.36 57.0 180 1 67 27.02 16.49 61.0
4712 应 用 生 态 学 报 27卷
图 1 人工红松一级枝条(A)和一级标准枝上二级枝条(B)
分布数量
Fig. 1 Number of first⁃order branch (A) and second⁃order
branch of first⁃order standard branch (B) for Korean pine plan⁃
tation.
生了过度离散.过度离散有可能是观测值间的不独
立所致.通常选用负二项回归模型代替 Poisson 回归
模型.负二项回归模型在对模型进行参数估计时,通
过加入一个离散参数来调节数据的异质性解决过度
离散问题.因此,负二项回归模型比 Poisson 回归模
型更具适用性[21-24] .
Yi( i= 1,2,…,n)是遵循 Poisson 分布的独立随
机变量,其概率密度方程为:
P(Yi)=
λ i Yi
Yi!
e-λi =
λ i Yi
Γ(Yi+1)
e-λi (3)
式中:Г 为 Gamma 连接函数;参数 λ i与 Gamma(α,
β)属于独立同分布.λ i的概率密度函数为:
f(λ i)=
λ i α
-1
Γ(α)βα
e-
λi
β ,λ i>0 (4)
式中:α 为形状参数;β 为尺度参数. E (λ i ) = αβ,
Var(λ i)= αβ.
负二项回归模型的基本形式为:
E(Y)= μ=λ=exp(β0+β1xi+…+βmxm) (5)
式中:μ为人工红松枝条分布数量;βm为回归系数,
xm为解释变量.
1 3 3模型评价及检验 人工红松一级和二级枝条
分布数量模型所需变量及相关描述见表 3.本文利用
Poisson回归模型和负二项回归模型,采用全部子回
归方法构建人工红松一级、二级枝条分布数量模型,
从中确定出一个效果最优的回归模型.
为了比较人工红松一级、二级枝分布数量 Pois⁃
son / NB模型的拟合优度,选用以下 3 种指标来评价
模型的拟合效果,公式如下:
Pseudo⁃R2:
Pseudo⁃R2 = 1 -
∑
n
i = 1
(yi - y^i) 2
∑
n
i = 1
(yi - y) 2
(6)
均方根误差(RMSE):
RMSE =
∑
n
i = 1
(yi - y^i) 2
n - p
(7)
AIC= -2LL+2p (8)
传统的 Poisson回归和负二项模型属于非嵌套
模型.在这种情况下,不能仅用 AIC主观判断模型的
优劣,需要通过假设检验做出客观的选择.而 Vuong
检验在计数模型(Poisson / NB 模型)的比较分析中
有较高的检验能力[4,25-27] .因此,本文选用 Vuong 检
验择优方法.该方法利用零假设进行两个非嵌套模
型比较,在零假设下得到 Z 统计量并进行似然比检
验,根据 Vuong 的检验值和 P 值判断选优,极大地
提高了模型择优的效果.Vuong 证明,统计量 Z 近似
服从标准正态分布,且这个统计量是双向的,在双侧
显著水平为 0.05 时,当 Z≥1.96 时,选择模型 1,如
果 Z≤-1.96,则相反,当-1.96<Z<1.96[26],Vuong检
验不支持任何一个模型.此时,用拟合优度指标 AIC
作为参考.本研究利用 SAS 9.2进行 Vuong检验.
本文对 13株红松解析木的 180 个枝条进行独
立性检验.选用平均偏差 ( ME)、平均绝对偏差
(MAE)和预估精度(P%)这 3种统计量来反映模型
预估效果,计算公式如下:
ME =∑
n
i = 1
yi - y^i
n
æ
è
ç
ö
ø
÷ (9)
MAE =∑
n
i = 1
yi - y^i
n
(10)
P% =(1-
t0.05Sy
y^
)×100% (11)
Sy =
∑(yi - y^2) 2
n(n - p)
(12)
式中:-2LL为极大似然函数自然对数值乘以-2;2p
57127期 郑 杨等: 黑龙江省红松人工林枝条分布数量模拟
表 3 人工红松一级和二级枝条分布数量模型所需林木和
枝条变量及相关描述
Table 3 Symbol and associated description for tree and
branch⁃level variables tested in the first⁃order and second⁃
order branch distribution model for Korean pine plantation
变量符号
Variable symbol
变量描述
Description
RDINC 相对着枝深,即一级枝条的着枝深与冠长的比值
lnRDINC 相对着枝深的对数值
RDINC2 相对着枝深的平方值
HT 树高(m)
DBH 胸径(cm)
HT / DBH 树高与胸径的比值
CL 活树冠冠长(m)
CR 冠长与树高比值
CW 冠幅(m)
为模型中独立参数 p的 2倍;yi 为实测值;y^i 为模型
预估值; y = ∑yi / n ;n 为样本数;p 为模型的参数
个数.
如表 3 所示,相对着枝深度及其变换形式的变
量(RDINC、lnRDINC和 RDINC2)是关于枝条水平的
变量,能够直观地描述垂直方向上枝条数量分布的
规律;而胸径、树高、冠长和冠幅(DBH、HT、CL 和
CW)等变量是林木测定的最基本因子,能够确定林
木的基本形态特征.为了更准确地描述枝条数量分
布,本研究还选择了树高与胸径的比值和冠长与树
高的比值(HT / DBH 和 CR)作为变量,其中高径比
还可作为反映红松生长环境的竞争指标.
2 结果与分析
2 1 一级枝条分布规律
将每轮一级枝条个数与树木及枝条变量绘制散
点图,结果表明,每轮一级枝条分布数量与树木及枝
条变量没有明显的关系.将相对着枝深(RDINC)10
等分,绘制人工红松相对着枝深与一级枝条分布数
量的关系图.由图 2可以看出,每轮一级枝条基本在
4个左右,说明每轮一级枝条的个数与 RDINC 无
关,而与人工红松自身的枝条属性相关.进一步对一
级枝条分布数量做单因素方差分析,结果显示,不同
RDINC内的一级枝条分布数量没有显著差异(F =
1.779,P = 0.078).因此,对于人工红松一级枝条来
说,没有必要采用计数模型建立人工红松一级枝条
分布数量模型,可以认为每轮一级枝条的个数为 4.
2 2 二级枝条分布数量模型的建立及最优模型的
选取
本 研究利用 SAS 9 . 2统计软件中的 PROC
图 2 人工红松林木和枝条变量与一级枝条分布数量的关系
Fig.2 Relationships of tree and branch⁃level variables with
number of first⁃order branch for Korean pine plantation.
a) 0~0.1; b) 0.1~ 0.2; c) 0.2 ~ 0.3; d) 0.3 ~ 0.4; e) 0.4 ~ 0.5; f)
0.5~0.6; g) 0.6~0.7; h) 0.7~0.8; i) 0.8~0.9; j) 0.9~1.0.
GENMOD程序进行建模.根据 Poisson回归模型和负
二项回归模型的基础模型式(2)和(5)构建一级标
准枝上的二级枝条分布数量模型(简称 NSBM).
由表 4可知,各参数估计在 0.05 水平上显著,
二级枝条分布数量与相对着枝深(RDINC)、高径比
(HT / DBH)、冠长(CL)和胸径(DBH)显著相关.随
着变量的增多,二级枝条分布数量 Poisson回归模型
和负二项回归模型的 Pseudo⁃R2逐渐增大,AIC 和
RMSE逐渐变小,说明模型的预测能力及拟合效果
随模型变量的增多而增加.利用公式(9) ~ (11)评价
人工红松二级枝条分布数量模型.由表 4 可知,不同
Poisson 回归模型和负二项回归模型的平均偏差
(ME)和平均绝对偏差(MAE)都较小,ME 接近于
0,MAE<7,模型的预估精度都达到了 94%以上.其
中,含有 lnRDINC、RDINC2、HT / DBH、CL 和 DBH 5
个变量的 Poisson 回归模型和负二项回归模型拟合
效果和检验结果最好.通过对 Pseudo⁃R2、 AIC 和
RMSE的比较,并考虑模型变量获取的难易程度,最
终选取含有 5个变量的模型为最终模型形式.此外,
负二项模型 AIC 值小于 Poisson 模型的 AIC 值,
Vuong检验的检验值为-34.6776,P<0.0001,说明负
二项模型拟合效果优于 Poisson 模型.因此,可以应
用五变量负二项回归模型对红松一级标准枝上二级
枝条分布数量进行模拟.最终,人工红松一级标准枝
上二级枝条分布数量的最优模型形式如下:
E( Y) = exp ( 3. 9402 + 1. 2533lnRDINC - 0.9070
RDINC2-0.2929HT / DBH+0.0965CL+0.0138DBH)
(13)
由式(13)可以看出,RDINC、CL和 DBH的参数
估计值为正值,说明随着 RDINC、CL 和 DBH 的增
大,二级枝条分布数量增加;HT / DBH的参数估计值
6712 应 用 生 态 学 报 27卷
表 4 人工红松二级枝不同模型参数估计值和优度比较及独立性检验
Table 4 Parameter estimates, fitting statistics and validation result of second⁃order branch for Korean pine plantation
模型
Model
模型类型
Model type
参数
Parameter
估计值
Estimate
Pr>卡方
Pr>ChiSq
AIC Pseudo⁃
R2
RMSE ME MAE P
Poisson回归模型 E(Y)= exp(β0+β1lnRDINC) β0 4.0282 <0.0001 6461.9 0.61 9.81 -0.03 6.96 94.9
Poisson regression β1 0.8052 <0.0001
model E(Y)= exp(β0+β1lnRDINC+ β0 4.6916 <0.0001 6093.7 0.66 9.08 0.01 6.41 95.3
β2RDINC2) β1 1.2320 <0.0001
β2 -1.0171 <0.0001
E(Y)= exp(β0+β1lnRDINC+ β0 5.5347 <0.0001 5681.2 0.74 8.02 0.01 5.73 95.9
β2RDINC2+β3HT / DBH) β1 1.2308 <0.0001
β2 -0.9858 <0.0001
β3 -1.3814 <0.0001
E(Y)= exp(β0+β1lnRDINC+β2RDINC2+ β0 4.3933 <0.0001 5251.0 0.79 7.13 -0.04 5.52 96.1
β3HT / DBH +β4CL) β1 1.2262 <0.0001
β2 -0.8740 <0.0001
β3 -0.6724 <0.0001
β4 0.1008 <0.0001
E(Y)= exp(β0+β1lnRDINC+β2RDINC2+ β0 3.9911 <0.0001 5238.2 0.80 7.08 0.03 5.21 96.4
β3HT / DBH+β4CL+β5DBH) β1 1.2302 <0.0001
β2 -0.8943 <0.0001
β3 -0.3426 0.0283
β4 0.0875 <0.0001
β5 0.0145 0.0048
负二项回归模型 E(Y)= exp(β0+β1lnRDINC) β0 4.1118 <0.0001 5580.0 0.57 10.25 -0.24 6.93 94.8
Negative binomial β1 0.9002 <0.0001
regression model E(Y)= exp(β0+β1lnRDINC+ β0 4.7322 <0.0001 5464.9 0.66 9.11 0.04 6.43 95.3
β2RDINC2) β1 1.2618 <0.0001
β2 -1.0693 <0.0001
E(Y)= exp(β0+β1lnRDINC+ β0 5.5478 <0.0001 5329.9 0.74 8.01 0.03 5.75 95.8
β2RDINC2+β3HT / DBH) β1 1.2558 <0.0001
β2 -1.0229 <0.0001
β3 -1.3505 <0.0001
E(Y)= exp(β0+β1lnRDINC+β2RDINC2+ β0 4.3179 <0.0001 5096.2 0.79 7.18 -0.03 5.59 96.1
β3HT / DBH +β4CL) β1 1.2503 <0.0001
β2 -0.8876 <0.0001
β3 -0.5991 <0.0001
β4 0.1091 <0.0001E(Y)= exp(β0+β1lnRDINC+
β2RDINC2
β0 3.9402 <0.0001 5091.0 0.79 7.15 -0.03 5.30 96.4
+β3HT / DBH+β4CL+β5DBH) β1 1.2533 <0.0001
β2 -0.9070 <0.0001
β3 -0.2929 0.0482
β4 0.0965 <0.0001
β5 0.0138 0.0072
为负值,说明随着 HT / DBH 的增大,二级枝条分布
数量减少;RDINC2的参数估计值为负值,说明随着
RDINC的增大,在树冠范围内二级枝条分布数量存
在最大值.
根据选出的最优的红松一级标准枝上二级枝条
分布数量模型[式(12)],绘制红松枝条水平的实测
值和预测值线性相关图(图 3A),并利用红松一级
枝条分布规律,绘制得到全树二级枝条分布数量
(图 3B).从图 3可以看出,在红松的枝条水平(即红
松一级标准枝上二级枝条数量)和树木水平(即红
松全树二级枝条数量)上,二级枝实测值和预测值
的数量分布比较均匀.这表明,利用五变量负二项模
型拟合所得的二级枝条分布数量比较接近实际值,
模型预测效果较好,这也进一步证实了负二项回归
模型具有较高的准确性.
本文利用最优二级枝条分布数量模型模拟预测
树冠内不同着枝深处二级枝条的个数(图 4).结果
表明,在同一相对着枝深度处,冠长越长,二级枝个
77127期 郑 杨等: 黑龙江省红松人工林枝条分布数量模拟
图 3 人工红松二级枝条分布数量的实测值与预测值
Fig. 3 Observed value and predicted value of second⁃order
branch for Korean pine plantation.
A: 枝条水平 Branch level; B: 树木水平 Tree level.
数越多;当距离树冠底部 40%左右时,二级枝个数
达到最大值,然后呈递减趋势.随着 HT / DBH 的增
大,二级枝个数减小,在距离树冠底部 40%左右处,
二级枝个数达到最大值然后递减.说明二级枝条分
布数量的峰值发生在距树冠底部 40%左右处.
图 4 人工红松二级枝条分布数量的预测值
Fig.4 Predicted value of number of second⁃order branch for
Korean pine plantation.
A:二级枝条的 3 种冠长 Three crown lengths of second⁃order branch;
B: 二级枝条的 3 种高径比 Three HT / DBH ratios of second⁃order
branch. 冠长和高径比的模拟值来自胸径为 20 cm 的人工红松解析
木 Simulated values of CL and HT / DBH based on a Korean pine with
DBH= 20 cm.
3 讨 论
枝条分布是枝条基本属性的重要组成部分.本
研究以黑龙江省佳木斯林业局孟家岗林场的人工红
松为研究对象,分析了人工红松一级、二级枝条的分
布规律.一级枝条分布数量与树木及枝条变量没有
明显的关系.这主要是由人工红松自身的枝条属性
所决定的.二级枝条分布数量与相对着枝深、高径
比、冠长和胸径显著相关,随着高径比的增加,二级
枝条分布数量减少.而高径比与林分密度密切相关,
根据前人的相关研究,随着树木活力的增加,枝条分
布数量逐渐增大[2,28-29] .因此,高径比是可以反映树
木活力的指标.随着冠长和胸径的增加,二级枝条分
布数量增加,随着相对着枝深的增加,二级枝条分布
数量先增加后减小,在树冠范围内二级枝条分布数
量存在最大值,这与其他研究结果一致[11,30] .
Poisson回归模型和负二项模型是计数模型的 2
个基本方法.Poisson回归模型对数据的要求比较严
苛,适用于离散程度较小的数据;负二项回归模型是
Poisson回归模型的广义形式,离散参数的存在使得
负二项回归模型能够解释数据的异质性,更加适用
于离散程度较大的数据[8,13] .因此,针对本研究中的
二级枝分布,负二项回归模型能够更好地模拟和解
释每个一级标准枝条上二级枝分布数量.本文利用
Poisson回归模型和负二项回归模型,采用全部子回
归方法构建人工红松一级、二级分布数量模型,最终
确定了一级标准枝上二级枝分布数量的最优模型为
五变量负二项回归模型.最优模型中的 HT / DBH 和
RDINC2与二级枝个数呈现负相关,lnRDINC、CL 和
DBH与二级枝个数呈正相关.此外,随着 HT / DBH
和 CL的变化,二级枝呈现出在距树冠底部 40%左
右处个数达到最大,而后呈减少趋势.其原因可能是
随着相对着枝深的增加,一级枝条年龄逐渐增大,会
发生少轮的情况,即二级枝条会出现大量的死亡.因
此,越接近冠底,二级枝条分布数量越小.
本研究通过对孟家岗林场人工红松一级枝条分
布数量进行分析,并对一级标准枝上二级枝条分布
数量进行建模,得到了人工红松二级枝条分布数量
预测模型,这为以后枝条的光合作用和生物量的研
究提供了理论依据.本研究所构建的人工红松二级
枝条分布数量预测模型仅适用于本研究地区,随着
数据的积累,将进一步开展大区域的枝条分布数量
模型.
8712 应 用 生 态 学 报 27卷
参考文献
[1] Struck G, Dohrenbusch A. Development of a new
branchiness index Asix: A simple tool to describe
branchiness in young deciduous forest stands. Annals of
Forest Science, 2000, 57: 811-818
[2] Hein S, Mäkinen H, Yue C, et al. Modelling branch
characteristics of Norway spruce from wide spacings in
Germany. Forest Ecology and Management, 2007, 242:
155-164
[3] Newton M, Lachenbruch B, Robbins JM, et al. Branch
diameter and longevity linked to plantation spacing and
rectangularity in young Douglas⁃fir. Forest Ecology and
Management, 2012, 266: 75-82
[4] Guo F⁃T (郭福涛), Hu H⁃Q (胡海清), Ma Z⁃H (马
志海), et al. Applicability of different models in simu⁃
lating the relationships between forest fire occurrence
and weather factors in Daxing’ an Mountains. Chinese
Journal of Applied Ecology (应用生态学报), 2010, 21
(1): 159-164 (in Chinese)
[5] Beaulieu E, Schneider R, Berninger F, et al. Modeling
jack pine branch characteristics in Eastern Canada. For⁃
est Ecology and Management, 2011, 262: 1748-1757
[6] Welsh AH, Cunningham RB, Chambers RL. Methodolo⁃
gy for estimating the abundance of rare animals: Seabird
nesting on North East Herald Cay. Biometrics, 2000,
56: 22-30
[7] Sun L (孙 龙), Shang Z⁃C (尚喆超), Hu H⁃Q (胡
海清). Application of a Poisson regression model and a
negative binomial regression model in the forest fire fore⁃
casting. Scientia Silvae Sinicae (林业科学), 2012, 48
(5): 126-129 (in Chinese)
[8] Zhang X⁃Q (张雄清), Lei Y⁃C (雷渊才), Lei X⁃D
(雷相东), et al. Predicting stand⁃level mortality with
count data models. Scientia Silvae Sinicae (林业科学),
2012, 48(8): 54-61 (in Chinese)
[9] Nemec AFL, Parish R, Goudie JW, et al. Modelling
number, vertical distribution, and size of live branches
on coniferous tree species in British Columbia. Canadian
Journal of Forest Research, 2012, 42: 1072-1090
[10] Nemec AFL, Goudie JW, Parish R. A Gamma⁃Poisson
model for vertical location and frequency of buds on
lodgepole pine (Pinus contorta) leaders. Canadian Jour⁃
nal of Forest Research, 2010, 40: 2049-2058
[11] Sattler DF, Comeau PG, Achim A. Branch models for
white spruce (Picea glauca (Moench) Voss) in natural⁃
ly regenerated stands. Forest Ecology and Management,
2014, 325: 74-89
[12] Kint V, Hein S, Campioli M, et al. Modelling self⁃
pruning and branch attributes for young Quercus robur L.
and Fagus sylvatica L. trees. Forest Ecology and Man⁃
agement, 2010, 260: 2023-2034
[13] Xiao R (肖 锐), Li F⁃R (李凤日), Liu Z⁃G (刘兆
刚). Branching structure analysis of Mongolian pine
plantation. Bulletin of Botanical Research (植物研究),
2006, 26(4): 490-496 (in Chinese)
[14] Liu Z⁃G (刘兆刚), Shu Y (舒 扬), Li F⁃R (李凤
日). Modeling for primary branch length and branch di⁃
ameter of Mongolian Scots pine trees. Bulletin of Botani⁃
cal Research (植物研究), 2008, 28(2): 244-248 (in
Chinese)
[15] Zhou Y⁃M (周元满), Huang J⁃J (黄剑坚), Nie Y
(聂 页), et al. Analysis on crown branching laws of
natural Rhizophora stylosa. Journal of Northeast Forestry
University (东北林业大学学报), 2013, 41(2): 14-
17 (in Chinese)
[16] Cameron AC, Trivedi PK. Regression Analysis of Count
Data. Cambridge, US: Cambridge University Press,
2013
[17] Chen JJ, Ahn H. Fitting mixed Poisson regression mod⁃
els using Quasi⁃Likelihood methods. Biometrical Jour⁃
nal, 1996, 38: 81-96
[18] Land KC, Mccall PL, Nagin DS. A comparison of Pois⁃
son, negative binomial, and semiparametric mixed Pois⁃
son regression models. Sociological Methods Research,
1996, 24: 387-442
[19] Ma JM, Kockelman KM, Paul D. A multivariate Pois⁃
son⁃lognormal regression model for prediction of crash
counts by severity, using Bayesian methods. Accident
Analysis & Prevention, 2008, 40: 964-975
[20] Crowther MJ, Riley RD, Staessen JA, et al. Individual
patient data meta⁃analysis of survival data using Poisson
regression models. BMC Medical Research Methodology,
2012, 12: 463
[21] Wang P. A bivariate zero⁃inflated negative binomial re⁃
gression model for count data with excess zeros. Econo⁃
mics Letters, 2003, 78: 373-378
[22] Cruyff MJ, Van PG. Point and interval estimation of the
population size using a zero⁃truncated negative binomial
regression model. Biometrical Journal, 2008, 50:
1035-1050
[23] Eskelson BNI, Temesgen H, Barrett TM. Estimating
cavity tree and snag abundance using negative binomial
regression models and nearest neighbor imputation meth⁃
ods. Canadian Journal of Forest Research, 2009, 39:
1749-1765
[24] Xu X (徐 昕), Yin Z⁃H (尹占华), Guo N⁃G (郭念
国). Applications of zero⁃inflated models to general in⁃
97127期 郑 杨等: 黑龙江省红松人工林枝条分布数量模拟
surance. Statistical Thinktank (统计教育), 2009, 16
(4): 31-33 (in Chinese)
[25] Lambert D. Zero⁃inflated Poisson regression, with an ap⁃
plication to defects in manufacturing. Technometrics,
1992, 34: 1-14
[26] Tang X⁃R (唐欣然), Huang Y⁃H (黄耀华), Wang Y
(王 杨). Clinical application and SAS implementation
of Vuong test. China Academic Journal Electronic Pub⁃
lishing House (中华疾病控制杂志), 2013, 17(7):
1182-1185 (in Chinese)
[27] Macneil MA, Carlson JK, Beerkircher LR. Shark depre⁃
dation rates in pelagic longline fisheries: A case study
from the Northwest Atlantic. Ices Journal of Marine Sci⁃
ence, 2009, 66: 708-719
[28] Mäkinen H, Ojansuu R, Sairanen P, et al. Predicting
branch characteristics of Norway spruce ( Picea abies
(L.) Karst) from simple stand and tree measurements.
Forestry, 2003, 76: 525-546
[29] Kellomäki S, Tuimala A. Effect of stand density on
branchiness of young scots pine. Folia Forestalia, 1981,
478: 1-27
[30] Weiskittel AR, Maguire DA, Monserud RA. Response
of branch growth and mortality to silvicultural treatments
in coastal Douglas⁃fir plantations: Implications for pre⁃
dicting tree growth. Forest Ecology and Management,
2007, 251: 182-194
作者简介 郑 杨,女,1990年生,硕士研究生. 主要从事林
分生长与收获模型研究. E⁃mail: 954125935@ qq.com
责任编辑 孙 菊
郑杨, 董利虎, 李凤日. 黑龙江省人工红松枝条分布数量模拟. 应用生态学报, 2016, 27(7): 2172-2180
Zheng Y, Dong L⁃H, Li F⁃R. Branch quantity distribution simulation for Pinus koraiensis plantation in Heilongjiang Province, China.
Chinese Journal of Applied Ecology, 2016, 27(7): 2172-2180 (in Chinese)
0812 应 用 生 态 学 报 27卷