免费文献传递   相关文献

Height and Diameter Growth Modeling of Dahurian Larch Based on Nonlinear Mixed Model in Northeastern China

基于非线性混合模型的东北兴安落叶松树高和直径生长模拟



全 文 :林业科学研究 2012,25(1):11 16
ForestResearch
  文章编号:10011498(2012)01001106
基于非线性混合模型的东北兴安落叶松树高
和直径生长模拟
姜立春,杜书立
(东北林业大学林学院,黑龙江 哈尔滨 150040)
收稿日期:20110320
基金项目:国家自然科学基金(30972363)、林业公益性行业科研专项(20100426)和黑龙江省科技厅留学归国资助项目(LC2009C08)的
部分研究内容。
摘要:以黑龙江省带岭林业局大青川林场80株人工兴安落叶松解析木数据为例,采用 Richards生长模型作为基础
模型,利用S-PLUS软件中的NLME过程,分别拟合非线性树高和直径生长模型。采用AIC、BIC、对数似然值和似
然比检验等模型评价统计指标对不同模型的精度进行比较分析。结果表明:当对树高-年龄关系进行拟合时,b1、
b3同时作为混合参数时模型拟合最好;当对直径-年龄关系进行拟合时,b1、b3同时作为混合参数时模型拟合最
好。把相关性结构包括一阶自回归结构AR(1)、一阶移动平均结构 MA(1)及一阶自回归与移动平均结构[ARMA
(1,1)]加入到树高和直径最优混合模型中,一阶自回归结构AR(1)显著提高了树高混合模型的拟合精度,一阶移
动平均结构MA(1)显著提高了直径混合模型的拟合精度。模型检验结果表明:混合模型通过校正随机参数值能提
高模型的预测精度。因此,混合模型在应用上不但能反映树高和直径的平均预测趋势,还能用方差协方差结构和误
差相关性结构校正随机参数来反映个体之间的差异。
关键词:单木生长模型;非线性混合模型;时间序列相关结构;兴安落叶松
中图分类号:S711 文献标识码:A
HeightandDiameterGrowthModelingofDahurianLarchBasedon
NonlinearMixedModelinNortheasternChina
JIANGLichun,DUShuli
(ColegeofForestry,NortheastForestryUniversity,Harbin 150040,Heilongjiang,China)
Abstract:Withthestemanalysisdatabasedon80sampletreesfromdahurianlarch(LarixgmeliniRupr.)planta
tionslocatedinDaqingchuanForestryCenterofDailingForestBureauinHeilongjiangProvince,theRichardsgrowth
modelwasselectedtomodeltheheight/ageanddiameter/agerelationshipsofdahurianlarchusingNLMEprocedure
ofSPLUS.Evaluationstatistics,suchasAIC,BIC,LogLikelihoodandlikelihoodratiotestwereusedforprecision
analyzingandcomparingofdiferentmodels.TheresultsindicatedthatRichardsmodelwithparametersb1andb3as
mixedefectsshowedthebestperformanceforbothheightagerelationshipsanddiameteragerelationships.Corela
tionstructuresincludingfirstorderautoregressivecorelationstructureAR(1),movingaveragecorelationstructure
MA(1)andautoregressivemovingaveragecorelationstructure[ARMA(1,1)]wereincorporatedintotheoptimal
heightanddiametermixedmodels.AR(1)significantlyimprovedtheprecisionofmixedheightmodelandMA(1)
significantlyimprovedtheprecisionofmixeddiametermodel.Modelvalidationshowedthatthemixedmodelwith
calibrationofrandomparameterscouldimprovetheprecisionofprediction.Therefore,theapplicationofthemixed
modelshowednotonlythemeantrendsofheightanddiameterprediction,butalsotheindividualdiferencebycali
bratingrandomparametersusingvariancecovariancestructureandcorelationstructure.
林 业 科 学 研 究 第25卷
Keywords:individualtreegrowthmodel;nonlinearmixedmodel;timeseriescorelationstructure;Larixgmelini
单木模型是以个体树木的生长信息为基础,从
林木生长的竞争机制出发,模拟林分内不同大小树
木的生长过程模型[1-5]。单木生长模型是研究森林
生长变化规律及预估单木生长量、收获量的基础手
段,也是间接预测单木生物量和碳含量动态变化的
主要工具之一。建立单木生长模型的方法有生长分
析法、经验方程法、变量代换法及生长量修正法
等[6-7]。多数学者采用生长模型,如 Logistic、Rich
ards、Korf、Gompertz、Mitscherlich等基本模型及引入
林木竞争指标来模拟林木生长因子的变化。
混合模型是近代发展起来的新的统计方法,主
要应用于分组数据,如纵向数据、重复测量数据及多
变量多层数据。这种方法广泛应用于农业、生物、生
态、生物医学、社会学、经济学和药物动力学等领域。
近年来混合模型在树木生长模型上得到广泛应用。
Fang等[8]针对美国南部湿地松(PinuseliotiEn
gelm.)的优势木高提出了两阶段非线性混合模型的
建模体系。该模型体系考虑了不同经营措施和样地
的随机效应,从随机参数确定、方差协方差结构、校
正方差异质性函数、时间序列函数等方面阐述了非
线性混合模型的建模步骤,并采用计算公式和实例
进行了详细说明。从计算方法和理论上完善了混合
模型构建体系。Calegario等[9]基于 Logistic模型为
巴西无性繁殖桉树(Eucalyptussp.)人工林构造了非
线性混合优势木高生长模型。该模型考虑了样地和
不同无性繁殖组合随机效应,结果表明,混合模型描
述桉树优势木高具有灵活性、准确性和精确性。
Nothdurft等[10]模拟了德国挪威云杉(Piceaabies
(L.)Karst.)树高生长混合模型,结果表明,考虑随
机效应和方差-协方差结构的混合模型方法比传统
方法预测精度高。近年来混合模型在国内林业生长
模型上也得到了应用,李永慈等[11]基于变化后的苏
马克模型和 Logistic模型,利用 SAS软件的 MIXED
和NLMIXED过程建立了不同初植密度的杉木
(Cunninghamialanceolata(Lamb.)Hook.)树高生
长模型。李春明等[12]基于变化后的 Richards模型
和Logistic模型,利用SAS软件的NLMIXED过程建
立了不同区组的杉木林优势木平均高生长模型。
本文以兴安落叶松(Larixgmelini(Rupr.)Ru
pr.)人工林为研究对象,选择 Richards生长模型为
基本模型,利用S-PLUS软件的 NLME模块建立树
高和直径非线性混合模型,并对混合效应模型中随
机参数值的矫正进行探讨,然后对混合效应模型与
传统模型拟合效果进行检验及比较分析。
1 数据与方法
1.1 数据
用来建立模型的数据来自黑龙江省带岭林业局
大青川林场的20块落叶松人工林样地。样地面积
为004hm2,实测样地林木的胸径和树高。在每块
样地内选取4株标准木进行伐倒木测定。测定因子
包括:胸径、树高、第一活枝高和第一死枝高、树冠长
度和冠幅以及圆盘解析。圆盘解析采用中央断面积
区分法进行。其中树高在15m(含15m)以上者按
2m区分;树高在149m以下者按1m区分。测量
各区分段梢头和梢底直径及中央位置处的带皮和去
皮直径。在胸高处和在各区分处,截取3cm厚的圆
盘。在圆盘的非工作面上标明南北向。在实验室将
圆盘工作面刨光,并通过髓心划出东西、南北2条直
线,然后查数各圆盘上的年轮个数。用直尺测量每
个圆盘东西、南北2条直线上各龄阶的直径,取平均
值即为该龄阶的直径。树龄与各圆盘的年轮个数之
差,即为林木生长到该断面高度所需要的年数。从
20块样地中选择5块样地即20株样木数据作为本
研究的验证数据,其余15块样地即60株样木数据
作为拟合数据,具体见表1。
表1 落叶松人工林样木调查因子统计量
数据类型 变量 平均值 最小值 最大值 标准差 变动系数
建模数据(n=60) 年龄/a 24.15 17.00 37.00 7.62 31.55
直径/cm 14.71 7.45 25.52 4.97 33.83
树高/m 14.35 7.60 23.70 4.85 33.80
冠幅/m 4.19 2.40 6.65 0.92 22.05
冠长/m 8.00 4.50 13.80 2.17 27.09
检验数据(n=20) 年龄/a 26.04 17.00 37.00 8.05 30.90
直径/cm 15.15 7.58 23.40 4.55 30.04
树高/m 15.62 9.20 23.50 4.74 30.32
冠幅/m 4.06 2.75 6.65 1.12 27.66
冠长/m 7.83 4.65 13.80 2.06 26.36
21
第1期 姜立春等:基于非线性混合模型的东北兴安落叶松树高和直径生长模拟
1.2 方法
1.2.1 基础模型 非线性生长模型选择林业上常
用的Richards模型,其模型形式:
y=b1 1-exp-b2( )[ ]t
b3+ε (1)
式中:y为林木生长因子,代表胸径或树高;t为年
龄;b1、b2、b3为模型待定参数;ε为模型的误
差项。
在基本模型基础上构建混合模型,混合模型中
包含固定参数、随机参数和方差协方差结构,混合
模型的构建需要以下3个步骤:
(1)确定参数效应。混合模型构建过程中最重
要的一步是确定参数效应,即哪个参数为固定参数,
哪个参数为混合参数,Pinheiro等[13]建议如果模型
能收敛,首先应把模型中所有参数看成是混合参数,
然后将不同随机参数组合的模型进行拟合,利用
AIC、BIC、LogLikelihood及似然比检验等统计量指
标对模型的拟合优度进行比较。本文按照此方法进
行随机效应参数确定。
(2)确定方差协方差结构(Ri)。本文所使用
的生长数据是与时间相关的,为了确定方差协方差
结构,必须解决误差相关性和异方差问题。本研究
采用一阶自回归模型 AR(1)、一阶移动平均模型
MA(1)及一阶自回归与移动平均模型[ARMA(1,
1)]来解决样地内误差相关性。目前,在统计和林
业上基本都采用式(2)来描述[14]:
Ri=σ
2G0.5I ΓiG
0.5
I (2)
式中:σ2指模型的残差方差值,Γi为时间序列相关
结构,即描述同一树木内不同测量值相关性,GI为
描述方差异质性的对角矩阵。
(3)确定随机效应的方差协方差结构(D)。树
木间的方差协方差结构反映了树木间的变化。本研
究检验了林业上4种常用的方差协方差结构,包括
无结构(UN)、复合对称(CS)、对角矩阵(Diagonal
matrix)、广义正定矩阵(Generalpositive-definite
matrix)[15]。
1.2.2 模型评价和检验指标 拟合和检验结果通
过以下统计量和指标评价:绝对误差 (Bias)、均方
根误差(RMSE)、确定系数(R2)。
Bias=
∑mi=1∑
ni
j=1 yij-y^( )ij
n (3)
RMSE=
∑mi=1∑
ni
j=1 yij-y^( )ij

n-槡 1 (4)
R2 =1- ∑

i=1∑
ni
j=1 yij-y^( )ij

∑mi=1∑
ni
j=1 yij-珋( )y
[ ]2 (5)
  其中:yij为观测值,^yij为预测值,珋y为观测值的
平均值,ni为树木内观察值数量,m为样地数,n为
样本数。
1.2.3 模型检验 模型的独立性检验采用建模时
未使用的独立样本(检验样木)数据,对所确定模型
的预测性能进行综合评价。混合效应模型中固定效
应部分的检验与传统的检验方法相同。然而,随机
效应部分的检验需要二次抽样来计算随机参数值。
本研究使用式(6)来计算随机参数bk
[16]:
b^k≈D
^ZT^k(Z

kD
^ZT^k+R

k)
-1^ek (6)
式中:D^为随机效应参数的方差协方差矩阵,R^k为
树木内方差协方差结构,Z^k为设计矩阵,^ek为实际
值减去用固定效应参数计算的预测值。
2 结果与分析
2.1  树高拟合结果
通常确定参数效应和随机效应的方差协方差结
构需同时进行,首先把随机效应的方差协方差结构
设为广义正定矩阵(Generalpositive-definitema
trix),把样地作为随机效应的分类变量,利用 S-
Plus软件的NLME模块对模型(1)的不同随机参数
组合进行拟合。利用 AIC、BIC、LogLikelihood及似
然比检验等统计量指标对模型的拟合优度进行比
较。拟合结果见表2。可以看出,混合模型模拟收
敛的情况共有6种,6次模拟结果的 AIC和 BIC值
都比基于最小二乘法的模型值小。当只考虑1个随
机参数时,模拟1的 AIC和 BIC值最小。当只考虑
2个随机参数时,模拟5的 AIC和 BIC最小。为了
避免过多参数化问题的产生,还要对不同混合模型
进行显著性检验,即利用 LRT和 P值进行方差分
析,如P值小于005即认为差异显著。本文主要对
具有代表性的基本模型、模拟1、模拟5进行似然比
检验,检验结果表明基本模型和模拟1有显著不同
(P<00001),模拟 1和模拟 5有显著不同(P<
00001)。综合以上分析,模拟5拟合效果是最好
的,相对于最小二乘法和其它的模拟结果,模拟5也
有显著不同。然后又测试了其它3种方差协方差结
构:无结构(UN)、复合对称(CS)、对角矩阵。广义
正定矩阵结构始终显示了最高的拟合精度。因此,
把随机效应具有广义正定矩阵结构的混合模型选为
31
林 业 科 学 研 究 第25卷
树高生长最优混合模型。随机效应(b1,b3)的方
差协方差结构如下:
W =
σ2b1 σb1b3
σb1b3 σ


[ ]

(7)
式中:σ2b1为随机参数b1的方差,σ

b3为随机参数b3
的方差,σb1b3为随机参数b1和b3的协方差。
表2 基于不同随机效应参数混合树高模型拟合结果比较
项目 混合参数 参数个数 AIC BIC Loglikelihood LRT P
最小二乘法 None 4 2660.4870 2679.6970 -1326.244
模拟1 b1 5 2361.9530 2385.9640 -1175.9760 300.5347 <0.0001
模拟2 b2 5 2368.7680 2392.7800 -1179.3840
模拟3 b3 5 2404.9480 2428.9600 -1197.4740
模拟4 b1,b2 7 2283.6260 2317.2420 -1134.8130
模拟5 b1,b3 7 2257.1480 2290.7640 -1121.5740 108.8049 <0.0001
模拟6 b2,b3 7 2264.4940 2298.1110 -1125.2470
模拟7 b1,b2,b3 10 不收敛
2.2 直径拟合结果
与2.1的研究方法相同。把样地作为随机效应
的分类变量和考虑不同随机参数的组合,对模型
(1)的直径-年龄关系进行拟合,拟合结果见表3。
可以看出,混合模型模拟收敛的情况共有5种,5次
模拟结果的AIC和BIC值都比基于最小二乘法的模
型值小。当只考虑1个随机参数时,模拟2的 AIC
和BIC值最小。当只考虑2个随机参数时,模拟5
的AIC和BIC最小。基本模型、模拟2、模拟5似然
比检验结果表明:基本模型和模拟 2有显著不同
(P<00001),模拟 2和模拟 5有显著不同(P<
00001)。综合以上分析,模拟5拟合效果是最好
的,相对于最小二乘法和其它的模拟结果,模拟5也
有显著不同。然后又测试了其它3种方差协方差结
构:无结构(UN)、复合对称(CS)、对角矩阵。广义
正定矩阵结构始终显示了最高的拟合精度。因此,
把随机效应具有广义正定矩阵结构的混合模型选为
直径生长最优混合模型。
表3 基于不同随机效应参数混合直径模型拟合结果比较
项目 混合参数 参数个数 AIC BIC Loglikelihood LRT P
最小二乘法 None 4 3256.6590 3275.2660 -1624.3300
模拟1 b1 5 不收敛
模拟2 b2 5 3177.6190 3200.8770 -1583.8090 81.0407 <0.0001
模拟3 b3 5 3195.0430 3218.3010 -1592.5220
模拟4 b1,b2 7 3174.7230 3207.2840 -1580.3610
模拟5 b1,b3 7 3173.9750 3206.5360 -1579.9870 7.6441 0.0219
模拟6 b2,b3 7 3177.4990 3210.0600 -1581.749
模拟7 b1,b2,b3 10 不收敛
2.3 方差协方差结构
混合模型在参数效应确定后,还必须确定误差
的异质性和误差相关性。通常判断误差的异质性主
要通过残差分布图进行比较(图1,a为树高混合模
型,b为直径混合模型)。从图1可以看出,树高和
直径混合模型的残差分布显示了轻微的异方差性,
主要体现在幼龄林阶段,但没有显示极不规则的形
状,如喇叭状、抛物线状等。本研究也尝试了混合模
型中常用的方差函数(幂函数和指数函数)来消除
异方差现象,但没有取得理想的效果。因此异方差
的影响在本研究中不考虑,即Ri=σ
2ΓiIi。
为了表达树木内的误差相关性,本研究采用一
阶自回归模型AR(1)、一阶移动平均模型MA(1)及
一阶自回归与移动平均模型[ARMA(1,1)]来描述
样地内误差相关性。把这3个函数分别加入以上所
得树高和直径最优混合模型中。结果见表4。从表
4可以看出,当尝试把[ARMA(1,1)]模型加入到树
高混合模型中时,模型没有收敛。当把 AR(1)和
MA(1)模型加入到树高混合模型中时,都能显著提
高树高混合模型的拟合效果。3个评价指标及似然
41
第1期 姜立春等:基于非线性混合模型的东北兴安落叶松树高和直径生长模拟
比检验都说明 AR(1)更适合描述树高模型的误差
相关性。当尝试把AR(1)和[ARMA(1,1)]模型加
入到直径混合模型中时,模型没有收敛。当把 MA
(1)模型加入到直径混合模型中时,3个评价指标及
似然比检验都说明 MA(1)模型能显著提高直径混
合模型的拟合效果。
表4 基于不同时间序列函数混合模型拟合结果比较
项目 相关性结构 参数个数 AIC BIC Loglikelihood LRT P
树高 无 7 2257.1480 2290.7640 -1121.5740
AR(1) 8 736.9420 775.3620 -360.47120 1522.2050 <0.0001
MA(1) 8 1444.5260 1482.9450 -714.2628 814.6219 <0.0001
ARMA(1,1) 9 不收敛
直径 无 7 3173.9750 3206.5360 -1579.9870
AR(1) 8 不收敛
MA(1) 8 2592.1110 2629.3230 1288.0550 583.8641 <0.0001
ARMA(1,1) 9 不收敛
图1 树高和直径混合模型的残差分布
2.4 模型评价
表5给出了树高和直径最优混合模型的固定参
数估计值、随机参数的方差协方差组成、时间序列函
数AR(1)和MA(1)的参数估计值,并给出了树高和
直径最优混合模型与传统基本模型拟合统计量的比
较。结果表明:无论考虑树高和直径拟合时,混合模
型的确定系数大于基本模型的确定系数,而混合模
型的绝对误差和均方根误差均小于基本模型的绝对
误差和均方根误差,这些评价指标说明引入随机参
数和时间序列函数提高了模型的拟合精度。
2.5 模型检验
混合模型中随机效应部分的检验需要计算随机
参数值。用公式(6)计算随机参数值,具体计算采
用SAS软件的PROCIML模块计算。最后利用绝对
误差和均方根误差2个指标与传统的最小二乘法进
行预测精度比较。检验结果如表6。可以看出,树
高和直径混合模型的绝对误差和均方根误差均小于
基本模型的绝对误差和均方根误差,这些评价指标
说明引入随机参数和时间序列函数提高了模型的预
测精度。
表5 不同模型参数、方差估计值及拟合统计量
项目 参数
树高
基本模型 混合模型
直径
基本模型 混合模型
固定参数 b1 38.9761 20.7404 20.4429 20.1959
b2 0.0302 0.0750 0.0866 0.0913
b3 1.2810 1.7352 2.3045 2.4620
方差组成 σ2 1.1191 0.8676 3.9088 2.2737
σ2b1 14.3027 3.7290
σ2b3 0.0862 0.0988
σb1b3 0.9817 0.2945
ρ 0.9340
θ 0.7284
拟合统计量 Bias 0.8232 0.6628 1.5711 1.3455
RMSE 1.0562 0.8540 1.9732 1.7751
R2 0.9663 0.9780 0.8988 0.9181
  ρ为AR(1)系数;θ为MA(1)系数
表6 基本模型和混合模型检验
项目 模型 Bias RMSE
树高 基本模型 0.8452 1.0422
混合模型 0.6124 0.8125
直径 基本模型 1.6523 1.9034
混合模型 1.3325 1.6598
51
林 业 科 学 研 究 第25卷
3 小结
本研究采用SPlus的NLME模块建立了落叶松
树高和直径生长混合模型。分别将不同随机参数组
合的树高和直径模型进行拟合,利用 AIC、BIC、对数
似然值及似然比检验评价非线性混合模型的效果表
明,当对树高-年龄关系进行拟合时,b1、b3同时作
为混合参数时模型拟合最好;当对直径 -年龄关系
进行拟合时,b1、b3同时作为混合参数时模型拟合
最好。为了解决误差相关性问题,把时间序列函数
包括一阶自回归模型 AR(1)、一阶移动平均模型
MA(1)及一阶自回归与移动平均模型[ARMA(1,
1)]加入到树高和直径最优混合模型中。一阶自回
归模型 AR(1)显著提高了树高混合模型的精度。
一阶移动平均模型 MA(1)显著提高了直径混合模
型的精度。无论考虑树高还是直径的拟合,混合模
型的拟合精度都比基本模型的拟合精度高。混合模
型在应用上不但能反映总体树高和直径预测,还能
通过方差协方差结构校正随机参数来反映个体预
测,而传统的非线性回归分析只能反映总体平均变
化规律。
树木生长受林分密度、立地条件、经营措施等多
种因子的影响与制约,因此本文所构建的落叶松树
高和直径生长模型仅适用于与本研究立地条件相似
的地区。此外,由于样本量不足的问题,本研究没有
同时考虑样地和样木2个水平的随机效应,随着数
据的积累,这方面将进一步深入研究。
参考文献:
[1]邓红兵,郝占庆,王庆礼,等.红松单木高生长模型的研究[J].
生态学杂志,1999,18(3):19-22
[2]HuangSM,TitusSJ.Anindividualtreeheightincrementmodelfor
mixedwhitespruce-aspenstandsinAlberta,Canada[J].Forest
EcologyandManagement,1999,123:41-53
[3]WangGG,HuangSM.Heightgrowthpaternofwhitesprucein
naturalsubregionsinAlberta,Canada[J].ForestEcologyand
Management,1999,134:271-279
[4]黄家荣,万兆溟.马尾松人工林与距离有关的单木模型研究
[J].山地农业生物学报,2000,19(1):10-15
[5]刘兆刚,李凤日,于金成.落叶松人工林单木模型的研究[J].植
物研究,2003,23(2):237-244
[6]孟宪宇,张弘.闽北杉木人工林单木模型[J].北京林业大学学
报,1996,18(2):1-8
[7]吕 勇.杉木人工林生长率模型的研究[J].林业科学,2002,
38(1):146-149
[8]FangZ,BaileyRL.Nonlinearmixedefectsmodelingforslashpine
dominantheightgrowthfolowingintensivesilviculturaltreatments
[J].ForestScience,2001,47:287-300
[9]CalegarioN,DanielsRF,MaestriR,etal.Modelingdominant
heightgrowthbasedonnonlinearmixedefectsmodel:aclonalEu
calyptusplantationcasestudy[J].ForestEcologyandManagement,
2005,204:11-20
[10]NothdurftA,KublinE,LappiJ.Anonlinearhierarchicalmixed
modeltodescribetreeheightgrowth[J].EuropeanJournalForest
Research,2006,125:281-289
[11]李永慈,唐守正.用 Mixed和 Nlmixed过程建立混合生长模型
[J].林业科学研究,2004,17(3):279-283
[12]李春明,张会儒.利用非线性混合模型模拟杉木林优势木平均
高 [J].林业科学,2010,46(3):89-95
[13]PinheiroJC,BatesDM.MixedefectsModelsinSandSPLUS
[M].Springer,NewYork,2000
[14]CalamaR,MonteroG.Interegionalnonlinearheightdiameter
modelwithrandomcoeficientsforstonepineinSpain[J].Canadi
anJournalForestResearch,2004,34:150-163
[15]JordanL,DanielsRF,ClarkA,etal.Multilevelnonlinearmixed
efectsmodelsforthemodelingofearlywoodandlatewoodmicrofi
brilangle[J].ForestScience,2005,51(4):357-371
[16]VoneshEF,ChinchiliVM.LinearandNonlinearModelsforthe
AnalysisofRepeatedMeasurements[M].MarcelDekker,New
York,1997
61