免费文献传递   相关文献

Comparison of Several Compatible Biomass Models and Estimation Approaches

几种相容性生物量模型及估计方法的比较


以南方150株马尾松地上生物量数据为例,在考虑林分起源和未考虑林分起源2种情形下,对非线性似然无关回归法、比例平差法和非线性联立方程组法3种方法进行综合比较研究。根据分配层次不同,比例平差法和非线性联立方程组法将进一步考虑总量直接控制和分级联合控制2种方案。从直径、树高、地径、年龄、枝下高和冠幅6个林分变量中选取不同的变量构建一元、二元和三元生物量模型,利用加权最小二乘回归法消除生物量模型中存在的异方差性。基于独立形式的一元、二元和三元模型,利用非线性似然无关回归法、比例平差法和非线性联立方程组法构建相应的相容性生物量模型。结果表明:在考虑和未考虑林分起源情形下,3种估计方法都能有效保证各分量生物量总和等于总生物量,预测精度较高。总体而言,非线性联立方程组法预测精度更高、稳定性更强,其次是非线性似然无关回归法,最差的是非线性比例平差法;根据建模数据和检验数据综合比较得知,在考虑和未考虑林分起源情形下,总量控制联立方程组法对应的二元相容性生物量模型预测精度最高。

So far, the approaches of nonlinear seemingly unrelated regression (NSUR), nonlinear adjustment in proportion (NAP) and nonlinear simultaneous equations (NSE) have been proposed to establish compatible biomass models. However, to our knowledge, systemic comparison of these methods is not studied. Therefore, the three methods NSUR, NAP and NSE were compared based on predictive accuracy using 150 masson pine (Pinus massoniana) biomass data in this study. Two alternative approaches, controlling jointly from level to level by ratio functions and controlling directly under total biomass by proportion functions were considered for the two approaches of NAP and NSE. Six candidate tree variables of diameter at breast height, tree height, ground diameter, age, under branch height and crown width were evaluated for their contribution to biomass models improvement. Single variable, bivariate and multivariate (three variables) biomass models were established based on the first three of the most significant tree characteristics. Heteroskedasticity in the biomass models was removed by weighted least square regression. Compatible biomass models were established and estimated based on single variable, bivariate and multivariate using NSUR, NAP and NSE. The results showed that the three analyzed methods could ensure efficiently that components of biomass added up to the total biomass with high prediction accuracy. However, overall, NSE had the highest prediction accuracy and most stable, following by NSUR, and NAP was the worst. For balancing the model prediction accuracy and survey cost, the NSE of controlling directly under total biomass with diameter at breast height and height as stand variables was proposed to construct compatible biomass model at considering or no considering stand origin situation based on the systemic comparison of modelling and validation data sets.


全 文 :第 50 卷 第 6 期
2 0 1 4 年 6 月
林 业 科 学
SCIENTIA SILVAE SINICAE
Vol. 50,No. 6
Jun.,2 0 1 4
doi:10.11707 / j.1001-7488.20140606
收稿日期: 2013 - 06 - 19; 修回日期: 2013 - 08 - 29。
基金项目: 国家自然科学基金项目(31300534,31170588) ; 国家 863 重点项目(2012AA12A306)。
* 雷渊才为通讯作者。
几种相容性生物量模型及估计方法的比较*
符利勇1 雷渊才1 曾伟生2
(1 中国林业科学研究院资源信息研究所 北京 100091; 2 国家林业局调查规划设计院 北京 100714)
摘 要: 以南方 150 株马尾松地上生物量数据为例,在考虑林分起源和未考虑林分起源 2 种情形下,对非线性似
然无关回归法、比例平差法和非线性联立方程组法 3 种方法进行综合比较研究。根据分配层次不同,比例平差法
和非线性联立方程组法将进一步考虑总量直接控制和分级联合控制 2 种方案。从直径、树高、地径、年龄、枝下高
和冠幅 6 个林分变量中选取不同的变量构建一元、二元和三元生物量模型,利用加权最小二乘回归法消除生物量
模型中存在的异方差性。基于独立形式的一元、二元和三元模型,利用非线性似然无关回归法、比例平差法和非线
性联立方程组法构建相应的相容性生物量模型。结果表明: 在考虑和未考虑林分起源情形下,3 种估计方法都能
有效保证各分量生物量总和等于总生物量,预测精度较高。总体而言,非线性联立方程组法预测精度更高、稳定性
更强,其次是非线性似然无关回归法,最差的是非线性比例平差法; 根据建模数据和检验数据综合比较得知,在考
虑和未考虑林分起源情形下,总量控制联立方程组法对应的二元相容性生物量模型预测精度最高。
关键词: 非线性似然无关回归法; 比例平差法; 非线性联立方程组法; 相容性; 生物量模型
中图分类号: S757 文献标识码: A 文章编号: 1001 - 7488(2014)06 - 0042 - 13
Comparison of Several Compatible Biomass Models and Estimation Approaches
Fu Liyong1 Lei Yuancai1 Zeng Weisheng2
(1 . Research Institute of Forest Resources Information Techniques,CAF Beijing 100091;
2 . Academy of Forest Inventory and Planning,State Forestry Administration Beijing 100714)
Abstract: So far, the approaches of nonlinear seemingly unrelated regression ( NSUR ),nonlinear adjustment in
proportion (NAP) and nonlinear simultaneous equations ( NSE ) have been proposed to establish compatible biomass
models. However,to our knowledge,systemic comparison of these methods is not studied. Therefore,the three methods
NSUR,NAP and NSE were compared based on predictive accuracy using 150 masson pine (Pinus massoniana) biomass
data in this study. Two alternative approaches,controlling jointly from level to level by ratio functions and controlling
directly under total biomass by proportion functions were considered for the two approaches of NAP and NSE. Six
candidate tree variables of diameter at breast height,tree height,ground diameter,age,under branch height and crown
width were evaluated for their contribution to biomass models improvement. Single variable,bivariate and multivariate
( three variables) biomass models were established based on the first three of the most significant tree characteristics.
Heteroskedasticity in the biomass models was removed by weighted least square regression. Compatible biomass models
were established and estimated based on single variable,bivariate and multivariate using NSUR,NAP and NSE. The
results showed that the three analyzed methods could ensure efficiently that components of biomass added up to the total
biomass with high prediction accuracy. However,overall,NSE had the highest prediction accuracy and most stable,
following by NSUR,and NAP was the worst. For balancing the model prediction accuracy and survey cost,the NSE of
controlling directly under total biomass with diameter at breast height and height as stand variables was proposed to
construct compatible biomass model at considering or no considering stand origin situation based on the systemic
comparison of modelling and validation data sets.
Key words: nonlinear seemingly unrelated regression; adjustment in proportion; nonlinear simultaneous equations;
compatible; biomass model
第 6 期 符利勇等: 几种相容性生物量模型及估计方法的比较
森林生态系统作为陆地生态系统的主体,在维
护全球气候系统、调节全球碳平衡、减缓大气温室气
体浓度上升等方面具有不可替代的作用,世界各国
越来越重视对其生物量的估计、监测和评价。生物
量建模是其中的一项核心内容,国内外关于它的研
究非常多 ( Parresol,2001; Zhang et al.,2004; Bi
et al.,2004; Fehrmann et al.,2008; Zeng et al.,
2011; 2012; Fu et al.,2012; 曾伟生等,2010a;
2010b; 符利勇等,2011a; 李海奎等,2012),主要
建模方法可归纳为传统回归方法 ( Jenkins et al.,
2003; Vallet et al.,2006; Basuki et al.,2009)、非线
性似然无关回归方法 ( Parresol,2001; Bi et al.,
2004)、线性或非线性联合估计方法 (骆期邦等,
1999; 唐守正等,2000 )、哑变量方法 ( Zeng et al.,
2011; Fu et al.,2012)、混合模型方法( Zhang et al.,
2004; Fehrmann et al.,2008; Fu et al.,2012; 曾伟生
等,2010a; 符利勇等,2011a; 2011b)和度量误差
模型方法 (曾伟生等,2010b; 李海奎等; 2012;
Zeng et al.,2012)等。
尽管作为大尺度森林生物量监测,更多关注的
是总生物量及地上和地下生物量,但是在研究生态
系统生产力、能量和营养物质分布时,需把总生物量
分解成不同的组成部分(Waring et al.,1998),例如
把地上生物量分解成树干和树冠,树干进一步分解
成干材和干皮,树冠进一步分解成树枝和树叶等。
除此之外,在进行生态系统分析时,总物质必须满足
分解和合成相一致(分量加起来等于总量)。因此,
构建地上各分量单木生物量相容性模型一直为世界
生态学家和林学家所重视。到目前为止,已提出了
不同方法,最常见的有非线性似然无关回归方法
(Parresol,2001; Bi et al.,2004)、比例平差法(唐守
正等,2000)和线性或非线性联合估计方法(骆期邦
等,1999; 唐守正等,2000)等。非线性似然无关回
归法最先由 Parresol(2001)提出,是根据非线性似然
无关理论保证了干材、干皮和树冠生物量的可加性,
同时单木生物量各分量之间相互关系可通过误差项
方差协方差矩阵来描述。比例平差法是解决单木生
物量相容性问题最简单且最直接的方法,是基于各
分量占总量的比例之和等于 1 提出的(唐守正等,
2000),各分量模型中参数通过最小二乘法独立求
解得到,基于比例平差是在不考虑单木生物量相容
性的情况下给出的最优估计。唐守正等 (2000)提
出了线性或非线性联合估计方法,该方法将各分
量进行联合建模,联立求解。然而,对这些方法的
详细比较研究至今尚未报道,主要原因可能是这
些方法的数学处理比较复杂和大量单木生物量数
据获取比较困难;同时由于缺乏全面的比较研究,
人们建立相容性生物量模型时无法合理选择有效
方法。为此,本研究在考虑林分起源和不考虑林
分起源 2 种情形下,以南方 150 株马尾松 ( Pinus
massoniana)地上生物量数据为例,对传统独立模
型方法、比例平差法、非线性似然无关回归方法以
及非线性联立方程组法进行系统比较,分析各自
特点,这对森林生物量建模和监测有着重要意义。
1 数据
本文所用数据为我国南方马尾松的立木地上生
物量实测数据,共 150 株样木,采集时间为 2009 年
6—9 月,采集地点涉及江苏、浙江、安徽、福建、江
西、湖南、广东、广西、贵州 9 省区。其中随机抽取
120 株样本作为建模数据,另外 30 株样本作为检验
数据。建模数据中样本单元数的选取大体上按各省
资源多少分配,并兼顾天然和人工起源,其中,天然
62 株,人工 58 株; 样木数按 2,4,6,8,12,16,20,
26,32,38 cm 以上共 10 个径阶均匀分配(除 26,32
cm 径阶分别为 14,16 株外,其他径阶均为 15 株),
每个径阶的样木数按树高级从低到高也尽量均匀分
配,在大尺度范围内具有广泛的代表性。全部样木
都实测胸径、地径和冠幅,将样木伐倒后,测量树干
长度(树高) 和活树冠长度(冠长),分干材、干皮、
树枝、树叶称鲜质量,并分别抽取样品带回实验室,
在 85 ℃恒温下烘干至恒重,根据样品鲜质量和干质
量分别推算出样木各部分干质量并汇总得到地上部
分干质量。建模数据(120 株)和检验数据(30 株)
统计信息见表 1。具体的数据调查和测定方法见文
献符利勇等(2011c)。
2 方法
选用常用异速方程形式 Y = β0X
β1
1 ···X
β p
p + ε构
建地上单木总生物量和各分量生物量模型(基础模
型)。考虑自变量个数把模型分为一元、二元和多
元模型,并分别建立模型。然后,基于建立的基础模
型,分别使用传统独立模型法、比例平差法、非线性
似然无关回归方法和非线性联立方程组法建立地上
单木总生物量和各分量生物量系统方程并进行估
计,根据估计结果对各方法进行比较。
2. 1 单木生物量模型
2. 1. 1 自变量确定 设 fi( x) ( i = 1,…,7 )分别
表示地上总生物量以及树干、干材、树皮、树冠、树枝
和树叶各分量生物量方程。根据方程 fi( x)( i =
34
林 业 科 学 50 卷
1,…,7) 所包含的单木变量(自变量)个数把生物量
模型分为一元、二元和多元生物模型。
1) 一元回归模型 本文选用常见的 CAR
( constant allometric ratio ) 形 式 fi( x) = αx
b
(Kittredge,1994)构建各分量一元生物量模型。候
选自变量分别为胸径( D )、地径( D0 )、树高( H )、
年龄( A )、冠幅(CW)和枝下高(CH)。
表 1 建模和检验数据概况①
Tab. 1 Summary statistics for modelling and validation data sets
分量
Component
建模数据 Modelling data 检验数据 Validation data
最小值
Min.
最大值
Max.
平均值
Mean
标准差
SD
最小值
Min.
最大值
Max.
平均值
Mean
标准差
SD
D 1. 60 47. 20 16. 54 12. 21 1. 50 40. 70 16. 68 11. 93
H 2. 00 27. 60 12. 01 7. 28 2. 10 24. 10 11. 76 6. 97
CW 0. 60 12. 00 4. 51 2. 62 0. 93 9. 85 4. 31 2. 32
D0 2. 60 52. 30 21. 07 13. 89 2. 60 52. 90 21. 65 13. 98
CH 0. 05 18. 70 5. 67 4. 60 0. 30 14. 90 5. 93 4. 91
Stem 0. 22 734. 12 131. 32 183. 57 0. 24 591. 93 128. 03 181. 58
Wood 0. 17 675. 01 120. 62 170. 11 0. 18 534. 55 116. 51 166. 87
Bark 0. 04 61. 89 10. 70 14. 27 0. 05 57. 39 11. 52 15. 30
Crown 0. 06 305. 02 39. 50 57. 97 0. 14 168. 40 34. 19 47. 42
Branch 0. 04 273. 45 31. 44 48. 99 0. 06 148. 14 27. 87 42. 22
Leaf 0. 02 70. 20 8. 06 10. 97 0. 08 20. 34 6. 32 6. 43
AG 0. 32 1039. 14 170. 82 237. 14 0. 38 731. 75 162. 23 223. 34
① D:胸径; H:树高; CW:冠幅; D0 :地径; CH:枝下高; Stem:树干; Wood:干材; Bark:干皮; Crown:树冠; Branch:树枝; Leaf:树叶; AG:
地上总生物量。D: Diameter at breast height; H: Height; CW: Crown width; D0 : Ground diameter; CH: Under branch height; Stem: Tree stem;
Wood: Tree stem wood; Bark: Tree stem bark,Crown: Tree crown; Branch: Tree branch; Leaf: Tree foliage; AG: Total tree above-ground biomass.
2 ) 二元回归模型 按照 CAR 函数形式
fi( x) = αx
b
1 x
c
2,对自变量 D,D0,H,A,CW 和 CH 共
15 种两两组合进行比较,最终确定 2 个与生物量相
关性最强的林分变量构建生物量模型。
3) 多 元回 归 模 型 按 照 CAR 函 数 形 式
fi( x) = αx
b
1 x
c
2 x
d
3,通过对自变量 D,D0,H,A,CW 和
CH 共 20 种组合进行比较,确定最终各分量的三元
生物量模型。
所选评价指标有平均残差 ( e- )、残差方差
( ξ )、均方误差 ( δ ) 和决定系数 ( R2 ),计算公式
如下:
e- = ∑( yi - y^ i) /N, (1)
ξ = ∑ ( yi - y^ i) 2 /(N - 1), (2)
δ = e- 2 +槡 ξ。 (3)
式中: yi 和 y
^
i 分别为生物量的真实值和预测值; N
为总观测数。
2. 1. 2 考虑起源对生物量的影响 为分析不同林
分起源(天然林和人工林)中马尾松各分量生物量
差异,引入哑变量 S,当 S = 0时为人工林,S = 1时
为天然林。各分量生物量模型为:
Wi = fi( x,S) + ε i,( i = 1,…,7)。 (4)
式中: ε i 为误差项。
2. 1. 3 异方差 生物量模型中普遍存在异方差,
因此不满足普通最小二乘法要求等方差的假设
条件。为消除异方差,常用方法有对数回归法和
加 权 回 归 法 ( Tang et al., 2000; Zeng et al.,
2010)。本文采用加权最小二乘法求解,权函数
[模型(5)]通过各分量独立拟合方程的方差确
定,所选用的候选模型形式有指数函数、对数函
数、幂函数、Logistic 函数以及原基础模型本身,利
用评价指标 AIC( akaike information criterion)确定
最终权函数:
φ i = 1 / g ( x)
2。 (5)
2. 2 传统独立模型法
利用各分量独立的生物量模型求解,该方法不
能保证各分量生物量(干材、干皮、树枝和树叶或者
树干和树冠)之和等于总生物量:
Wi = fi( x) + ε i,( i = 1,…,7)。 (6)
式中: fi( x) 为各分量独立回归模型; W1 ~ W7 分别
表示地上总生物量以及树干、干材、树皮、树冠、树枝
和树叶各分量生物量。
2. 3 非线性比例平差法
从相容性的定义出发,要满足各分量之和等于
总量,实际上就是满足各分量占总量的比例之和等
于 1,唐守正等(2000)以此为基础提出了比例平差
法。根据各分量分配层次的不同,可得到总量直接
控制方案 ( Procedure Ⅰ) 和 分 级 联合 控制 方案
(Procedure Ⅱ)。
44
第 6 期 符利勇等: 几种相容性生物量模型及估计方法的比较
2. 3. 1 总量直接控制平差法 由总量直接平差分
配给干材、树皮、枝和叶,从而保证各分量之和等于
总量。具体各分量的模型表达式如下:
W3 =
f3( x)
f3( x) + f4( x) + f6( x) + f7( x)
W1 + ε3;
(7)
W4 =
f4( x)
f3( x) + f4( x) + f6( x) + f7( x)
W1 + ε4;
(8)
W6 =
f6( x)
f3( x) + f4( x) + f6( x) + f7( x)
W1 + ε6;
(9)
W7 =
f7( x)
f3( x) + f4( x) + f6( x) + f7( x)
W1 + ε7;
(10)
W1 = f1( x) + ε1。 (11)
式中: W1,W3,W4,W6 和 W7 分别表示地上总生物量、
干材、干皮、树枝和树叶生物量的估计值 (下面类
同); f1( x),f3( x),f4( x),f6( x) 和 f7( x) 分别为地上
总生物量以及各分量干材、干皮、树枝和树叶生物量
的基础模型(下面类同)。参数由传统最小二乘法
计算得到。
2. 3. 2 分级联合控制平差法 分级联合控制平差
法,即首先把地上总生物量分配给树干和树冠,然后
再把树干生物量分配给干材和干皮,树冠生物量分
配给树枝和树叶。该方法不但实现了干材、干皮、树
枝和树叶之和等于总量,而且还实现了树干和树冠
之和等于总量(唐守正,2000)。具体各分量的模型
表达式如下:
W3 =
f3( x)
f3( x) + f4( x)
f2( x)
f2( x) + f5( x)
W1 + ε3;
(12)
W4 =
f4( x)
f3( x) + f4( x)
f2( x)
f2( x) + f5( x)
W1 + ε4;
(13)
W6 =
f6( x)
f6( x) + f7( x)
f5( x)
f2( x) + f5( x)
W1 + ε6;
(14)
W7 =
f7( x)
f6( x) + f7( x)
f5( x)
f2( x) + f5( x)
W1 + ε7;
(15)
W1 = f1( x) + ε1。 (16)
式中: f2( x) 和 f5( x) 分别为树干和树冠生物量的基
础模型 (下面类同),参数由传统最小二乘法计算
得到。
2. 4 非线性似然无关回归方法
非线性似然无关回归方法( nonlinear seemingly
unrelated regressions)由 Parresol(2001)提出,该方法
不仅保证了各分量生物量方程的可加性(即生物量
相容),同时还考虑了各分量之间的相关性,因此被
广泛应用。模型表达式如下:
W3 = f3( x) + ε3;
W4 = f4( x) + ε4;
W6 = f6( x) + ε6;
W7 = f7( x) + ε7;
W1 = f1( x) = f3( x) + f4( x) +
f6( x) + f7( x) + ε1。 (17





)
式中: f1( x),f3( x),f4( x),f6( x) 和 f7( x) 分别为地
上总生物量以及各分量干材、干皮、树枝和树叶生物
量的基础模型,模型参数是由非线性似然无关回归
方法估 计 得到,该 方法 的详 细 介 绍 见 Parresol
(2001)。
2. 5 非线性联立方程组法
非线性联立方程组是近代统计分析方法之一,
研究当模型的应变量是另外模型的自变量或模型之
间有共同参数等参数估计问题。与非线性似然无关
回归方法一样,该方法不仅保证各分量生物量相容,
同时还可分析各分量之间的相关性。同样,非线性
联立方程组也考虑总量直接控制和分级联合控制 2
种方案。非线性联立方程组的详细介绍见唐守正等
(2008)。
2. 5. 1 总量控制联立方程组 与总量控制比例平
差法相似,唯一不同的是,该方法对各分量进行联合
建模,模型中参数通过联立方程组法求解得到。模
型表达式如下:
W3 =
f3( x)
f3( x) + f4( x) + f6( x) + f7( x)
W^ 1 + ε3;
W4 =
f4( x)
f3( x) + f4( x) + f6( x) + f7( x)
W^ 1 + ε4;
W6 =
f6( x)
f3( x) + f4( x) + f6( x) + f7( x)
W^ 1 + ε6;
W7 =
f7( x)
f3( x) + f4( x) + f6( x) + f7( x)
W^ 1 + ε7




 。
(19)
式中: W
^
1 由基础模型计算得到,W
^
1 = f1( x) 。
2. 5. 2 分级联合控制联立方程组 该方法与分级
联合控制比例平差法相似,唯一不同的是,各分量进
行联合建模,模型中参数通过联立方程组法求解得
到。模型表达式如下:
54
林 业 科 学 50 卷
W3 =
f3( x)
f3( x) + f4( x)
f2( x)
f2( x) + f5( x)
W^ 1 + ε3;
W4 =
f4( x)
f3( x) + f4( x)
f2( x)
f2( x) + f5( x)
W^ 1 + ε4;
W6 =
f6( x)
f6( x) + f7( x)
f5( x)
f2( x) + f5( x)
W^ 1 + ε6;
W7 =
f7( x)
f6( x) + f7( x)
f5( x)
f2( x) + f5( x)
W^ 1 + ε7




 。
(20)
式中: W
^
1 由基础模型计算得到,W
^
1 = f1( x) 。
2. 6 模型评价
利用前面所介绍的方法构建一元、二元和多
元相容性生物量模型,根据是否包含哑变量 S 把
所有模型分为 2 种类型,即未考虑林分起源和考
虑林分起源的相容性生物量模型。本研究首先
通过建模数据利用均方误差 ( δ ) 和决定系数
( R 2 )2 个指标分别选出考虑和不考虑林分起源
时一元、二元和多元对应的最优相容性生物量模
型,然后根据检验数据利用平均残差 ( e- )、残差
方差 ( σ 2 )、均方误差 ( δ ) 和总相对误差 ( RS)
[式(21)]4 个指标对各自的一元、二元和多元最
优模型进行比较和评价,最终确定考虑起源和不
考虑起源时对应的一种相容性生物量模型。非
线性似然无关回归方法的计算在 SAS 9. 2 上实
现,其他所有计算在 ForStat2. 2 上实现。
RS = ∑( yi - y^ i) /∑y^ i × 100%。 (21)
3 结果与分析
3. 1 基础模型
由变量逐步筛选方法最终确定一元、二元和
三元各分量生物量模型中自变量分别为 D,D 和
H,D、H 和 CW 。不考虑林分起源对生物量影响
的各分量一元、二元和三元生物量模型的表达式
见模型 ( 22 ),( 24 ) 和( 26 )。考虑林分起源对生
物量影响的各分量一元、二元和三元生物量模型
的表达式见模型 ( 23 ),( 25 ) 和( 27 )。通过比较
可知,幂函数形式的权函数消除异方差效果最
好,各分量一元、二元和三元生物量模型的加权
函数见表 2。
Wij = fi(Dj) = aiD
bi
j ; (22)
Wij = fi(Dj,Sj) = (ai + ci S j)D
( b i + d iS j)
j ; (23)
Wij = fi(Dj,Hj) = aiD
bi
j H
ci
j ; (24)
Wij = fi(Dj,Hj,Sj) = (ai + ciSj)D
(bi +diSj)
j H
(ei +fiSj)
j ;
(25)
Wij = fi(Dj,Hj,CW j) = aiD
bi
j H
ci
j CW
d i
j ; (26)
Wij = fi(Dj,Hj,CW j,Sj) =
(ai + eiSj)D
(bi +fiSj)
j H
(ci +giSj)
j CW
(di +hiSj)
j + εij。(27)
式中: i = 1,…,7 分别代表地上总生物量和树干、干
材、干皮、树冠、树枝、树叶生物量; j = 1,…,N;
ai - hi 为第 i 分项所对应的参数; Dj,Hj,CW j,Sj 分
别为第 j 株样木胸高直径、树高、冠幅和林分起源类
型; ε ij 为误差项。
表 2 各分量一元、二元和三元生物量模型的权函数
Tab. 2 Weight functions of single variable,bivariate and multivariate biomass model for each component
分量
Component
一元权函数
Single variable
weight function
二元权函数
Bivariate
weight function
三元权函数
Multivariate
weight function
AG g(D) = D2 . 27 g(D,H) = D2 . 67H -0 . 82 g(D,H,CW) = D3 . 13H -1 . 15 CW0 . 38
Stem g(D) = D1 . 83 g(D,H) = D2 . 09H0 . 10 g(D,H,CW) = D2 . 07H -0 . 12 CW0 . 41
Wood g(D) = D1 . 78 g(D,H) = D2 . 0H0 . 06 g(D,H,CW) = D1 . 84H0 . 23 CW0 . 40
Bark g(D) = D1 . 73 g(D,H) = D1 . 70H0 . 05 g(D,H,CW) = D2 . 14H -0 . 02 CW -0 . 49
Crown g(D) = D1 . 60 g(D,H) = D2 . 79H -1 . 58 g(D,H,CW) = D2 . 19H -1 . 36 CW0 . 85
Branch g(D) = D1 . 75 g(D,H) = D2 . 7H -1 . 30 g(D,H,CW) = D2 . 06H -1 . 39 CW1 . 38
Leaf g(D) = D1 . 55 g(D,H) = D1 . 28H0 . 18 g(D,H,CW) = D1 . 35H0 . 51 CW0 . 61
3. 2 一元模型
附表 1 为一元的传统独立模型法、总量直接控
制比例平差法、分级联合控制比例平差法、非线性似
然无关回归法、总量直接控制联立方程组法以及分
级联合控制联立方程组法在考虑或不考虑林分起源
情形下对建模数据进行拟合时的评价指标。这些方
法中,传统独立模型不能保证各分量之和等于地上
总生物量,即不能保证相容性,而其他方法都能保证
生物量相容。从表中可看出,各种方法对各分量生
物量的拟合效果都较高,拟合精度非常接近。总体
64
第 6 期 符利勇等: 几种相容性生物量模型及估计方法的比较
而言,在考虑和不考虑林分起源时,非线性似然无关
回归法[分别见模型(28)和(29)]拟合效果都比其
他方法稍好,因此选用该方法对生物量模型做进一
步分析。模型(28)和(29)各参数估计值见附表 4。
W3j = a3D
b3
j + ε3j;
W4j = a4D
b4
j + ε4j;
W6j = a6D
b6
j + ε6j;
W7j = a7D
b7
j + ε7j;
W1j = a3D
b3
j + a4D
b4
j + a6D
b6
j + a7D
b7
j + ε1j。 (28





)
W3 j = (a3 + c3Sj)D
( b3 + d3S)
j + ε3 j;
W4 j = (a4 + c4Sj)D
( b4 + d4S)
j + ε4 j;
W6 j = (a6 + c6Sj)D
( b6 + d6S)
j + ε6 j;
W7 j = (a7 + c7Sj)D
( b7 + d7S)
j + ε7 j;
W1 j = (a3 + c3Sj)D
( b3 + d3S)
j





+
(a4 + c4Sj)D
( b4 + d4S)
j +
(a6 + c6Sj)D
( b6 + d6S)
j +
(a7 + c7Sj)D
( b7 + d7S)
j + ε1 j。 (29)
3. 3 二元模型
附表 2 为各方法对应的二元模型在考虑或不考
虑林分起源情形下对建模数据进行拟合时的评价指
标。从附表 2 中可知,与一元模型计算结果相类似,
各方法拟合精度非常接近且拟合效果都较高。总体
而言,在考虑或不考虑林分起源时,总量直接控制联
立方程组法[分别见模型(30)和(31)]拟合效果都
比其他方法稍好,因此选用该方法对生物量模型做
进一步分析。与一元模型相比较,各方法对应的二
元模型能进一步提高模型拟合精度。模型 (30)和
(31)中的参数估计值见附表 4。
干材 W3 j =
a3D
b3
j H
c3
j
W0
W^ 1 j + ε3 j;
干皮 W4 j =
a4D
b4
j H
c4
j
W0
W^ 1 j + ε4 j;
树枝 W6 j =
a6D
b6
j H
c6
j
W0
W^ 1 j + ε6 j;
树叶 W7 j =
a7D
b7
j H
c7
j
W0
W^ 1 j + ε7 j。 (30




 )
式中: W
^
1 j 为第 j 株样木地上总生物量,由传统的独
立模型计算得到,计算公式如下:
W^ 1 j = a1D
b1
j H
c1
j + ε1 j。
W0 为干材、干皮、树枝和树叶各分量生物量总和,由
以下公式计算得到:
W^ 0 = a3D
b3
j H
c3
j + a4D
b4
j H
c4
j + a6D
b6
j H
c6
j + a7D
b7
j H
c7
j 。
干材 W3 j =
(a3 + c3Sj)D
( b3 + d3S j)
j H
( e3 + f3S j)
j
W0
W^ 1 j + ε3 j;
干皮 W4 j =
(a4 + c4Sj)D
( b4 + d4S j)
j H
( e4 + f4S j)
j
W0
W^ 1 j + ε4 j;
树枝 W6 j =
(a6 + c6Sj)D
( b6 + d6S j)
j H
( e6 + f6S j)
j
W0
W^ 1 j + ε6 j;
树叶 W7 j =
(a7 + c7Sj)D
( b7 + d7S j)
j H
( e7 + f7S j)
j
W0
W^ 1 j + ε7 j




 。
(31)
其中,W
^
1 j 和 W0 由以下公式计算得到:
W^ 1 j = f1(Dj,Hj,Sj) =
(a1 + c1Sj)D
( b1 + d1S j)
j H
( e1 + f1S j)
j + ε1 j;
W0 = (a3 + c3Sj)D
( b3 + d3S j)
j H
( e3 + f3S j)
j +
(a4 + c4Sj)D
( b4 + d4S j)
j H
( e4 + f4S j)
j +
(a6 + c6Sj)D
( b6 + d6S j)
j H
( e6 + f6S j)
j +
(a7 + c7Sj)D
( b7 + d7S j)
j H
( e7 + f7S j)
j 。
3. 4 三元模型
附表 3 为各方法对应的三元模型在考虑或不
考虑林分起源情形下对建模数据进行拟合时的评
价指标。从附表 3 中可知,与一元和二元模型类
似,所有方法对各分量生物量的拟合效果都较高,
拟合精度非常接近。总体而言,当不考虑林分起
源时,总量直接控制联立方程组法[模型(32)]拟
合效果比其他方法稍好,当考虑林分起源时,非线
性似然无关回归法拟合效果最好[模型 ( 33 )]。
在二元模型的基础上,当模型考虑冠幅因子时能
进一步提高模型拟合精度。模型 (32 ) 和 ( 33 ) 中
的参数估计值见附表 4。
干材 W3 j =
a3D
b3
j H
c3
j CW
d3
j
W0
W^ 1 j + ε3 j;
干皮 W4 j =
a4D
b4
j H
c4
j CW
d4
j
W0
W^ 1 j + ε4 j;
树枝 W6 j =
a6D
b6
j H
c6
j CW
d6
j
W0
W^ 1 j + ε6 j;
树叶 W7 j =
a7D
b7
j H
c7
j CW
d7
j
W0
W^ 1 j + ε7 j




 。
(32)
其中,
W^ 1 j = a1D
b1
j H
c1
j CW
d1
j + ε1 j,
W0 = a3D
b3
j H
c3
j CW
d3
j + a4D
b4
j H
c4
j CW
d4
j +
a6D
b6
j H
c6
j CW
d6
j + a7D
b7
j H
c7
j CW
d7
j 。
干材 W3 j = (a3 + e3Sj)D
( b3 + f3S j)
j
H ( c3 + g3S j)j CW
( d3 + h3S j)
j + ε3 j;
74
林 业 科 学 50 卷
干皮 W4 j = (a4 + e4Sj)D
( b4 + f4S j)
j
H ( c4 + g4S j)j CW
( d4 + h4S j)
j + ε4 j;
树枝 W6 j = (a6 + e6Sj)D
( b6 + f6S j)
j
H ( c6 + g6S j)j CW
( d6 + h6S j)
j + ε6 j;
树叶 W7 j = (a7 + e7Sj)D
( b7 + f7S j)
j
H ( c7 + g7S j)j CW
( d7 + h7S j)
j + ε7 j;
总生物量 W1 j = (a3 + e3Sj)D
( b3 + f3S j)
j
H ( c3 + g3S j)j CW
( d3 + h3S j)
j +
(a4 + e4Sj)D
( b4 + f4S j)
j
H ( c4 + g4S j)j CW
( d4 + h4S j)
j +
(a6 + e6Sj)D
( b6 + f6S j)
j
H ( c6 + g6S j)j CW
( d6 + h6S j)
j +
(a7 + e7Sj)D
( b7 + f7S j)
j
H ( c7 + g7S j)j CW
( d7 + h7S j)
j + ε1 j。(33)
3. 5 最优模型选择
利用一元模型: 模型 (28) (不考虑林分起源)
和(29)(考虑林分起源),二元模型: 模型(30) (不
考虑林分起源)和(31) (考虑林分起源)和三元模
型: 模型(32)(不考虑林分起源)和(33)(考虑林分
起源)对建模数据进行预测,得到的评价指标见
表 3。
从表 3 中可得出,对于不考虑林分起源情形,模
型(28),(30)和(32)得到的树冠、树枝和树叶生物
量的估计值偏高,对于地上总生物量,模型(28)和
(30)得到的估计值高于真实值,而模型(32)得到的
估计值低于真实值。对于树干、干材和和干皮生物
量,除模型 (28)估计出的树干和干材生物量偏高
外,其他方法得到的各分量估计值都低于真实值。
根据总相对误差可知,无论是一元模型还是二元或
多元模型,对树冠和树叶预测精度较低,而对地上总
生物量、干材和干皮预测精度较高。总体而言,二元
生物量模型,即模型(30)对不考虑林分起源相容性
生物量预测时精度最高。
对于考虑林分起源情形,模型(29)和(33)预测
出的各分量生物量值高于真实值,模型(31)预测地
上总生物量、树冠、树枝和树叶生物量时偏高,预测
树干、干材和干皮生物量时偏低。与不考虑林分起
源情形类相似,在利用一元、二元和三元模型预测各
分量生物量时,树叶、树冠和树枝精度最高,而地上
总生物量、树干和干材精度较高。总体而言,二元生
物量模型,即模型(31)对考虑林分起源相容性生物
量预测时精度最高。
4 结论与讨论
解决相容性问题,一直是生物量估计领域的一
个难题。本文利用比例平差法、非线性似然无关回
归法和非线性联立方程组法构建相容性生物量模
型,按照分配层次不同,非线性联立方程组法和比例
平差法同时考虑总量直接控制和分级联合控制 2 种
不同方案。从附表 1 ~ 3 中可知,比例平差法拟合精
度和模型稳定性总体上比非线性联立方程组要差,
这可能是因为比例平差法涉及的各分量独立模型是
通过传统的最小二乘回归求得参数计算各分量生物
量。显然,各分量独立模型是在不考虑相容性的情
况下给出参数的最优估计,因此在考虑相容性后可
能就不再是最优估计。非线性似然无关回归法是通
过对各分量生物量相加解决相容性问题( Parresol,
2001),因此预测精度相对较高(附表 1 ~ 3)。但由
于该方法参数是基于非线性似然无关理论估计得
到,计 算 时 对 参 数 初 始 值 依 赖 较 大 ( Parresol,
2001),如果参数的初始值给定不合理时,则计算很
难达到收敛。而本文提出的非线性联立方程组是将
各分量进行联合建模,联立求解,既保证了各分量生
物量之间的相容性,又能得到更优化的参数估计。
总体而言,非线性联立方程组法在拟合精度和模型
稳定性方面比其他几种方法要好,尤其是总量控制
联立方程组法,通过检验数据进一步验证该方法预
测精度最高(表 3)。
本研究选用了 5 种林分因子,分别为胸径、地
径、树高、枝下高以及冠幅作为构建相容性生物量模
型的候选协变量。通过分析得知,胸径、树高和枝下
高对各分量生物量影响较大,其中胸径影响最大,其
次是树高和枝下高,这与 Parresol(2001)和曾伟生等
(2010b)研究结果一致。因此最终选择胸径、胸径
和树高以及胸径、树高和枝下高分别作为一元、二元
和三元模型中的协变量。通过对各方法中的一元、
二元和三元模型预测效果进行比较(附表 1 ~ 3),总
体而言,各分量对应的三元模型预测精度最高,其次
是二元,最低是一元。实际应用时还可选择其他的
林分变量进行分析,例如地径和冠长率。理论上讲,
模型中协变量越多,模型精度越高。但由于一元、二
元和三元模型之间预测精度尽管有差异,但是这种
差异非常小,因此模型中考虑 3 个林分变量已能满
足实际应用。
实际情况中,在相同直径或树高下,人工林树木
的生物量和天然林树木的生物量可能相差较大。为
此,本研究分别对不考虑林分起源和考虑林分起源
84
第 6 期 符利勇等: 几种相容性生物量模型及估计方法的比较 94
林 业 科 学 50 卷
的马尾松相容性生物量进行建模。其中,不考虑林
分起源的相容性生物量模型是反映总体的平均变量
情况;而考虑林分起源的相容性生物量模型,以模型
(31)为例,把林分起源作为哑变量,通过参数 c,d和
f的大小可以反映人工林和天然林之间差异的大小,
而参数 a,b 和 e 相当于固定效应,即不管是天然林
和人工林,它们的取值都不变。通过实例分析可知,
这种构建哑变量方法能有效解决不同起源的生物量
相容性通用模型。除利用哑变量方法能有效解决模
型通用性问题外,近代统计学模型中的非线性混合
效应模型也能解决此类问题,基于目前还没有相应
的算法和程序求解非线性混合效应模型联立方程
组,因此无法保证生物量相容性问题。总之,到目前
为止,通过构造哑变量方法构建不同起源相容性生
物量通用性模型能得到可靠结果。
本文主要是对马尾松地上部分生物量进行研
究,对于地下生物量以及总生物量同样可以利用本
研究中所提出的方法进行建模。除生物量外,其他
生态上所涉及总量分解成不同大小单元、或不同大
小单元聚集成总体的物质特性,这些方法都实用。
参 考 文 献
符利勇,李永慈,李春明,等 . 2011b. 基于两水平非线性混合模型
对杉木 林 优 势 高 生 长 量 研 究 . 林 业 科 学 研 究,24 ( 6 ) :
720 - 726.
符利勇,曾伟生,唐守正 . 2011a. 利用混合模型分析地域对国内马
尾松生物量的影响 . 生态学报,31(19) : 5797 - 5808.
李海奎,宁金魁 . 2012.基于树木起源、立地分级和龄组的单木生物
量模型 . 生态学报,32(3) : 740 - 757.
骆期邦,曾伟生,贺东北,等 . 1999.立木地上部分生物量模型的建
立及其应用研究 . 自然资源学报,14(3) : 271 - 277.
唐守正,郎奎建,李海奎 . 2008. 统计和生物数学模型计算( ForStat
教程) . 北京: 科学出版社 .
唐守正,张会儒,胥 辉 . 2000. 相容性生物量模型的建立及其估
计方法研究 . 林业科学,36( sp1) : 19 - 27.
曾伟生,唐守正 . 2010b. 利用度量误差模型方法建立相容性立木生
物量方程系统 .林业科学研究,23(6) : 797 - 802.
曾伟生,唐守正 . 2010a. 利用混合模型方法建立全国和区域相容性
立木生物量方程 . 中南林业调查规划,29(4) : 1 - 6.
Basuki T M,van Laake P E,Skidmore A K,et al. 2009. Allometric
equations for estimating the above-ground biomass in tropical lowland
Dipterocarp forests. For Ecol Manage,257(8) : 1684 - 1694.
Bi H,Turner J,Lambert M J. 2004. Additive biomass equations for
native eucalypt forest trees of temperate Australia. Trees,18 (4 ) :
467 - 479.
Fehrmann L,Lehtonen A,Kleinn C,et al. 2008. Comparison of linear
and mixed-effect regression models and a k-nearest neighbor
approach for estimation of single-tree biomass. Can J For Res,38:
1 - 9.
Fu L Y,Zeng W S,Tang S Z,et al. 2012. Using linear mixed model
and dummy variable model approaches to construct compatible
single-tree biomass equations at different scales— a case study for
masson pine in southern China. J For Sci,58(3) :101 - 115.
Jenkins J C,Chojnacky D C,Heath L S,et al. 2003. National-scale
biomass estimators for United States tree species. For Sci,49(1) :
12 - 35.
Kittredge J. 1944. Estimation of the amount of foliage of trees and stand.
J For,42(12) :905 - 912.
Parresol B R. 2001. Additivity of nonlinear biomass equations. Can J For
Res,31(5) : 865 - 878.
Tang S Z,Zhang H R,Xu H. 2000. Study on establish and estimate
method of compatible biomass model. Scientia Silvae Sinicae,36
( supple. 1) : 19 - 27.
Vallet P,Dhte J F,Moguédec G L,et al. 2006. Development of total
aboveground volume equations for seven important forest tree species
in France. For Ecol Manage,229(1 /3) : 98 - 110.
Waring R H,Running S W. 1998. Forest ecosystems: analysis at
multiple scales. 2nd ed. Academic Press,San Diego,Calif.
Zeng W S,Tang S Z. 2010. Using measurement error modeling method
to establish compatible single-tree biomass equations system. Forest
Research,23(6) : 797 - 802.
Zeng W S,Tang S Z. 2012. Modeling compatible single-tree biomass
equations of masson pine (Pinus massoniana) in southern China. J
For Res,23(4) : 593 - 598.
Zeng W S,Zhang H R,Tang S Z. 2011. Using the dummy variable
model approach to construct compatible single-tree biomass equations
at different scales—a case study for masson pine ( Pinus
massoniana) in southern China. Can J For Res, 41 ( 7 ) :
1547 - 1554.
Zhang Y J,Borders B E. 2004. Using a system mixed-effects modeling
method to estimate tree compartment biomass for intensively managed
loblolly pines—an allometric approach. For Ecol Manage,
194(1 /3) : 145 - 157.
(责任编辑 石红青)
05
第 6 期 符利勇等: 几种相容性生物量模型及估计方法的比较 15
林 业 科 学 50 卷25
第 6 期 符利勇等: 几种相容性生物量模型及估计方法的比较 35
林 业 科 学 50 卷45