免费文献传递   相关文献

基于岭回归的思茅松单木生物量复合模型构建



全 文 :第 43 卷 第 2 期 东 北 林 业 大 学 学 报 Vol. 43 No. 2
2015 年 2 月 JOURNAL OF NORTHEAST FORESTRY UNIVERSITY Feb. 2015
1)国家自然科学基金(31160157) ,云南省教育厅科学研究基金
项目(2012Y222)资助。
第一作者简介:吴明山,男,1978 年 6 月生,西南林业大学理学
院,实验教师。E - mail:wms616@ 163. com。
通信作者:胥辉,西南林业大学林学院,教授。E - mail:zyxy213
@ 126. com。
收稿日期:2014 年 1 月 10 日。
责任编辑:潘 华。
基于岭回归的思茅松单木生物量复合模型构建1)
吴明山 叶江霞 胥辉
(西南林业大学,昆明,650224)
摘 要 为进一步提高思茅松单木生物量模型的估计精度,采用与材积兼容的生物量模型构造各分量模型,
再筛选出最优模型形式构造了线性和非线性复合模型,通过模型 4 个评价指标对拟合的简单非线性模型,线性和
非线性复合模型进行评价。结果表明:思茅松总生物量线性复合模型系统偏差较小,与数据拟合程度更好,预测精
度更高,具有可解释性,并且以该方法构造的生物量模型能进一步提高估计精度。
关键词 思茅松;生物量模型;岭回归
分类号 S758
Establishment of Single-Tree Biomass Complex Model for Pinus kesiya var. langbianensis Based on Ridge Regres-
sion / /Wu Mingshan,Ye Jiangxia,Xu Hui(Southwest Forestry University,Kunming 650224,P. R. China)/ / Journal of
Northeast Forestry University,2015,43(2):6 - 9.
For further improving estimate accuracy of single-tree biomass model of Pinus kesiya var. langbianensis,we used
structuring component model to build the compatibility biomass model to volume of timber,linear and nolinear complex
model with optimal component model,and evaluated simple nonlinear model,linear and nonlinear model with four evalua-
tion index. Total biomass linear composite model system of P. kesiya var. langbianensis was with small error,better fit-
ting,higher prediction accuracy,and it can be interpreted to linear complex model.
Keywords Pinus kesiya var. langbianensis;Biomass model;Ridge regression
思茅松(Pinus kesiya var. langbianensis)生长
快、材质好,是云南重要的森林树种及用材树种之
一,也是主要的采脂树种[1]。主要分布于云南省西
南部[2],普洱市(原思茅地区)分布较广,也较为典
型。单木生物量模型研究作为森林生物量监测的基
础,其成果较为丰富,如相对生长模型、CAR 模型和
VAR模型、相容性生物量模型、经验模型等[3 - 6],研
究方向皆为提高模型精度,为更精准监测林分或更
大尺度森林生物量奠定基础。尤其相容性生物量模
型研究成果,不仅可以满足各分量模型(总量、树
干、去皮树干、树皮、树冠、树枝和树叶)估计精度的
要求,同时解决了各分量模型估计值之和不等于总
量模型估计值的问题。对于特定树种生物量研究也
有部分成果,如落叶松(Larix olgensis)、马尾松(Pi-
nus massoniana)、樟子松(Mongolian pine)、云南松
(Pinus yunnanensis Faranch)等[7 - 11],但思茅松生物
量模型研究目前报道较少。文章立足于前人研究基
础,基于相容性生物量模型构建思想,开展思茅松地
上生物量复合模型研究,进而提高模型估计精度,为
大区域思茅松生物量监测提供参考。
1 材料与方法
1. 1 数据采集
项目试验地为普洱市景谷及墨江两地,在试验
地选择不同树龄、不同立地和不同密度的思茅松天
然林中有代表性的林分(所选林分均未经过间伐,
生长正常,且每块标准地的数量不少于 60 株),设
置不同大小的标准地 20 块,进行每木检尺,其中最
大胸径达 31 cm,最小胸径为 5 cm,以径阶 6 cm为始
测,按 2 cm区分径阶选取样木,每个径阶选定 9 ~ 10
株,总共 120 株样木。将样木伐倒后以 4 m 区分段
进行分割,分别称树干、枝叶质量;并立即分层取样,
枝叶样品按平均基径每层抽取标准枝 1 ~ 2 枝,干材
样品进行剥皮,枝叶样品进行摘叶,分别称干(去
皮)、皮、枝、叶质量。将所有样品带回实验室置于
烘箱内 80 ℃烘至恒质量,计算含水率,依据鲜质量
计算各部分干质量,将各部分干质量累积得到标准
木单株总生物量。
思茅松生物量数据共 120 株,以径阶排序,按径
阶分布抽取 30 株作为检验数据,其余 90 株作为模
型拟合数据(见表 1)。
1. 2 研究方法
根据以往生物量模型研究成果[12 - 13],考虑到生
物量模型与材积估计的兼容性,思茅松地上部分总
量及各分量结构模型设计为:
W = f(D,H,CW,L)V, (1)
DOI:10.13759/j.cnki.dlxb.20141224.023
W = f(D,H)V。 (2)
思茅松生物量总量为地上部分总量,各分量指
去皮树干生物量、树皮生物量、树枝生物量、树叶生
物量,模型(1),(2)中 W为总量或各分量生物量、D
为胸径、H为树高、CW 为冠幅、L为冠长、V为材积。
表 1 数据统计量特征
数据类型
地上部分总量
极小值 /kg 极大值 /kg 均值 /kg 方差
去皮树干(木材)生物量
极小值 /kg 极大值 /kg 均值 /kg 方差
树枝生物量
极小值 /kg 极大值 /kg 均值 /kg 方差
建模数据 2. 705 325. 768 98. 056 7 666. 565 1. 183 240. 546 62. 447 3 746. 292 0. 243 107. 044 22. 828 539. 293
检验数据 4. 657 365. 671 106. 713 10 640. 211 2. 190 284. 735 67. 905 5 733. 420 0. 216 124. 535 25. 641 985. 227
数据类型
树叶生物量
极小值 /kg 极大值 /kg 均值 /kg 方差
胸 径
极小值 /cm 极大值 /cm 均值 /cm 方差
树 高
极小值 /m 极大值 /m 均值 /m 方差
建模数据 0. 056 20. 804 3. 912 15. 325 5. 000 31. 100 16. 721 48. 031 4. 150 26. 800 13. 853 29. 102
检验数据 0. 113 12. 145 3. 871 11. 972 5. 100 30. 400 17. 100 54. 652 4. 600 27. 300 14. 573 30. 299
数据类型
冠 幅
极小值 /m 极大值 /m 均值 /m 方差
冠 长
极小值 /m 极大值 /m 均值 /m 方差
材 积
极小值 /m3 极大值 /m3 均值 /m3 方差
建模数据 0. 850 10. 920 4. 282 5. 176 0. 400 14. 100 6. 004 7. 562 0. 009 0. 858 0. 222 0. 048
检验数据 1. 000 9. 700 4. 270 6. 415 0. 500 12. 900 6. 080 9. 160 0. 009 1. 009 0. 245 0. 066
注:建模数据中样株数量为 90 株;检验数据中样株数量为 30 株。
对于地上部分总量、树枝和树叶生物量模型而
言,自变量除考虑胸径、树高外,还应考虑冠幅、冠长
和冠体积(C2WL)。为此采用结构模型(1)式,由(1)
式出发考虑变量组合形式,可构造出 4 个模型形式:
W = aDbHc(CW)
dLeV, (3)
W = aDbHc(C2WL)
dV, (4)
W = a(D2H)b(CW)
cLdV, (5)
W = a(D2H)b(C2WL)
cV。 (6)
对于地上部分总量、去皮树干、树皮生物量,自
变量可只考虑胸径、树高,根据结构模型(2)式考虑
变量组合形式,同样可构造出 4 个模型形式:
W = aDbHcV, (7)
W = a(D2H)bV, (8)
W = aDbV, (9)
W = aH)bV。 (10)
根据模型(3)—(10)式,分别对各分量及总量
进行模型拟合,筛选出最优模型形式。根据总量与
各分量之间的关系,再以各分量最优模型进行线性
和非线性组合,构造思茅松总生物量复合模型如下。
线性复合模型:
W总 =β0 +β1f(x)材 +β2f(x)皮 +β3f(x)枝 +β4f(x)叶 +ε。 (11)
非线性复合模型:
W总 = β1 f(x)
β2
材 f(x)
β3
皮 f(x)
β4
枝 f(x)
β5
叶 + ε。 (12)
非线性复合模型线性转换模型:
lnW总 = lnβ1 + β2 lnf(x)材 + β3 lnf(x)皮 + β4 lnf(x)枝 +
β5 lnf(x)叶 + ε。 (13)
复合模型(11)、(12)、(13)中,W总 为地上部分
总生物量,f(x)为各分量最优模型。在线性拟合时,
因各分量具有强相关性,不可避免模型存在多重共
线性,其拟合方法采用岭回归估计法。
再次对模型(11)、(13)式进行拟合,结合(3)—
(10)式筛选出的简单非线性最优总量模型对 4 种
模型进行评价,评价方法采用总相对误差(RS)、平
均相对误差(EE)、平均相对误差绝对值(RMA) ,预估
精度(P)4 个评价指标。
总相对误差:
RS =
∑(yi - y^i)
∑y^i
× 100%。 (14)
平均相对误差:
EE =
1
N∑(
yi - y^i
y^i
)× 100%。 (15)
平均相对误差绝对值:
RMA =
1
N∑ |
yi - y^i
y^i
| × 100%。 (16)
预估精度:
P =(1 -
tα ∑(yi - y^i)槡 2
y^ N(N - m槡 )
)× 100%。 (17)
式中:yi 为实测值,^yi 为估计值,N为样本容量,tα 置
信水平为 α = 0. 05 时 t 的分布值,m 为回归曲线方
程中参数个数,y^为估计值的平均值。
2 结果与分析
2. 1 模型估计
利用 90 株生物量数据,采用 SPSS统计软件,根
据模型(3)—(10)式分别对总量及各分量进行拟
合,最终筛选出思茅松总量及各分量生物量最优模
型见表 2。
7第 2 期 吴明山,等:基于岭回归的思茅松单木生物量复合模型构建
书表 2 总量及各分量生物量最优模型参数
维量 最优模型
参 数
a b c d e
评价指标
R2 回归均方差 剩余均方差
总量 W = aDbHcV 1 141. 471 0. 085 - 0. 423 0. 968 726 872. 187 271. 829
木材 W = aDbHcV 381. 086 - 0. 304 0. 219 0. 950 323 403. 260 215. 222
树皮 W = aDbHcV 76. 528 - 0. 845 0. 670 0. 854 6 379. 320 13. 795
树枝 W = aDbHc(CW)dLeV 400. 786 0. 444 - 1. 571 0. 484 0. 444 0. 848 26 502. 381 101. 756
树叶 W = aDbHc(CW)dLeV 209. 343 1. 210 - 1. 999 - 0. 569 0. 148 0. 633 586. 175 5. 504
以表 2 中各分量最优模型进行线性和非线性组
合得到模型(11)、(12)、(13)式,使用 SPSS 统计软
件,利用 90 株生物量数据对(11)、(13)式进行拟
合,经最小二乘法估计后,模型具有很强的共线性,
故采用岭回归估计,经反复试验,岭回归估计中线性
复合模型 K值取 0. 10 为最佳,非线性复合模型线性
转换模型 K值取 0. 15 为最佳(见表 3)。
表 3 总生物量复合模型参数
模 型
参 数
β0 β1 β2 β3 β4 β5
评价指标
R2 回归均方差 剩余均方差
线性复合模型 - 1. 458 0. 487 3. 278 0. 583 7. 074 0. 964 240 561. 530 310. 281
非线性复合模型线性转换模型 5. 842 0. 309 0. 335 0. 140 0. 271 0. 960 40. 747 0. 058
结合表 2 表 3 可以看出,决定系数 R2 总量简单
非线性模型为 0. 968,线性复合模型为 0. 964,非线
性复合模型线性转换模型为 0. 960,模型对数据的
拟合度都很好,简单非线性模型最优。通过回归及
剩余均方差可计算 F值,构造 F检验,3 种模型皆可
通过检验,模型具有统计学意义。线性复合模型及
非线性复合模型线性转换模型使用岭回归估计后消
除了模型中的共线性影响,各分量回归系数均为正,
模型具有可解释性。
2. 2 复合模型评价
利用抽取的 30 株思茅松生物量检验数据进行
模型评价,评价模型包括简单非线性模型(7)式,线
性与非线性复合模型(11)、(12)式,非线性复合模
型线性转换模型(13)式,评价指标包括总相对误差
(RS)、平均相对误差(EE)、平均相对误差绝对值
(RMA) ,预估精度(P)。评价结果如表 4。
表 4 模型评价指标对比
模 型 RS /% EE /% RMA /% P /%
W总 = aD
bHcV - 0. 539 - 4. 054 16. 544 97. 048
W总 = β0 + β1 f(x)材 + β2 f(x)皮 + β3 f(x)枝 + β4 f(x)叶 + ε 0. 001 - 2. 746 16. 192 97. 943
W总 = β1 f(x)β2材 f(x)β3皮 f(x)β4枝 f(x)β5叶 + ε 4. 490 1. 765 14. 778 94. 695
lnW总 = lnβ1 + β2 lnf(x)材 + β3 lnf(x)皮 + β4 lnf(x)枝 + β5 lnf(x)叶 + ε 4. 497 1. 772 14. 779 94. 693
从表 4 可见,总相对误差和平均相对误差是用
以检验所建模型是否存在系统偏差,其数值越接近
于零越好,总相对误差项以线性复合模型为最优,平
均相对误差项以非线性复合模型为最优,模型系统
偏差最小。平均相对误差绝对值是检验模型与检验
数据拟合程度的一个重要指标,非线性复合模型和
非线性复合模型线性转换模型比较接近,以非线性
复合模型为最优,模型与数据拟合最好。预估精度
是检验模型的预测效果的指标,其中考虑了样本单
元数与自由度的影响[14],以线性复合模型为最优,
预测精度达到 97. 943%。以相容性生物量模型构
建思想建立的复合模型主要用于思茅松地上部分生
物量估测,故 4 个评价指标中预测精度至关重要,通
过比较,思茅松总生物量线性复合模型为最优。其
最终模型形式为:
W总 = - 1. 458 + 185. 589D
- 0. 304H0. 219V + 250. 859D - 0. 845
H0. 670V + 233. 658D0. 444H - 1. 571C0. 484W L
0. 444V +
148. 892D1. 210H - 1. 999C - 0. 569W L
0. 148V。 (18)
依据表 3 分析结果,思茅松总生物量线性复合
模型(18)式通过回归及剩余均方差可计算 F 值,构
造 F检验,模型通过检验,决定系数为 0. 964,模型
对数据拟合很好。模型各分量参数为正,符合去皮
树干(木材)、树皮、树枝、树叶生物量加总为地上生
物量生物学原理。
2. 3 分量模型评价
以 2. 1 模型估计中筛选出的去皮树干(木材)、
树皮、树枝、树叶各分量最优模型与最优思茅松总生
物量线性复合模型(18)式中的各分量模型进行对比
评价。同样选择总相对误差(RS)、平均相对误差
(EE)、平均相对误差绝对值(RMA) ,预估精度(P)4 个
评价指标,评价结果如表5。从表 5中可见,各分量最
优模型在 4个评价指标上皆远优于线性复合模型各
8 东 北 林 业 大 学 学 报 第 43 卷
分量模型。仅从预估精度判别,考虑了相容性问题
后,线性复合模型中各分量模型预估精度损失严重,
去皮树干(木材)生物量预估精度降低了 46. 559%,
树皮生物量预估精度降低了 22. 039%,树枝生物量
预估精度降低了 32. 929%,树叶生物量预估精度降
低了 21. 887%。故此,各分量生物量估测易使用各
分量最优模型,地上部分总生物量估测选用思茅松
总生物量线性复合模型。
表 5 各分量模型评价指标对比
维量
各分量最优模型
RS /% EE /% RMA /% P /%
线性复合模型各分量模型
RS /% EE /% RMA /% P /%
模型差异
RS /% EE /% RMA /% P /%
木材 - 1. 025 - 3. 889 17. 879 94. 044 103. 235 97. 353 97. 353 47. 485 - 104. 260 - 101. 242 - 79. 474 46. 559
树皮 - 3. 353 - 7. 129 31. 754 89. 343 - 70. 517 - 71. 669 71. 669 67. 304 67. 163 64. 539 - 39. 914 22. 039
树枝 1. 080 - 6. 511 24. 506 86. 357 73. 380 60. 359 64. 465 53. 428 - 72. 299 - 66. 870 - 39. 959 32. 929
树叶 - 2. 507 - 1. 011 30. 586 84. 966 - 86. 218 - 86. 007 86. 007 63. 080 83. 711 84. 996 - 55. 420 21. 887
3 结论与讨论
通过思茅松各分量生物量模型的最优筛选结
果,构建了总生物量线性和非线性复合模型,文章再
对所构建的复合模型进行评价可得出如下结论:相
对于简单非线性模型、非线性复合模型,思茅松总生
物量线性复合模型系统偏差较小,与数据拟合程度
较好,预测精度更高,并通过岭回归估计消除了模型
中的多重共线性影响。该模型可用于思茅松地上生
物量估测,同时,文章为提高生物量模型估计精度提
供了一种新的方法。思茅松地上生物量即为去皮树
干(木材)生物量、树皮生物量、树枝生物量、树叶生
物量的总和。无论从模型机理层面分析,还是从各
分量系数拟合皆为正的统计学角度出发,线性复合
模型的各分量线性相加更符合这一关系,线性复合
模型更具有可解释性。线性复合模型结构复杂,但
模型自变量依然为常用的胸径、树高、材积、冠幅、冠
长,对于建模外业调查工作量不会增加。与简单非
线性模型相比,线性复合模型虽然可提高模型估计
精度,但模型构造较为复杂,计算过程繁琐,适用于
对生物量估测较高的相关研究。如何简化改进模型
需进一步研究。去皮树干(木材)、树皮、树枝,树叶
生物量各分量最优模型从决定系数及预估精度看,
去皮树干(木材)生物量估测较为准确,树皮及树枝
生物量估测较好,树叶生物量不易估测。去皮树干
(木材)、树皮、树枝,树叶生物量各分量估测时,易
使用各分量最优模型。线性复合模型虽然考虑了
各分量相容性问题,但不适宜估测各分量,如何解
决线性复合模型同时兼顾估测各分量问题需进一
步探讨。
参 考 文 献
[1] 朱丽梅,胥辉. 思茅松单木生物量模型研究[J]. 林业科技,
2009,34(3) :19 - 23.
[2] 吴兆录.思茅松研究现状的探讨[J]. 林业科学,1994,30(2) :
151 - 157.
[3] 胥辉.一种生物量模型构建的新方法[J].西北农林科技大学
学报,2001,29(3) :35 - 40.
[4] 胥辉,刘伟平.相容性生物量模型研究[J].福建林学院学报,
2001,21(1) :18 - 23.
[5] 唐守正,张会儒,胥辉.相容性生物量模型的建立及其估计方
法研究[J].林业科学,2000,36(1) :19 - 27.
[6] 张世利,刘健,余坤勇.基于 SPSS相容性林分生物量非线性模
型研究[J].福建农林大学学报,2008,37(5) :496 - 500.
[7] 曾伟生,肖前辉,胡觉.中国南方马尾松立木生物量模型研建
[J].中南林业科技大学学报,2010,30(5) :51 - 56.
[8] 贾炜玮,于爱民.樟子松人工林单木生物量模型研究[J].林业
科技情报,2008,40(2) :1 - 2.
[9] 张志华,王连春,罗俊贤等.滇西北云南松单木生物量模型研
究[J].山东林业科技,2011(4) :4 - 6.
[10] 金钟跃,贾炜玮,刘微.落叶松人工林生物量模型研究[J].植
物研究,2010,30(6) :747 - 752.
[11] 王轶夫,孙玉军.马尾松生物量模型的对比研究[J]. 中南林
业科技大学学报,2012,32(10) :29 - 33.
[12] 胥辉.一种与材积相容的生物量模型[J]. 北京林业大学学
报,1999,21(5) :32 - 36.
[13] 曾伟生,骆期邦,贺东北.兼容性立木生物量非线性模型研究
[J].生态学杂志,1999,18(4) :19 - 24.
[14] 骆期邦,曾伟生,贺东北. 林业数表模型理论、方法与实践
[M].长沙:湖南科学技术出版社,2001.
9第 2 期 吴明山,等:基于岭回归的思茅松单木生物量复合模型构建