全 文 :第 36卷 第 3期 西 南 林 业 大 学 学 报 Vol. 36 No. 3
2016年 6月 JOURNAL OF SOUTHWEST FORESTRY UNIVERSITY Jun. 2016
doi:10. 11929 / j. issn. 2095-1914. 2016. 03. 021
香格里拉高山松天然林林分蓄积混合效应模型构建
王永刚 舒清态 李圣娇 徐云栋 张 焱
(西南林业大学林学院,云南 昆明 650224)
摘要:以云南省香格里拉的高山松天然林为研究对象,构建林分蓄积的混合效应模型;引入林
分、海拔等环境因子的影响,构建含环境因子的林分蓄积混合效应模型,所有模型均采用拟合指
标和独立样本检验进行评价。结果表明:混合效应模型相对于一般回归模型在林分蓄积拟合中有
较高较好的拟合效果;引入环境因子的混合效应模型的拟合效果比一般混合效应模型要好;其
中,引入林分因子的混合效应模型拟合效果最好;从模型独立性检验来看,一般混合效应模型的
预估精度最高,绝对平均相对误差最小;引入环境因子后,混合效应模型的总相对误差以及平均
相对误差有所减小,其中又以引入林分因子的混合效应模型的误差最小,表现最佳;一般回归模
型无论在误差方面还是在精度方面都与混合效应模型有很大差距。
关键词:林分蓄积;混合效应模型;环境因子;高山松;香格里拉
中图分类号:S758.5 文献标志码:A 文章编号:2095-1914(2016)03-0121-05
Building Mixed Effects Model of Stand Volume of Nature
Pinus densata Forest in Shangri-La
Wang Yonggang,Shu Qingtai,Li Shengjiao,Xu Yundong,Zhang Yan
(College of Forestry,Southwest Forestry University,Kunming Yunnan 650224,China)
Abstract:In this paper,we took natural Pinus densata forest of Shangri-La City of Yunnan Province as the re-
search object to establish a mixed effects model stand volume. At the same time,we construct the mixed effects
models of stand volume which contain the environment factors,including stand factors and elevation etc. All models
were estimated by indexes of fitting and Independent Samples Test. The results showed that compared with general
regression model,the result of mixed effects model was better in stand volume fitting;The mixed effect model which
introduced environment factors was better than the model which did not. And the best model was that used the stand
factors. In view of the independence test of model,the prediction precision of general fixed effects model was the
highest,its absolute mean relative error was least. The sum relative error and mean relative error decreased by in-
troducing environment factors,and the one that stand factors introduced was the best. General regression model was
bad at error and precision aspect compared with mixed effects model.
Key words:stand volume,mixed effects model,environmental factors,Pinus densata,Shangri-La
在林业产业经营中,森林蓄积估测是一项不
容忽视的清查工作,代表了森林的产能,是指导
林业生产最为重要的指标之一[1]。森林蓄积估测
的模型研究也一直是研究林木长势及出材率的工
作重点。一些学者通过对过去应用模型的归纳总
结,提出了大量先进实用的模型,包括混合效应
收稿日期:2015-09-11
基金项目:国家自然科学基金项目 (31460194)资助;国家林业局林业公益性行业科研专项 (201404309)资助。
第 1作者:王永刚 (1989—),男,硕士生。研究方向:资源环境遥感。Email:hebwyg@ 163.com。
通信作者:舒清态 (1970—),男,博士,副教授。研究方向:森林经理与 3S遥感应用。Email:shuqt@ 163.com。
模型、联立方程组、似乎不相关模型等的近代模
型技术[2-5]。
混合效应模型包含固定效应参数和随机效应参
数 2方面,又有线性和非线性之分,不仅可以反映
样本的整体平均变化,还可以表征个体之间的差
异[6],是森林蓄积估测的模型研究中处于领先地位
的模型方法,在提高精度方面拥有巨大的优势。
高山松 (Pinus densata)为松科 (Pinaceae)松
属植物,广泛分布于云南、四川、西藏、青海等
高原山地,也是云南省重要的林木资源,具有较
高的经济价值。因此,通过对高山松天然林蓄积
的估测来获取高山松的生长数据是十分必要的,
以便为今后森林经营活动作出结合实际的决策,
科学地指导用材林木业生产。
1 研究区自然概况
香格里拉市位于云南省西北部,青藏高原东南
缘,地处东经 99°20~100°19,北纬 26°52~28°52;
境内有山地、高原、盆地、河谷多种地形地貌,
河流纵横,湖泊众多。气候有明显的干湿两季,
并且受地形和海拔因素影响较大,错综复杂,年
平均气温 5. 4 ℃,年均降雨量 268 ~ 945 mm,无霜
期 129~197 d,光照充足,气温年较差小,日较差
大。全市森林覆盖率达 74. 99%。境内植被垂直
分布十分完整,且很典型;南北植被分布有显著
差异。
2 研究方法
2. 1 数据来源
于 2014年 4 月和 10 月实测香格里拉海拔
2 700~3 700 m的 80块高山松天然林林分样地,样
地面积 30 m × 30 m,数据包括郁闭度、经纬度、海
拔等,并进行每木检尺,测定树高和株数等。计
算每个样地高山松林分的平均树高、平均胸径、
平均胸高断面积、林分密度等数据,见表 1。
表 1 林分基础数据
Table 1 Basic data of stands
变量
平均高
/m
平均
胸径
/ cm
平均胸
高断
面积 /m2
林木
株数
/株
林分
蓄积
/m3
海拔
/m
最小值 6. 2 10. 69 0. 886 8 80 5. 74 2 768
最大值 16. 8 24. 26 2. 607 3 323 27. 31 3 734
平均值 10. 25 15. 42 1. 486 6 131. 68 16. 68 -
标准误差 3. 14 2. 99 1. 030 0 11. 62 3. 96 -
2. 2 模型的选择与构建
2. 2. 1 一般回归模型的选择
本研究中林分蓄积的基本模型如下[7]:
ln(V + 1)= a + blnH + clnS + ε (1)
式中:H为林分平均树高;S 为林分胸高断面积;
V为林分蓄积;ε为误差;其余为待估参数。
2. 2. 2 混合效应模型构建
根据样地数据,对林分蓄积的基本模型进行
混合效应拟合[8],根据模型的效果和评价指标确
定混合效应模型的混合参数;此外引入方差和协
方差矩阵结构来优化混合效应模型,包括幂函数
(Power)和指数函数 (Exponential)2 种方差结构
形式以及 Gausian、Spherical 和指数函数 3 种协方
差结构形式[9]。
2. 2. 3 引入环境因子的混合效应模型构建
依据一般混合效应模型,环境因子固定效应
参数分别引入林分郁闭度 (CD)、林分密度 (P)
和海拔 (E)等[10]来构建引入环境因子的混合效应
模型。
2. 3 模型的拟合效果评价
本研究模型拟合指标选择以 logLik 值、Akaike
信息指数 (AIC)和贝叶斯信息指数 (BIC)3 个指
标来评价模型的拟合效果。
logLik = lnL(θ^L,x) (2)
AIC = - 2lnL(θ^L,x)+ 2q (3)
BIC = - 2lnL(θ^L,x)+ qlgn (4)
式中:θ^L 为模型的似然函数 lnL(θ^L,x)中 θ 的极
大似然估计;x为随机样本;q为未知参数个数;n
为观测个数。
独立样本检验选取总相对误差 (SRE)、平均
相对误差 (MRE)、绝对平均相对误差 (AMRE)与
预估精度 (P)4个指标。
SRE =
∑
N
i = 1
(yi - y^i)
∑
N
i = 1
y^i
× 100% (5)
MRE =
1
N∑
N
i = 1
(
yi - y^i
y^i
)× 100% (6)
AMRE =
1
N∑
N
i = 1
yi - y^i
y^i
× 100% (7)
P =(1 -
ta ∑
N
i = 1
(yi - y^i)槡
2
y^i N(N - T槡 )
)× 100% (8)
221 西 南 林 业 大 学 学 报 第 36卷
式中:yi 为测量值;y^i 为估算值;N 为样本大小;
ta 置信水平为 a = 0. 05 时 t 的分布值;T 为回归曲
线方程中参数个数;y^i 为估计值的平均值。
3 混合效应模型构建
3. 1 一般混合效应模型构建
在参数随机组合的所有情况下,对比每一种
混合参数组合模型拟合的结果,选取 a与 b作为混
合参数的一组 AIC、BIC 最小,logLik 最大,为最
佳拟合效果 (表 2)。
一般混合效应模型如下:
ln(V + 1)=(a + u1)+(b + u2)lnH + clnS + ε
式中:u1、u2分别为混合参数 a、b的随机效应参数。
从表 3 可以看出,引入方差协方差结构后,
Power和 Exponential形式的方差方程在提高原模型
精度方面作用很小;而 Gaussion、Spharical 和 Ex-
ponential的协方差方程在提高原模型的精度方面表
现明显,其中 Gaussion 形式的模型表现最为突出。
故而最终选择协方差结构的 Gaussion形式的混合效
应模型作为一般混合效应模型。
表 2 混合参数选择对比
Table 2 Comparison of mixing parameters
混合参数 logLik AIC BIC LRT P
无 -168. 5 343. 0 342. 7
a -146. 2 300. 4 300. 0 2. 523 4 <0. 000 1
b -150. 4 308. 8 308. 4 2. 001 5 <0. 000 1
c -143. 8 295. 6 295. 2 2. 000 8 <0. 000 1
a,b -124. 6 259. 2 258. 7 1. 115 4 <0. 000 1
a,c -135. 1 280. 2 279. 7 1. 638 5 <0. 000 1
b,c -136. 3 282. 6 282. 1 1. 513 4 <0. 000 1
a,b,c -140. 3 292. 6 292. 0 1. 498 6 <0. 000 1
表 3 林分蓄积混合效应模型对比
Table 3 Comparison of mixed-effect models of stand volume
方差结构 协方差结构 logLik AIC BIC LRT P
无 无 -124. 5 259. 0 258. 5
Power 无 -124. 5 259. 0 258. 5 1. 589 2 0. 002 3
Exponential 无 -124. 4 258. 9 258. 3 1. 803 5 0. 010 2
无 Gaussion -122. 2 254. 4 253. 9 2. 651 6 0. 001 9
无 Spharical -122. 4 254. 8 254. 3 2. 335 8 0. 002 9
无 Exponential -122. 5 255. 0 254. 3 2. 557 1 0. 012 1
3. 2 引入环境因子混合效应模型构建
在一般混合效应模型的基础上,将林分因子和
海拔作为固定效应加入模型并重新拟合,进而得到
引入环境因子固定效应的混合效应模型。结果见
表 4。
Vα =(α1 × CD + α2 × P + α3 × CD·P)·f(H,S)
Vβ =(β1 × E)·f(H,S)
式中:Vα、Vβ分别为考虑林分因子和海拔混合效应
的林分蓄积;f (H,S)为上式中的混合效应模型;
α、β为待估参数。
表 4 混合参数选择对比
Table 4 Comparison of mixing parameters
环境因子 混合参数 logLik AIC BIC LRT P
林分因子 无 -121. 6 245. 2 245. 1
α1 -118. 4 240. 8 240. 6 2. 642 3 <0. 000 1
α2 -114. 6 233. 2 233. 0 2. 164 4 <0. 000 1
α3 -119. 7 243. 4 243. 2 2. 032 8 <0. 000 1
α1、α2 -117. 5 241. 0 240. 7 1. 224 1 <0. 000 1
α1、α3 -120. 8 247. 6 247. 3 1. 786 1 <0. 000 1
α2、α3 -120. 5 247. 0 246. 7 1. 452 1 <0. 000 1
α1、α2、α3 -121. 3 250. 6 250. 2 1. 586 2 <0. 000 1
海拔 无 -121. 8 245. 6 245. 5
β1 -118. 4 240. 8 240. 6 2. 365 2 <0. 000 1
由表 4 可以看出,选择 α2作为引入林分因子
混合效应模型的混合参数、β1作为引入海拔混合效
应模型的混合参数时,AIC、BIC 最小,logLik 最
大,为最佳拟合效果。
对比表 5中的拟合参数,最终选择方差结构的
Power形式的混合效应模型作为引入林分因子混合
效应模型,选择协方差结构 Spharical 形式的混合
效应模型作为引入海拔混合效应模型。
321第 3期 王永刚等:香格里拉高山松天然林林分蓄积混合效应模型构建
表 5 林分蓄积混合效应模型对比
Table 5 Comparison of mixed-effect models of stand volume
环境因子 方差结构 协方差结构 logLik AIC BIC LRT P
林分因子 无 无 -114. 6 233. 2 233. 0
Power 无 -112. 4 228. 8 228. 6 1. 689 2 0. 000 1
Exponential 无 -113. 3 230. 6 230. 4 1. 886 3 0. 004 8
无 Gaussion -113. 8 231. 6 231. 4 2. 456 2 0. 000 9
无 Spharical -113. 6 231. 2 231. 0 2. 584 9 0. 000 6
无 Exponential -112. 8 229. 6 229. 4 2. 553 7 0. 001 1
海拔 无 无 -118. 4 240. 8 240. 6
Power 无 -118. 3 240. 6 240. 4 1. 854 3 0. 002 3
Exponential 无 -118. 3 240. 6 240. 4 1. 795 6 0. 000 3
无 Gaussion -117. 5 239. 0 238. 8 2. 562 8 0. 000 9
无 Spharical -116. 8 237. 6 237. 4 2. 496 1 0. 000 7
无 Exponential -116. 9 237. 8 237. 6 2. 515 7 0. 001 5
4 模型的评价与检验
4. 1 模型拟合评价
选择一般回归模型、一般混合效应模型和引
入环境因子的混合效应模型中拟合效果最好的模
型进行对比,结果见表 6。
表 6 林分蓄积各模型拟合指标
Table 6 Comparison of fitting indexes among the
models of stand volume
模型形式 logLik AIC BIC P
一般回归模型 -168. 5 343. 0 342. 7
一般混合效应模型 -122. 2 254. 4 253. 9 0. 001 9
林分因子混合效应模型 -112. 4 228. 8 228. 6 0. 000 1
海拔混合效应模型 -116. 8 237. 6 237. 4 0. 000 7
从表 6可以看出,混合效应模型的拟合效果相
较于一般回归模型均有大幅度提升;仅对比各混
合效应模型,引入环境因子的混合效应模型拟合
效果较普通混合效应模型又有所提升;而在各环
境因子的混合效应模型中,引入林分因子的混合
效应模型拟合效果最好。
4. 2 独立性检验分析
在一般回归模型、一般混合效应模型和引入
环境因子的混合效应模型中,选取拟合指标最优
的模型进行独立性检验,检验结果见表 7。
表 7 模型独立性检验
Table 7 Testing for independence of models %
模型形式 SRE MRE AMRE P
一般回归模型 3. 12 2. 62 4. 88 90. 89
一般混合效应模型 0. 89 0. 85 2. 61 97. 13
林分因子混合效应模型 0. 60 0. 59 3. 24 96. 46
海拔混合效应模型 0. 86 0. 83 4. 20 96. 62
从上表 7可以看出,一般混合效应模型的预估
精度最高,绝对平均相对误差最小,总相对误差
和平均相对误差较大;引入环境因子后,混合效
应模型的总相对误差以及平均相对误差有所减小,
其中又以引入林分因子的混合效应模型的误差最
小,表现最佳;一般回归模型无论在误差方面还
是在精度方面都与混合效应模型有很大差距。
4. 3 综合分析
从模型的拟合精度和模型独立性检验 2项结果
来看,以引入林分因子混合效应模型作为最终混
合效应模型。模型拟合结果见表 8。
表 8 林分蓄积混合效应模型最终拟合结果
Table 8 Result of fitting indexes of mixed
effects models of stand volume
参数 估计值 P值
a 3. 102 3 0. 000 1
b 1. 062 5 0. 000 1
c -0. 109 6 0. 000 1
α1 0. 001 2 0. 000 1
α2 0. 000 3 0. 000 1
α3 0. 000 02 0. 000 1
logLik -112. 4
AIC 228. 8
BIC 228. 6
区组间方差协方差矩阵 (D) D= 0. 015
异方差函数值 Power= 1. 121
空间相关性 1. 538
残差 1. 442
421 西 南 林 业 大 学 学 报 第 36卷
5 结论与讨论
混合效应模型相对于一般回归模型在林分蓄
积拟合中有较高较好的拟合效果。引入环境因子
的混合效应模型的拟合效果比一般混合效应模型
要好;在引入环境因子的混合效应模型中,引入
林分因子的混合效应模型拟合效果最好。
1)从模型独立性检验来看,一般混合效应模
型的预估精度最高,绝对平均相对误差最小,总
相对误差和平均相对误差较大;引入环境因子后,
混合效应模型的总相对误差以及平均相对误差有
所减小,其中又以引入林分因子的混合效应模型
的误差最小,表现最佳;一般回归模型无论在误
差方面还是在精度方面都与混合效应模型有很大
差距。可见,在构建香格里拉高山松林分蓄积的
拟合模型中,混合效应模型具有明显的优势,而
在基于混合效应模型构建林分蓄积模型时,引入
环境因子尤其是林分因子可以显著地提高模型的
拟合精度。
2)从模型的拟合精度和模型独立性检验 2 项
结果看,在构建香格里拉高山松林分蓄积的混合
效应模型时引入林分因子会取得最佳效果。究其
原因,是由于调查的样地多为幼龄林、近熟林,
单株树木还处于生长竞争中,尚未形成稳定的林
分结构,故而林分因子成为树木竞争的先决条件,
优于海拔对树木生长的影响,成为影响林分蓄积
的主要因素。
3)由于林分因子反映的是小地域斑块因子对
林分生长的影响,这对精确估算高山松这种典型
的高寒地区山地松的林分蓄积具有重要意义。另
外,由于在野外样地调查中,如郁闭度等林分因
子的记录是必不可少的,所以,在高山松天然林
林分蓄积混合效应模型构建中,林分因子的数据
是现成可取的,这不仅可提高模型拟合的精度,
还具有良好的可用性。
本研究旨在构建香格里拉高山松天然林林分
蓄积的混合效应模型,限于数据,只选取了一些
代表性的因子,并且因为研究区仅限于香格里拉,
一般认为一个市的气候情况是基本一致的,因此
未考虑气候因子对研究结果的影响,若今后有更
充分的数据将另行验证。此外,对其他地区、其
他树种,本文结论不具备代表性。
[参 考 文 献]
[1] 孟宪宇. 测树学 [M]. 北京:中国林业出版社,
1996.
[2] 符利勇,张会儒. 基于非线性混合模型的杉木优势木
平均高 [J]. 林业科学,2012,48(7):66-71.
[3] 李春明. 基于混合效应模型的杉木人工林蓄积联立
方程系统 [J]. 林业科学,2012,48(6):80-88.
[4] 唐守正,郎奎建,李海奎. 统计和生物数学模型计算
[M]. 北京:科学出版社,2009.
[5] 李永慈,唐守正. 用 Mixed和 Nlmixed 过程建立混合
生长模型 [J]. 林业科学研究,2004,17(3):297-
283.
[6] 李春明. 混合效应模型在森林生长模型中的应用
[J]. 林业科学,2009,45(4):131-138.
[7] Fang Z,Bailey R L,Shiver B D. A multivariate simulta-
neous prediction system for stand growth and yield with
fixed and random effects [J]. Forest Science,2001,47
(4) :550-562.
[8] Pinheiro J C,Bates D M. Mixed Effects Models in S
and S-Plus [M]. New York:Springer New York,2000.
[9] Littell R C,Milliken G A,Stroup W W,et al. SAS for
Mixed Models [M]. SAS INST,2007.
[10] 欧光龙,胥辉. 思茅松天然林林分生物量混合效应
模型构建 [J]. 北京林业大学学报,2015,37(3):
101-110.
(责任编辑 曹 龙)
521第 3期 王永刚等:香格里拉高山松天然林林分蓄积混合效应模型构建