免费文献传递   相关文献

基于地理权重回归的长白山区云冷杉二元材积式构建



全 文 :第 39 卷 第 7 期 东 北 林 业 大 学 学 报 Vol. 39 No. 7
2011 年 7 月 JOURNAL OF NORTHEAST FORESTRY UNIVERSITY Jul. 2011
1)林业公益性行业科研专项(20080427)。
第一作者简介:孔雷,男,1986 年 3 月生,省部共建森林培育与保
护教育部重点实验室(北京林业大学) ,硕士研究生。
通信作者:杨华,省部共建森林培育与保护教育部重点实验室
(北京林业大学) ,副教授。E-mail:huayang@ bjfu. edu. cn。
收稿日期:2010 年 10 月 30 日。
责任编辑:张建华。
基于地理权重回归的长白山区云冷杉二元材积式构建1)
孔 雷 杨 华 亢新刚 高 延 冯启祥 王卓辉
(省部共建森林培育与保护教育部重点实验室(北京林业大学) ,北京,100083) (吉林汪清林业局)
摘 要 以采用长白山北麓皆伐样地的 59 株样木为研究对象,利用地理权重回归模型(GWR)和最小二乘法
(OLS)比较并构建二元材积公式。从数据的空间分析角度,研究了模型的胸径、树高与材积的关系。结果显示:
GWR模型的拟合优度、预测能力都要高于 OLS模型。GWR模型的变量参数可以反映出在样地内的空间分布规律
及其稳定性,从而进一步揭示林木之间的竞争关系。GWR反映局部信息的能力为 OLS 所不及。优选模型的赤池
信息量(AIC)最小。优选模型的稳定性、拟合优度、预测能力和残差的结果也均最优。
关键词 地理权重回归模型;最小二乘法;二元材积;空间分析
分类号 S757. 2
Application of Geographically Weighted Regression to Establishment of Standard Volume Model of a Spruce-fir
Mixed Stand in Changbai Mountain /Kong Lei,Yang Hua,Kang Xingang(Key Laboratory for Cilviculture and Conser-
vation (Beijing Forestry University) ,Ministry of Education,Beijing 100083,P. R. China) ;Gao Yan,Feng Qixiang,
Wang Zhuohui(Wangqing Forestry Bureau,Jilin Province)/ / Journal of Northeast Forestry University. -2011,39(7). -38 ~41
A standard volume model for 59 sample trees in a clear cutting plot in the north of Changbai Mountains was estab-
lished by applying Geographical Weighted Regression (GWR)method and Ordinary Least Square(OLS)method. The re-
lationships between diameter at breast height,tree height and individual volume were analyzed from the perspective of spa-
tial analysis. Results show that the GWR model is superior to the OLS model in goodness of fit and prediction ability. The
GWR model parameters could reflect the spatial distribution rule of trees in the sample plot and their stability,which fur-
ther reveal the competitive relationship between trees. With the spatial analysis of data,the GWR method has the potential
to reveal the local patterns in the spatial distribution of a parameter,which would be ignored by the OLS approach. The op-
timal model with the smallest Akaike information criterion(AIC)was chosen. And the residual,stability,goodness of fit
and prediction ability of the optimal model are also the best.
Keywords Geographical weighted regression;Ordinary least square;Standard volume models;Spatial analysis
对于二元材积表的研究,无论是理论还是实践已为经典
研究。因二元材积表的编制资料是取自较大的地域范围,其
适用地域较大,故又称为一般材积表[1]。我国各地都有研究
人员对某一树种大范围选取样木来编制二元材积表。以往二
元材积式的研究主要集中在 3 个方面。一是二元材积模型的
选择与改进[2]。二是二元材积模型的拟合算法研究。在材
积模型拟合算法的研究中,国内林业研究人员已经做过一些
工作。曾采用遗传算法、三次设计法、改进单纯形法拟合材积
方程,并与对数线性化最小二乘法进行比较[3],也有利用相
对误差最小二乘法估计材积方程参数的方法[4]等。这些算
法虽然能在一定程度上克服材积方程模型的异方差性,但不
具有空间分析能力。第三是对二元材积式拟合精度进行分
析,将已有的材积模型按拟合精度分别不同树种进行比
较[5],或对模型应用过程中的偏差进行探讨,研究表明,二元
材积模型的选择以及参数求解方法等方面都存在着导致局部
区段产生较大系统偏差的可能[6]。传统求解二元材积式参
数的方法是用最小二乘法回归(OLS)。然而,OLS 不能反映
数据中的空间异质性[7]。由于受竞争结果的直接影响,树木
的空间位置状况很大程度上间接影响到树木的大小、生长过
程、冠形和死亡率[8-12]。因而有必要了解空间异质性对树木
的生长影响,而且要通过在模型系统中加入空间信息来改进
传统的二元材积模型。以往研究中,二元材积模型应用最多、
影响最大的是山本式。本文仍以山本式二元材积方程为基
础,通过地理权重回归方法,探讨一种反映空间异质性的材积
模型参数的求解方法。
1 试验地概况
研究区域位于吉林省东部长白山北麓,东经 129°56 ~
130°4,北纬 43°5 ~ 43°40之间。该区跨长白山地冷凉多雨
区和延吉盆地温凉雨水较多区两个气候分区,且偏于东北部。
年平均气温 3. 9 ℃,年日照时数约为 2 358 h;年降水量为 500 ~
600 mm;初霜期多在 9 月中下旬,终霜期一般在 5 月中旬,积
雪日数 80 ~ 100 d,深度 20 cm左右;风向的季节性变化明显,
风速一般为 2 ~ 5 m /s。
研究数据来源于汪清林业局金沟岭林场皆伐标准地的
13 号样地。样地面积 0. 25 hm2,为云冷杉混交林。该样地有
云冷杉 59 株,平均胸径为 24. 3 cm,样木胸径最大为 44. 2 cm,
最小为 6. 2 cm;树高最大为 23. 8 m,最小为 5. 5 m。林木胸径
近 10 a生长量数据根据解析木方法得到,树高近 10 a生长量
数据根据 1979—1988 年的树高调查资料得到。每株林木都
在样地内定位。
2 研究方法
2. 1 地理权重回归模型
地理权重回归模型(GWR)是一个权重随着到局部定点
x0 的距离递增而递减的方程,致使相邻点的影响也随着到局
部定点 xi(xi =1,2,…,k)的距离递增而递减(k是相邻点的数
量)。基于观测值 i与样地内所有其他点距离,就能得到每个
DOI:10.13759/j.cnki.dlxb.2011.07.037
点的权重,通过使用权重最小二乘法,GWR 方程就能对空间
内每一个点赋予一个局部线性回归估计[13]。
设 p个带有空间坐标(ui,vi) (i = 1,2,…,n)的自变量的
观测值为 xij(j = 1,2,…,p) ,对应的因变量的观察值为 yi,则
GWR模型可以表示为:
yi =β0(ui,vi)+∑
p
j=1
Xijβj(ui,vi)+εi。 (1)
其中,β0(ui,vi) ,β1(ui,vi) ,…,βp(ui,vi)是 p+1 个带空间坐标
(ui,vi)的连续变量。εi 是一个符合正态分布 N(0,σ
2 I)的随
机误差。
2. 2 系数确定
在 GWR中,要被分析的样点的参数估计,是通过与空间
上一点距离的远近加权得到。观测值与定点越近,分配的权
重越大,相反则越小。在多个坐标之下,βi 的参数估计是通过
权重最小二乘得到的:
β^i =[X
TWi(ui,vi)X]
-1XTWi(ui,vi)y。 (2)
其中 β^i 代表的是一个估计。Wi(ui,vi)是一个 n阶矩阵,称为
权重矩阵。
Wi(ui,vi)=
Wi1 0 … 0
0 Wi2 … 0
  
0 0 … W

in
。 (3)
权重矩阵在 GWR中的角色是代表这些坐标中每个观测
值的重要性。为了达到这个目的,选择一个适合的加权方法。
2. 3 权重确定
采用高斯方程确定权重。高斯方程的表达式如下:
Wij = e
[-
d2ij
b2
]。 (4)
式中,b为窗宽参数,是一个非负参数,是随着距离的增加而
递减的。如果定点 i与定点 j重合(dij = 0) ,则 Wij为 1。其它
定点 j 的权重会沿着高斯曲线随着距离的增加而降低,但是
无论定点 j和距离定点 i多远,其权值都不为 0。
2. 4 模型评价及检验
选择相关系数 R2 来评价模型拟合的优度;选择绝对偏差
(di)、平均偏差(珔di)、平均绝对偏差(Saf)、平均相对偏差
(Srf)
[14]和预估精度(P)评价模型预测能力;利用赤池信息量
准则(Akaike Information Criterion,简称 AIC)[15-16]选择最优预
测模型。公式如下:
di =∑
n
i=1
(yi-y^1)/n; (5)
珔di =∑
n
i=1
|(yi-y^1)/n |; (6)
Saf =
1
n∑
n
i=1
[(yi-y^i)/yi]×100%; (7)
Srf =
1
n∑
n
i=1
|(yi-y^i)/yi | ×100%; (8)
P=1-tα ∑
n
i=1
(yi-y^i)槡
2 /珋yi n(n-m槡 ) ; (9)
R2 = 1-∑
n
i=1
(yi-y^i)
2 /∑
n
i=1
(yi-y^i)
2; (10)
AIC = 2nln(RSS /n)+nln(2π)+n+tr(S)。 (11)
式中:yi、^yi 分别表示第 i个实测值、估计值、估计平均值;tα 为
检验值;n、m分别表示样本个数、模型参数的个数;RSS为模型
残差平方和;tr(S)代表帽子矩阵 S的迹。
2. 5 空间自相关检验
利用 Moran指数对云冷杉材积的空间自相关程度进行检
验。Moran指数计算公式如下:
I=(ns )

n
i=1

n
j=1
(yi-珋y) (yj-珋y)Wij

n
i=1
(yi-珋y)

2
。 (12)
式中:n是样木数量;yi、yj 是样方内第 i、j株样木的材积;珋y 是
样木材积平均值;Wij为空间关系矩阵,反映格网点 i与 j的空
间关系;s= 1n-1∑
n
i=1
(yi-珋y)
2。
3 结果与分析
3. 1 林木材积空间自相关分析
云冷杉单株材积在样地范围内的 Moran 指数 I 为 0. 14。
利用样地资料所计算出的Moran指数 I的正态统计Z值为
1. 799 8,而正态分布函数在 0. 1 水平下的临界值为 1. 65,说
明单株材积的空间分布不是随机状态,表明云冷杉单株材积
的分布具有空间依赖性,表现出集群分布的特征。
3. 2 林木材积模型选择
本文一元函数采用对数函数拟合材积公式;二元函数采
用山本和藏式[1]拟合材积公式:
V=a0d
a1ha2。 (13)
式中:a0、a1、a2 为参数;d、h分别为胸径和树高。为了分析哪
些变量应该包含在模型中,将胸径和树高随机排列组成 3 组
模型。
表 1 用 GWR与 OLS模拟的备选模型
模型 自变量 模型 自变量
Ⅰ d、h Ⅲ h
Ⅱ d
利用检验样本数据,对 3 个备选模型计算偏差统计量和
预估精度,通过比较各检验统计量,选择 di、珔di、Saf、Srf和 AIC值
最小、而预估精度最高的材积方程作为最佳模型。模型Ⅱ和
Ⅲ由 GWR算得的 AIC值要小于 OLS,GWR 的 R
2 值也要大于
OLS。模型Ⅰ(OLS)的 AIC值为-264. 141,R
2 为 0. 944 4,模型
Ⅰ(GWR)的 AIC值为-260. 935,R
2 为 0. 934 7,其表达式为:
VOLS = 0. 936 693d
0. 059 5h0. 691 3(R2 = 0. 995 9) ; (14)
VGWR =0. 917 686d
2. 060 7h0. 697 5(R2 = 0. 996 1)。 (15)
这里 d为树木的胸径,h为树高,V为材积。
3. 3 参数比较
表 3 显示了模型Ⅰ分别用 OLS和 GWR方法拟合出的模
型参数。β0、β1、β2 分别是截距、d 的系数和 h 的系数,b 为系
数值,SD 为标准差。如果 GWR估计的四分位区间[1 /4 分位
值,3 /4 分位值]超过 OLS估计的[b-SD,b+SD],说明模型(1)
通过 GWR估计的参数在样本内相对于 OLS不稳定[17]。
从表 3 中可知,β1、β2 的四分位区间没有超过[b-SD,b+
SD],说明 d、h 的系数在样本空间相对稳定。β0 的四分位区
间则远超过[b-SD,b+SD],说明在样本空间截距参数不稳定。
β0 的置信区间[-1. 022,0. 457]、β1 的置信区间[1. 751,2. 160]和
β2 的置信区间[0. 517,0. 939]的取值范围都要比 GWR 估计
值[-1. 079,-0. 233]、[1. 751,1. 977]、[0. 679,0. 889]的范围
大,说明由 OLS估计的 β0、β1 和 β2 值要比由 GWR估计的值分
散。OLS估计得到的参数在样本空间不稳定。
3. 4 残差分析
图 1 为模型Ⅰ(GWR)估计值(^yi)与残差值(ei = yi-y^i)之
93第 7 期 孔 雷等:基于地理权重回归的长白山区云冷杉二元材积式构建
间的散点图。由散点图看出,残差分布均匀,没有明显的规
律,表明模型预测较好。综上所述,模型Ⅰ(GWR)确定为最
佳材积方程。
表 2 备选模型偏差统计量、AIC、R2、n、预估精度 P
模型 方法 n
偏差统计量
di 珔di Saf Srf
AIC R2 预估精度 P /%
Ⅰ GWR 59 0. 039 5 0. 054 0 -0. 000 9 0. 175 6 -264. 141 0. 944 4 0. 923 1
OLS 59 0. 043 0 0. 056 8 -0. 008 8 0. 184 5 -260. 935 0. 934 7 0. 920 2
Ⅱ GWR 59 0. 108 4 0. 118 4 0. 079 2 0. 328 5 -203. 154 0. 887 7 0. 838 1
OLS 59 0. 042 3 0. 063 1 -0. 132 4 0. 309 0 -253. 09 0. 876 7 0. 914 2
Ⅲ GWR 59 0. 037 7 0. 112 1 -0. 62 1 0. 800 2 -199. 211 0. 652 7 0. 860 7
OLS 59 0. 124 5 0. 172 1 -0. 493 1 0. 901 3 -156. 721 0. 440 4 0. 745 4
表 3 用 GWR、OLS方法拟合模型Ⅰ的参数描述统计量
OLS统计量 参数 标准误差
95%置信区间
下限 上限
b-SD b+SD GWR统计量 平均值 最小值 1 /4 分位值 中间值 3 /4 分位值 最大值
β0 -0. 489 0. 369 -1. 022 0. 457 -1. 998 1. 021 β0 -0. 547 -1. 079 -0. 755 -0. 473 -0. 356 -0. 233
β1 1. 878 0. 090 1. 751 2. 160 1. 257 2. 498 β1 1. 880 1. 751 1. 822 1. 887 1. 946 1. 977
β2 0. 727 0. 108 0. 517 0. 939 0. 185 1. 269 β2 0. 747 0. 679 0. 707 0. 736 0. 784 0. 889
图 1 模型Ⅰ(GWR)材积方程的残差分布图
3. 5 空间分布的分析
普通最小二乘法(OLS)只能在全局或者平均意义上对参
数进行估计,无法反映空间局部的变化,GWR 可以在空间上
对每棵树的材积方程的系数进行估计,更能反映林木材积的
空间依赖性。图 2 显示了 d、h与 V相关程度的空间分布。
(a)d的系数 (b)h的系数
图 2 用 GWR模拟材积时系数估计空间分布情况
图 2 (a)显示了 d 与 V 相关程度的空间分布,其中间值 为 1. 887,正相关程度取值范围为[1. 751,1. 977]。由相关程
04 东 北 林 业 大 学 学 报 第 39 卷
度取值范围可知,d与 V在样本空间上全部为正相关关系,而
且在所有调查因子中与 V相关程度最大。西南方向林木胸径
与材积正相关程度相对强一些,纵坐标小于 30 m 区域范围。
东北方向这种相关程度相对弱些,坐标范围为纵坐标大于 30
m。图 2 (b)显示了 h与 V的相关程度的空间分布,其中间值
为 0. 736,相关程度取值范围[0. 679,0. 889]。由相关程度取
值范围可知,h与 V 在样本空间上均为正相关。与胸径相关
程度空间分布相反,这种正相关程度较大的林木分布在纵坐
标大于 30 m的地区。
3 结论与讨论
在材积模型参数的求解算法研究中,对 GWR 和 OLS 回
归分析结果进行了比较:GWR 能够反映数据中的空间异质
性,可直接反映样地内林木之间局部的复杂关系。由空间自
相关检验可知,样地内材积具有空间自相关关系,呈现出相似
值之间的空间群集关系。这种关系体现为与材积的一种相关
程度,可量化。通过对胸径、树高与材积相关程度的空间分
析,分别在同一等级的胸径比较下可以看出,林木胸径、树高
与材积的相关程度高的地区近 10 a 增长量要比相关程度低
的地区高,说明材积增长量与相关性有很密切的关系。从图
2 中得到生长能力不强的树木位置,直接对其进行抚育处理。
这对今后的森林经营管理给予了一定的启示作用。
GWR为考虑空间效应的二元材积式提供了一种新颖、有
益的定量分析方法。但是文中仅仅采用了地理邻接标准作为
空间权重的地理权重回归模型,以此对二元材积式进行回归
分析。天然林中林木之间复杂的竞争关系若能引入到这种权
重里来,将会得出更加科学、客观的分析结果。
参 考 文 献
[1] 孟宪宇.测树学[M]. 2 版. 北京:中国林业出版社,1995:135 -
138.
[2] 骆期邦,宁辉,贺东北,等.二元立木材积动态模型研究[J]. 林
业科学研究,1992,5(3) :263-270.
[3] 叶功富,涂育合,田有圳,等.凹叶厚朴二元立木材积方程的研
究[J].北华大学学报:自然科学版,2002,3(6) :528-533.
[4] 钟义山,钟云智.利用相对误差最小二乘法估计材积方程参数
[J].西北林学院学报,1999,14(1) :84-87.
[5] 孟宪宇. 二元材积方程的比较[J]. 南京林产工业学院学报,
1982(4) :80-87.
[6] 向建华.我区现有一二元立木材积表应用偏差问题的探讨[J].
中南林业调查规划,1996,15(1) :8-10.
[7] Zhang Lianjun,Shi Haijin. Local modeling of tree growth by geo-
graphically weighted regression[J]. Forest Science,2004,50(4) :
225-244.
[8] Miller T E,Weiner J. Local density variation may mimic effects of
asymmetric competition on plant size variability[J]. Ecological So-
ciety of America,1989,70(4) :1188-1191.
[9] Kenkel N C,Hoskins J A,Hoskins W D. Local competition in a
naturally established jack pine stands[J]. Canadian Journal of Bot-
any,1989,67(9) :2630-2635.
[10] Weiner J. Asymmetric competition in plant populations[J].
Trends in Ecology and Evolution,1990,5(11) :360-364.
[11] Newton P F,Jolliffe P A. Assessing processes of intra-specific
competition with spatially heterogeneous black spruce stands[J].
Canadian journal of forest research,1998,28(2) :259-275.
[12] Dovciak M,Frelich L E,Reich P B. Discordance in spatial pat-
terns of white pine (Pinus strobus)size-classes in a patchy near-
boreal forest[J]. The Journal of Ecology,2001,89(2) :280 -
291.
[13] Yrigoyen C C,Rodriguez I G,Otero J V. Modeling spatial varia-
tions in household disposable income with Geographically Weigh-
ted Regression[R /OL]. MPRA Paper No. 1682,posted 07. No-
vember 2007 /01:55[2010 - 05 - 21] . http:/ /mrpa. ub. uni-
muenchen. de /1682 / .
[14] 姜生伟,贾炜玮.黑龙江东部地区落叶松人工林削度方程研究
[J].辽宁林业科技,2009(1) :8-13.
[15] Fotheringham A S,Brunsdon C,Charlton M. Geographically
weighted regression:the analysis of spatially varying relationships
[M]. Washington:Wiley,2002:95-102.
[16] Brunsdon C,Fotheringham A S,Charlton M. Geographically
weighted regression-Modeling spatial non-stationarity[J]. Statis-
tician,1998,47(3) :431-443.
[17] Wang Quan,Ni Jian,Tenhunen J. Application of a geographical-
ly-weighted regression analysis to estimate net primary production
of Chinese forest ecosystems[J]. Global Ecology and Biogeogra-
phy,2005,14(4) :

379-393.
(上接 31 页)
4 结论
坡位对长白落叶松的基本密度、晚材率、纤维长宽比都未
形成显著的影响,而且在不同坡位间也没有统一的变化规律。
坡向对长白落叶松的基本密度、晚材率、纤维长宽比的影响,
体现出了较一致的规律,这几个指标都是生长在东坡的长白
落叶松最好,生长在北坡的最差,尤其是纤维长宽比,东坡的
明显高于北坡。
在木材化学组分方面,不同坡位上生长的长白落叶松在综
纤维素、木素以及各种抽提物含量上均未形成显著差异,但生
长在坡下的长白落叶松,在多数化学组成指标上均表现较差。
不同坡向对长白落叶松木材化学组分未形成明显影响,而且在
不同坡向间木材化学组分也未表现出统一的变化规律。
参考其他人关于不同立地条件下长白落叶松生长的研究
结果[1,7],以及本研究各种立地上优势木高的测定结果:长白
落叶松在东坡和下坡位生长最好,而且基本密度、晚材率、纤
维长宽比,都是生长在东坡的长白落叶松最好,因此,初步认
为长白落叶松纤维用材林的适生立地以选择东坡下部为好。
参 考 文 献
[1] 陈乃全,王政权.勃力县红松、落叶松人工林生长与立地因子关
系的研究[J].东北林业大学学报,1987,15(1) :15-21.
[2] 郭明辉,赵西平,陈广胜,等.坡向对人工林落叶松纤维形态及
造纸性能的影响[J].东北林业大学学报,2002,30(3) :21-23.
[3] 潘彪.不同立地指数对马尾松生长轮宽、晚材率、纤维形态和纤
丝角的影响[J].世界林业研究,1995(专辑) :320-326.
[4] 陈金明.立地条件对拟赤杨人工林材性的影响[J].福建师范大
学学报:自然科学版,2006,22(4) :92-96.
[5] 林瑞荣.立地条件对拟赤杨人工林木材纤维特性的影响[J].福
建林学院学报,2008,28(2) :160-163.
[6] 张应团.长岭岗林场日本落叶松幼龄材木材密度测定[J].西北
林业科学,2004,33(3) :77-84.
[7] 孙淑芬,庞玉梅.长白落叶松纸浆材人工林定向培育技术的研
究[J].林业资源管理,2005(3) :52-54.
[8] 王树力,吴剂生,仲崇淇.长白落叶松纸浆林木材材性及纸浆特
性的研究[J].林业科学,1997,33(3) :283-287.
[9] 王树力,工业纤维林培育理论与技术[M].哈尔滨:黑龙江科学
技术出版社,1996:23-40.
[10] 陈佩蓉,屈维均,何福望. 制浆造纸实验[M]. 北京:中国轻工
业出版社,1990:17-24.
[11] 中国国家技术监督局. GB2677—1981 造纸工业产品试验方法
[M].北京:中国标准出版社,1981.
14第 7 期 孔 雷等:基于地理权重回归的长白山区云冷杉二元材积式构建