免费文献传递   相关文献

Comparison of three models of forest biomass estimation

三种森林生物量估测模型的比较分析


森林生物量的定量估算为全球碳储量、碳循环研究提供了重要的参考依据。该研究采用黑龙江长白山地区的TM影像和133块森林资源一类清查样地的数据, 选取地学参数、遥感反演参数等71个自变量分别构建多元逐步回归模型、传统BP (back propagation)神经网络模型和基于高斯误差函数的BP神经网络改进模型(Gaussian error function, Erf-BP), 进而估算该地区的森林生物量, 并进行比较分析。结果表明, 多元逐步回归模型估测的森林生物量预测精度为75%, 均方根误差为26.87 t·m-2; 传统BP神经网络模型估测森林生物量的预测精度为80.92%, 均方根误差为21.44 t·m-2; Erf-BP估测森林生物量的预测精度为82.22%, 均方根误差为20.83 t·m-2。可见, 改进后的Erf-BP能更好地模拟生物量与各个因子之间的关系, 估算精度更高。

Aims Quantitative estimation of forest biomass is significant to studies of global carbon storage and carbon cycle. Our objective is to develop models to estimate forest biomass accurately. Methods Multi-stepwise regression model, traditional back propagation (BP) neutral network model and BP neutral network model based on Gaussian error function (Erf-BP) were developed to estimate forest biomass in Changbai Mountain of Heilongjiang, China according to TM imagery and 133 plots of forest inventory data. There were 71 dependent variables of geoscience and remote sensing. Important findings The precisions and root mean square errors of multi-stepwise regression model, traditional BP neutral network model and Erf-BP were 75%, 26.87 t·m-2; 80.92%, 21.44 t·m-2 and 82.22%, 20.83 t·m-2, respectively. Therefore, the relations between forest biomass and various factors can be better modeled and described by the improved Erf-BP.


全 文 :植物生态学报 2011, 35 (4): 402–410 doi: 10.3724/SP.J.1258.2011.00402
Chinese Journal of Plant Ecology http://www.plant-ecology.com
——————————————————
收稿日期Received: 2010-09-15 接受日期Accepted: 2010-11-26
* E-mail: fanwy@163.com
三种森林生物量估测模型的比较分析
范文义* 张海玉 于 颖 毛学刚 杨金明
东北林业大学林学院, 哈尔滨 150040
摘 要 森林生物量的定量估算为全球碳储量、碳循环研究提供了重要的参考依据。该研究采用黑龙江长白山地区的TM影
像和133块森林资源一类清查样地的数据, 选取地学参数、遥感反演参数等71个自变量分别构建多元逐步回归模型、传统BP
(back propagation)神经网络模型和基于高斯误差函数的BP神经网络改进模型(Gaussian error function, Erf-BP), 进而估算该地
区的森林生物量, 并进行比较分析。结果表明, 多元逐步回归模型估测的森林生物量预测精度为75%, 均方根误差为26.87
t·m–2; 传统BP神经网络模型估测森林生物量的预测精度为80.92%, 均方根误差为21.44 t·m–2; Erf-BP估测森林生物量的预测
精度为82.22%, 均方根误差为20.83 t·m–2。可见, 改进后的Erf-BP能更好地模拟生物量与各个因子之间的关系, 估算精度更
高。
关键词 生物量, BP神经网络模型, 基于高斯误差函数的BP神经网络改进模型, 多元逐步回归
Comparison of three models of forest biomass estimation
FAN Wen-Yi*, ZHANG Hai-Yu, YU Ying, MAO Xue-Gang, and YANG Jin-Ming
School of Forestry, Northeast Forestry University, Harbin 150040, China
Abstract
Aims Quantitative estimation of forest biomass is significant to studies of global carbon storage and carbon cy-
cle. Our objective is to develop models to estimate forest biomass accurately.
Methods Multi-stepwise regression model, traditional back propagation (BP) neutral network model and BP
neutral network model based on Gaussian error function (Erf-BP) were developed to estimate forest biomass in
Changbai Mountain of Heilongjiang, China according to TM imagery and 133 plots of forest inventory data.
There were 71 dependent variables of geoscience and remote sensing.
Important findings The precisions and root mean square errors of multi-stepwise regression model, traditional
BP neutral network model and Erf-BP were 75%, 26.87 t·m–2; 80.92%, 21.44 t·m–2 and 82.22%, 20.83 t·m–2, re-
spectively. Therefore, the relations between forest biomass and various factors can be better modeled and de-
scribed by the improved Erf-BP.
Key words biomass, back propagation (BP) neural network model, BP neutral network model based on Gaus-
sian error function (Erf-BP), multi-stepwise regression

森林是地球上最重要的资源之一, 是陆地上面
积最大、分布最广、组成结构最复杂、物质资源最
丰富的生态系统, 是陆地生态系统的主要碳汇(庞
勇等, 2005)。森林生物量则是整个森林生态系统运
行的能量基础和营养物质来源, 是研究生物生产
力、净第一性生产力、碳循环以及全球变化的基础
(国庆喜和张锋, 2003)。因此, 准确估算森林生物量
对全球碳汇、碳循环、碳平衡的研究以及全球变化
的理解有举足轻重的作用(Brown et al., 1996)。
森林生物量的估算方法主要有现地调查法、模
型模拟法和遥感估算法(薛立和杨鹏, 2004)。传统的
现地调查法需要很多实测数据, 消耗大量的人力、
财力和物力, 且很难在区域上推广。模型模拟法的
问题之一是各分量模型间不相容, 即木材、树皮、
枝、叶4部分干重之和不等于总量的问题, 唐守正等
(2000)以长白落叶松(Larix olgensis)为例建立了相
容性立木生物量模型, 解决了此问题。问题之二是
模型的指标体系和模型精度各异, 无法在区域上推
广。遥感信息模型的出现使得大范围高精度地估算
森林生物量成为可能, 比起传统方法有很大的优越
范文义等: 三种森林生物量估测模型的比较分析 403

doi: 10.3724/SP.J.1258.2011.00402
性。很多学者根据植被光谱信息, 利用原始波段、
植被指数、地形因子和气象因子与生物量建立回归
模型, 估测森林生物量(郭志华等, 2002; 杨存建等,
2004)。郭志华等(2002)利用TM数据6个波段的线性
和非线性组合与蓄积量建立回归, 得到模型的R2为
0.8, 再代入到生物量与蓄积量的模型中估算生物
量; 杨存建等(2004)利用遥感数据、气象数据和地
形数据建立回归模型估算森林生物量, 模型R2为
0.589; Holben等(1980)利用叶片的光谱信息成功地
估算了大豆(Glycine max)叶片生物量; Hall (2006)采
用ETM+数据统计估算森林地上生物量和蓄积量。
这些方法通用性不强, 只适用于一定的区域范围,
参数会随着时空变化而变化, 预测的精度不理想,
所以研究者提出了人工神经网络模型。人工神经网
络模型的兴起解决了生物量与各因子之间的非线
性映射关系, 提高了估测精度。国庆喜和张锋(2003)
采用人工神经网络模型, 选取包括环境因子、生物
因子和遥感信息因子在内的13个变量估算了黑龙
江东北部地区的森林生物量, Ingram等(2005)运用
人工神经网络模型估算了马达加斯加岛东南部热
带森林的地上生物量, 均得到了较高的精度, 精度
达80%以上。但是初期的BP (back propagaction)神经
网络模型存在易陷入局部最小点、收敛速度慢、泛
化能力差的缺点,因此基于高斯误差函数的BP神经
网络改进模型(Gaussian error function, Erf-BP)受到
重视。张海燕和冯天瑾(2002)将高斯函数的局部性
和sigmoid函数的全局性良好地结合在一起, 对几
个典型试验进行仿真, 结果这一模型在学习能力和
泛化能力上有明显的提高, 而且仿真精度也有显著
提高。但这种改进的神经网络模型在大尺度森林生
物量估算方面的研究还很少。
本研究采用地学参数和遥感参数, 用TM影像
和该地区2005年的森林资源一类清查数据, 建立生
物量与各因子的多元逐步回归模型、传统BP神经网
络模型及改进的Erf-BP估测森林生物量, 比较分析
了多元逐步回归模型与神经网络模型、传统BP神经
网络模型与改进的Erf-BP在估算生物量上的精度,
以寻求高效、准确的生物量遥感估测模型, 为区域
尺度生物量的估算提供参考。
1 研究区域概况
研究采用2005年8月24日的Landsat陆地资源卫
星TM数据, 其轨道号是115/29 (图1), TM影像覆盖
区域位于黑龙江长白山区域。黑龙江长白山
(126.7°–129.7° E, 43.7°–46.0° N), 位于黑龙江省东
南部, 南起吉林省敦化县, 北接小兴安岭南麓, 平
均海拔800多米。林区森林茂密, 树种较多。有林地
面积204万hm2, 森林覆被率为67.6%, 蓄积量2.1亿
m3。森林类型是以红松(Pinus koraiensis)为主的针阔
混交林, 主要树种有红松、云杉(Picea asperata)、山
杨(Populus davidiana)、冷杉(Abies fabri)、白桦(Betula
platyphylla)、樟子松(Pinus sylvestris var. mongolica)、
水曲柳(Fraxinus mandschurica)、黄菠萝(Phelloden-
dron amurense)和胡桃楸(Juglans mandshurica)等。




图1 研究区域TM影像及样地分布图。
Fig. 1 TM imagery and distribution of plots in study area.
404 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (4): 402–410

www.plant-ecology.com
2 研究方法
2.1 TM影像及样地数据处理
采用ENVI 4.3遥感图像处理软件(ITT Visual
Information Solutions, Colorado, America)对TM影
像进行几何校正、辐射校正、地形校正及大气校正,
得到地表真实的反射率值, TM数据处理几何精度
在一个像素之内。从黑龙江省林业设计研究院收集
研究区域TM影像上2005年森林资源一类清查的数
据(共133个样地) (图1), 包括样地号、样地类别、经
纬度、造林年度、公顷株数、郁闭度、优势树种、
平均树高、平均胸径、地形、坡位、坡向、坡度、
海拔、样地面积、龄组、灌木盖度、灌木高度、草
本盖度、草本高度和植被总盖度等, 与样地点对应
的影像灰度值的提取方法采用四邻域法, 然后将所
有属性数据输入到GIS中进行管理。样地生物量计
算包括乔木、灌木和草本3部分, 乔木生物量计算方
法为: 首先将同一树种各器官(包括茎、枝、叶)生
物量分别代入模型计算后累加, 得到该树种生物
量, 然后将同一样地的生物量按不同树种累加求和
得到样地乔木生物量, 计算采用的模型见表1。灌木
草本生物量的计算: 首先建立不同区域灌木草本生
物量与高度的模型(公式1、2), 然后根据固定样地中
记录的灌木和草本高度代入模型计算生物量, 乘以
盖度得到该样地的灌草总生物量。乔木、灌木和草
本植物的生物量之和除以样地面积得到样地单位
面积上的总生物量, 该生物量为本文中遥感估算模
型建立的绝对参考值。
灌木生物量biomass = 0.0398 × h1 – 0.3326 (1)
草本生物量biomass = 0.0175 × h2 – 0.2888 (2)
其中h1和h2分别表示灌木和草本的平均高度。
2.2 模型变量的选择
模型变量的选择包括遥感变量和地学变量两
部分。遥感变量选择与地物光谱特征、类型高度相
关的原始波段信息、植被指数信息以及纹理信息。
植被指数包括基于波段的线性组合或比值植被指
数、消除土壤背景植被指数以及针对高光谱遥感及
热红外遥感而发展的植被指数。本研究采用简单比
值指数(simple ratio, SR)、归一化植被指数(nor-
malized difference vegetation index, NDVI)、转换型


表1 主要树种生物量方程及树高方程
Table 1 Biomass and tree height functions of main tree species
树种1)
Species1)
茎生物量
Stem biomass (WS)
枝生物量
Branch biomass (WB)
叶生物量
Foliage biomass (WL)
出处
Derivation
树高
Tree height (H)
1 WS = 0.0145(D2H)1.006 WB = 0.000063(D2H)1.536 WL = 0.00104(D2H)1.148 Ding & Sun, 1989 H = 6.6831exp(0.0515D)
2 WS = 0.0134(D2H)1.020 WB = 0.0105(D2H) 0.7386 WL = 0.181D1.8415 Luo, 1996 H = 5.7584exp(0.0499D)
3 WS = 0.025(D2H)0.96 WB = 0.0021(D2H)0.8181 WL = 0.00126(D2H)0.968 Chen & Zhu, 1989 H = 6.9441exp(0.0468D)
4 WS = 0.057D2.4753 WB = 0.0116D2.4054 WL = 0.0083D2.3733 Chen & Zhu, 1989 H = 6.8879exp(0.0343D)
5 WS = 0.0238(D2H)0.936 WB = 0.005(D2H)0.9105 WL = 0.0036(D2H)0.897 Chen & Zhu, 1989 H = 6.8879exp(0.0343D)
6 WS = 0.032417D2.3565 WB = 0.20893D1.7082 WL = 0.29156D1.2807 Self-established H = 6.6831exp(0.0515D)
7 WS = 0.06013(D2H)0.891 WB = 0.00652(D2H)1.169 WL = 0.0044(D2H)0.9919 Jiang, 1992 H = 8.4834exp(0.0277D)
8 WS = 0.02511(D2H)0.927 WB = 0.00957(D2H)0.974 WL = 0.8725(D2H)0.2034 Jiang, 1992 H = 10.6exp(0.0169D)
9 WS = 0.2286(D2H)0.6938 WB = 0.0247(D2H)0.7378 WL = 0.0108(D2H)0.8181 Self-established H = 9.285exp(0.0196D)
10 WS = 0.3274(D2H)0.7217 WB = 0.01349(D2H)0.7197 WL = 0.02347(D2H)0.893 Self-established H = 7.0338exp(0.0332D)
11 WS = 0.03146(D2H)1.032 WB = 0.007429D2.6745 WL = 0.002754D2.4965 Chen & Zhu, 1989 H = 8.1427exp(0.0249D)
12 WS = 0.07936(D2H)0.901 WB = 0.014167(D2H)0.764 WL = 0.01086(D2H)0.847 Self-established H = 13.799exp(0.0138D)
13 WS = 0.14114(D2H)0.723 WB = 0.00724(D2H)1.0225 WL = 0.0079(D2H)0.8085 Jiang, 1992 H = 6.2635exp(0.0334D)
14 WS = 0.03141(D2H)0.733 WB = 0.002127D2.9504 WL = 0.00321D2.473 5 Chen & Zhu, 1989 H = 8.1877exp(0.0219D)
15 WS = 0.01275(D2H)1.009 WB = 0.00824(D2H)0.975 WL = 0.00024(D2H)0.991 Chen & Zhu, 1989 H = 7.0889exp(0.0349D)
16 WS = 0.1193(D2H)0.8372 WB = 0.002(D2H)1.12 WL = 0.000015(D2H)1.47 Luo, 1996 H = 9.8065exp(0.0246D)
17 WS = 0.2286(D2H)0.6938 WB = 0.0247(D2H)0.7378 WL = 0.0108(D2H)0.8181 Chen & Zhu, 1989 H = 12.136exp(0.0133D)
1) 1, 红松; 2, 樟子松; 3, 落叶松; 4, 云杉; 5, 冷杉; 6, 赤松; 7, 水曲柳; 8, 胡桃楸; 9, 黄菠萝; 10, 色木槭; 11, 榆树; 12, 枫桦; 13, 黑桦; 14,
蒙古栎; 15, 椴树; 16, 白桦; 17, 山杨。D为胸径。WT = WS + WB + WL。
1) 1, Pinus koraiensis; 2, Pinus sylvestris var. mongolica; 3, Larix gmelinii; 4, Picea asperata; 5, Abies fabri; 6, Pinus densiflora; 7, Fraxinus mand-
schurica; 8, Juglans mandshurica; 9, Phellodendron amurense; 10, Acer mono; 11, Ulmus pumila; 12, Betula costata; 13, Betula dahurica; 14,
Quercus mongolica; 15, Tilia tuan; 16, Betula platyphylla; 17, Populus davidiana. D, diameter at breast height. WT = WS + WB + WL.
范文义等: 三种森林生物量估测模型的比较分析 405

doi: 10.3724/SP.J.1258.2011.00402
植被指数(transformed vegetation index, TVI)、垂直植
被指数(perpendicular vegetation index, PVI)、红外指
数 (infrared index, II)、土壤调整植被指数 (soil-
adjusted vegetation index, SAVI)、SAVI2、非线性植
被指数(non-linear index, NLI)、优化的简单比值植被
指数(modified simple index, MSR)以及一般波段组
合的植被指数(采用波段号做组合标识, 如TM73、
TM437、TM452、TM42)等。纹理信息是由大量或
多或少的相似纹理元或模式组成的一种结构, 组成
纹理的基元及其相互关系构成了纹理的两个基本
特征(Haralick, 1979), 纹理信息对提高成熟林生物
量估算精度具有重要的作用(Lu & Batistella, 2005)。
本研究中采用了8种纹理信息估算森林生物量, 其
计算公式都是基于灰度共生矩阵的统计结果(曾文
华, 2006), 包括各个波段在对角线方向的纹理平均
值(mean)、方差(variance)、均一性(homogeneity)、
对比度(contrast)、相异性(dissimilarity)、熵(entropy)、
角二阶矩(angular second moment)和相关性(corre-
lation)。地学变量选择与地物空间分布高度相关的
郁闭度、高程、坡度、坡向和经纬度等。这些因子
与生物量的相关性见表2。
2.3 多元逐步回归模型
在黑龙江长白山范围内133个地面样地中随机
选择75%的样地数据, 即99个样地数据和对应遥感
信息数据构建模型, 剩余的25%, 即34个样地的数
据进行模型评价分析。根据相关系数检验, 从71个
变量中选取在0.05及0.01水平上均显著的变量40个,
再利用SPSS 13.0软件, 采用逐步回归法, 将这些变
量全部选入自变量框中, 通过设置检验异常样本的
标准化残差阈值来删除异常样本点, 即当样本点标
准化残差超过阈值时, 将该样本点确定为异常点而
给予剔除, 直到没有异常样本点为止。然后将34个
验证样本代入上述每次得到的模型中, 求出验证样
本预测值并算得拟合精度、预测精度(公式3)和均方
根误差(公式4), 作进一步分析。

式中, Ti为第i个验证样本的真实值; Pi为第i个验证
样本的预测值。
2.4 传统BP神经网络模型
BP神经网络模型全称Back-propagation net-
work, 即反向传播网络, 它利用误差反向传播算法
对网络进行训练(Singh et al., 2009)。传统的BP神经
网络模型隐含层激活函数采用S型对数函数logsig,
输出层激活函数也采用logsig函数。采用去除异常
点的93个地面样地数据构建模型, 34个地面样地数
据作为验证样本。以Bootstrap方法筛选得到郁闭度、
高程、坡度、坡向、X、Band5、Band6、SR、Sec1、
Dis5、Ent4及Hom5共12个自变量作为网络的输入变
量来构建神经网络。Bootstrap方法是近30年来发展
起来的一种新的统计方法, 是由Efron (1979)提出的
一种再抽样方法, 也称为自助法(王惠文等, 2006)。
本研究中森林生物量神经网络估算模型选取的网络
采用3层结构: (1)输入层为12个神经元; (2)根据训练
样本数及输入输出层维数将隐含层神经元范围设为
[11, 21], 按步长1递增; (3)输出层神经元数与输出层
(因变量)个数相同, 为1个。误差函数采用误差平方
和(tol), 范围设为[0.7, 1.2], 按步长0.1递增, 学习速
率(eta)为0.05, 动量因子(α)为0.2, 陡度因子λ = 1。根
据预测和拟合平均相对误差之和最小原则, 选取隐
含层和训练目标的最优组合, 训练最优组合100次,
得到生物量估算精度最高时的网络参数。
2.5 Erf-BP
由于传统的BP神经网络模型具有易陷入局部
最小点、收敛速度慢、泛化能力差等特点, 提出了
基于高斯误差函数的 BP神经网络改进模型
(Erf-BP)。研究中从隐含层激活函数及其导数的取
值范围与收敛速度的角度出发, 选取新的激活函数
——高斯误差函数(Gaussian error function, Erf), 构
建BP算法前馈神经网络Erf-BP。Erf-BP采用新的函
数组合Erf-logsig, 即隐含层激活函数采用高斯误差
函数, 输出层的激活函数采用logsig函数, 这种组
合用高斯误差函数及其导数代替传统的BP算法隐
含层激活函数及其导数, 避免了传统BP神经网络
模型的缺点。森林生物量神经网络估算模型的网络
结构与传统的BP神经网络模型一样。
3 研究结果
3.1 多元逐步回归模型估算的生物量
逐步回归后将超出标准化残差阈值的数据作
为异常点剔除后重新建模, 然后重复上述步骤, 直
406 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (4): 402–410

www.plant-ecology.com
表2 自变量因子与样地生物量的相关系数
Table 2 Correlation coefficients between biomass of plots and independent variables
TM73=TM7/TM3; TM437=TM4*TM3/TM7; TM452=TM(4+5–2)/TM(4+5+2); NDVI = (TM4–TM3)/(TM4+TM3); SR=TM4/TM3;
TM42=TM4/TM2; DVI=TM4–TM3. *, p < 0.05; **, p < 0.01.
5.0+= NDVITVI ; ( ) ( )midirnirmidirnirII ρρρρ +−= / ; ( ) ( )rednirrednirNLI ρρρρ +−= 22 / ;
22 )852.0355.0()149.0355.0( nirredrednirPVI ρρρρ −+−= ; ( )( ) ( )LLSAVI rednirrednir ++−+= ρρρρ /1 ;
( )( ) ( )( )1//1/ +−= rednirrednirMSR ρρρρ ; ( ) ( )rednirnirnirSAVI ρρρρ −−+−+= 25.05.02 2
ρred, ρnir, ρmidir分别表示地物在红波段、近红外和中红外的反射率的值; Mean1–7, 各个波段在对角线方向的纹理平均值; Var1–7, 各个波段在对
角线方向的纹理方差; Hom1–7, 各个波段在对角线方向的纹理均一性; Con1–7, 各个波段在对角线方向的纹理对比度; Dis1–7, 各个波段在
对角线方向的纹理相异性; Ent1–7, 各个波段在对角线方向的纹理熵; Sec1–7, 各个波段在对角线方向的纹理角二阶矩; Cor1–7, 各个波段在
对角线方向的纹理相关性。
ρred, ρnir, ρmidir are the reflectances in bands of red, near-infrared and mid-infrared, respectively; Mean1–7 are bands’ mean value of texture at diagonal
direction; Var1–7 are bands’ variances of texture at diagonal direction; Hom1–7 are bands’ Homogeneities of texture at diagonal direction; Con1–7
are bands’ contrast of texture at diagonal direction; Dis1–7 are bands’ Dissimilarities of texture at diagonal direction; Ent1–7 are bands’ entropy of
texture at diagonal direction; Sec1–7 are bands’ angular second moment values of texture at diagonal direction; Cor1–7 are bands’ correlations of
texture at diagonal direction.
变量
Variable
相关系数
Correlation
coefficient
变量
Variable
相关系数
Correlation
coefficient
变量
Variable
相关系数
Correlation
coefficient
Band1 –0.029 纹理信息
Texture
对角线方向
diagonal direction
Dis1 –0.206
Band2 –0.508** Mean1 –0.354** Dis2 –0.342**
Band3 –0.450** Mean2 –0.225* Dis3 –0.061
Band4 0.035 Mean3 –0.122 Dis4 –0.093
Band5 –0.357** Mean4 0.027 Dis5 –0.301**
原始波段
Original
band
Band7 –0.459** Mean5 –0.383**
相异性
Dissimilarity
Dis7 0.038
TM73 0.100
平均值
Mean
Mean7 –0.323** Ent1 –0.233*
TM437 –0.095 Var1 –0.250* Ent2 –0.342**
TM452 0.511** Var2 –0.308** Ent3 –0.137
TM42 0.591** Var3 –0.122 Ent4 –0.136
差值植被指数
Difference vegetation index
(DVI)
0.121 Var4 –0.178 Ent5 –0.336**
简单比值指数
Simple ratio (SR)
0.482** Var5 –0.305**

Entropy
Ent7 –0.017
归一化植被指数
Normalized difference
vegetation index (NDVI)
0.419**
方差
Variance
Var7 –0.062 Sec1 0.230*
转换型植被指数
Transformed vegetation index
(TVI)
0.415** Hom1 0.206 Sec2 0.340**
垂直植被指数
Perpendicular vegetation index
(PVI)
0.071 Hom2 0.342** Sec3 0.137
红外指数 Infrared index (II) 0.466** Hom3 0.061 Sec4 0.108
土壤调整植被指数
Soil-adjusted vegetation index
(SAVI)
0.418** Hom4 0.088 Sec5 0.329**
优化的简单比值指数
Modified simple ratio (MSR)
0.469** Hom5 0.301**
角二阶矩
Angular second
moment
Sec7 0.019
土壤调整植被指数2
Soil-adjusted vegetation index 2
(SAVI2)
0.409**
均一性
Homogeneity
Hom7 –0.038 Cor1 0.309**
波段组合
Band com-
bination
非线性植被指数
Non-linear index (NLI)
0.330** Con1 –0.206 Cor2 0.366**
纵坐标Y Y-coordinate –0.259* Con2 –0.342** Cor3 0.131
横坐标X X-coordinate –0.231* Con3 –0.061 Cor4 0.143
高程 Elevation 0.598** Con4 –0.113 Cor5 0.172
坡向 Slope aspect –0.280** Con5 –0.292**
相关性
Correlation
Cor7 0.095
地学信息
Geographic
information
坡度 Slope –0.125
对比度
Contrast
Con7 0.038 郁闭度 Closure 0.283**
范文义等: 三种森林生物量估测模型的比较分析 407

doi: 10.3724/SP.J.1258.2011.00402
到没有异常值可以剔除, 最后得到模型建模的数据
93个, 检验样本34个。模型相关系数为0.887, 决定
系数0.788, 拟合精度76%, 预测精度75%, 均方根
误差为26.87 t·m–2 (图2, 图3)。SPSS输出结果见表3
和表4。模型如下:
生物量=125.697 + 18.693 × Closure + 0.024 2 ×
Elevation– 0.000 14 × X – 0.057 5 × Band3 + 0.295 ×
Cor1 (5)

图2 逐步回归法拟合值与真实样地生物量对比。
Fig. 2 Comparison of fitted biomass by regression model and
true biomass of plots.



图3 逐步回归法预测值与真实样地生物量对比。
Fig. 3 Comparison of predicted biomass by regression model
and true biomass of plots.


表3 回归模型描述
Table 3 Description of regression model
r R2 R2adj SE Sig. DW
0.887 0.788 0.776 11.57 0.000 2.054
R2adj,调整决定系数; DW, 杜宾-瓦尔森值; SE, 标准误差; Sig., 显著性。
R2adj, adjust coefficient of determination; DW, Durbin-Watson value;
SE, standard error; Sig., significance.
生物量模型中引入了郁闭度作为自变量。因郁
闭度是一个离散变量, 无法反演整个区域的生物量
分布, 所以研究中采用逐步回归的方法首先估算出
TM影像中每个像元的郁闭度, 得到郁闭度模型为:
郁闭度= 0.383 – 3.156 × Var3 + 0.0079 × Cor5 +
8.804 × 10–5 × TM437 – 0.069 × Ent4 – 0.000939 ×
Cor1 + 0.015 × SR + 0.001 × Cor2 + 0.035 × Mean5 –
0.232 × Hom7, 模型决定系数为0.767, 检验精度为
89%, 均方根误差0.108。然后代入到生物量模型中,
结合研究区域的森林分布图估算区域森林生物量
的分布。
3.2 传统BP神经网络模型估算的生物量
选出隐含层和训练目标的最优组合(15, 0.8),
对最优组合训练100次, 记录下预测和拟合平均相
对误差之和最小时的权重(包含阈值), 作为神经网
络模型估算样地生物量的参数。当预测和拟合平均
相对误差之和最小时(对应的值分别为19.08%和
15.63%), 估算森林生物量的精度达到最高, 拟合精
度为84.37%, 预测精度为80.92%, 均方根误差为
21.44 t·m–2。拟合结果见图4, 预测结果见图5。
3.3 Erf-BP估算的生物量
采用Erf-BP, 选出隐含层和训练目标的最优组
合(15, 0.8), 对最优组合训练100次, 当预测和拟合
平均相对误差之和最小时(对应的值分别为17.78%
和13.96%), 估算森林生物量的精度达到最高, 拟合
精度为86.04%, 预测精度为82.22%, 均方根误差
20.83 t·m–2。拟合结果见图6, 预测结果见图7。



图4 传统BP神经网络模型的拟合结果。
Fig. 4 Fitted results of traditional BP neural network model.
408 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (4): 402–410

www.plant-ecology.com
表4 回归模型系数、显著性及共线性检验结果
Table 4 Results of regression model coefficients, significance and collinearity
Coef_uns, 非标准化系数; Coef_s, 标准化系数; t0.05, 置信水平0.05时的t检验值; VIF, 方差扩大因子。
Coef_uns, non-standardized coefficient; Coef_s, standardized coefficient; t0.05, t-test value with confidence level of 0.05; VIF, variance expansion
factor.



图5 传统BP神经网络模型的预测结果。
Fig. 5 Predicted results of traditional BP neural network
model.




图6 Erf-BP的拟合结果。
Fig. 6 Fitted results of Erf-BP.



图7 Erf-BP的预测结果。
Fig. 7 Predicted results of Erf-BP.



3.4 模型比较
3.4.1 传统BP神经网络模型与Erf-BP的比较
两种网络均采用3层结构, tol设为0.8, 隐含层
神经元设为15。学习率、动量因子、陡度因子以及
所采用的训练方法同上。仿真结果见表5。表中的
平均训练次数和预测误差平方和均为5次试验的平
均值。
3.4.2 Erf-BP与多元逐步回归模型的比较
采用拟合和预测精度(PRECISION)、均方根误
差(RMSE)及决定系数(R2)来评价模型的优越性。其
中拟合和预测均方根误差越小, 精度越高, 表明模
型估算精度越高。模型拟合值与真实值R2越大, 表
明模型拟合值与真实值越接近, 具体见表6。
变量 Variable Coef_uns Coef_s t0.05 Sig. VIF
常数 Constant 125.696 8 6.211 0.000
郁闭度 Closure 18.692 6 0.123 7 2.402 0.018 1.099
高程 Elevation 0.024 0.134 3 2.265 0.026 1.456
X –0.000 14 –0.266 3 –5.273 0.000 1.057
Band3 –0.057 5 –0.273 1 –4.258 0.000 1.704
Cor1 0.295 4 0.539 5 7.903 0.000 1.931
范文义等: 三种森林生物量估测模型的比较分析 409

doi: 10.3724/SP.J.1258.2011.00402
表5 传统BP神经网络模型与Erf-BP训练结果对比
Table 5 Comparisons of training results by traditional BP neutral network model and Erf-BP



表6 不同建模方法的精度比较
Table 6 Comparisons of precisions by different models
建模方法
Modeling method
R2 预测精度
PRECISIONmod
预测精度
PRECISIONpre
均方根误差
RMSEmod (t·m–2)
均方根误差
RMSEpre (t·m–2)
逐步回归法 Regression 0.788 76.00% 75.00% 18.91 26.87
Erf-BP 0.975 86.04% 82.22% 10.17 20.83
下标mod和pre分别表示模型拟合和预测。
Subscript of mod and pre represent as modeling and predicted data, respectively.


4 结论
采用TM影像及森林资源一类清查数据, 选取
地学参数及遥感参数能够很好地估测森林生物量,
为森林生物量、碳储量动态监测及研究提供重要数
据。本研究分别采用多元逐步回归模型、传统BP
神经网络模型和Erf-BP, 估测了研究区域的森林生
物量, 拟合精度分别为76.00%、84.37%和86.04%,
并比较分析了这3种模型的优缺点。多元逐步回归
模型能够解释生物量与各个因变量之间的关系, 但
精度不高, 和以往大部分研究结果相似, 精度集中
在70%左右。而且模型有局限性, 参数随时空的变
化而变化, 差别较大, 在大区域研究精度要求不高
的情况下被广泛应用。传统的BP神经网络模型比多
元逐步回归模型在估测森林生物量精度上显著提
高8.37%,这是因为传统的神经网络具有分布并行
处理、非线性映射、自适应学习等优势。但是传统
的神经网络在训练收敛速度以及函数逼近能力上
有时会存在不稳定性。研究结果表明,改进的Erf-BP
的拟合与预测精度最高, 拟合和预测的相对误差分
别比多元逐步回归法减少了10.04%和7.22%。可见,
Erf-BP能更好地拟合生物量与各个因子之间的关
系, 需要注意的是, Erf-BP对样本代表性要求较高,
估算结果不能超过样本的范围值, 如果预测范围超
过样本区间, 就不能做出正确预测。目前采用基于
高斯误差函数作为隐含层的激活函数与传统输出
层的激活函数logsig组合, 构建Erf-BP估算森林生
物量的研究在国内外还比较少。本研究为进一步研
究高精度的森林生物量估算提供了参考依据。
然而, 模型的精度除了受自身特点的影响外,
还受其他因素的影响。如本研究用于生物量模型建
立的样地生物量数据不是真实测量的, 而是通过地
面乔、灌、草生物量模型计算得到的; 反演区域森
林生物量时, 郁闭度也是通过其他模型间接估算
的, 这些都会造成生物量估算的累积误差, 在今后
的研究中有待于进一步解决。
致谢 国家林业局“948计划”(2011-4-80)和教育部
博士点学科专项基金资助项目(20070225003)资助。
参考文献
Brown S, Sathaye J, Canell M, Kauppi PE (1996). Mitigation
of carbon emission to the atmosphere by forest manage-
ment. Commonwealth Forestry Review, 75, 80–91.
Chen CG (陈传国), Zhu JF (朱俊凤) (1989). Northeast Main
Forest Biomass Handbook (东北主要林木生物量手册).
China Forestry Publishing House, Beijing. (in Chinese)
Ding BY (丁宝永), Sun JH (孙继华) (1989). Studies on bio-
logical productivity and nutrient cycling of artificial forest
ecosystem of Korean pine. Journal of Northeast Forestry
University (东北林业大学学报), 17(Suppl. 2), 18–19. (in
Chinese with English abstract)
Efron B (1979). Bootstrap methods: another look at the jack-
knife. Annals of Statistics, 7, 1–26.
Guo QX (国庆喜), Zhang F (张锋) (2003). Estimation of forest
biomass based on remote sensing. Journal of Northeast
Forestry University (东北林业大学学报), 31(2), 13–16.
(in Chinese with English abstract)
Guo ZH (郭志华), Peng SL (彭少麟), Wang BS (王伯荪)
(2002). Estimating forest biomass in western Guangdong
激活函数
Activation function
最小训练次数
Minimum training times
最大训练次数
Maximum training times
平均训练次数
Average training times
预测平方差和
Squared prediction error
Erf-BP 317 359 338 20.83
传统BP神经网络模型
Traditonal BP neutral network model 509 723 616 21.44
410 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (4): 402–410

www.plant-ecology.com
using landsat TM data. Acta Ecologica Sinica (生态学报),
22, 1832–1839. (in Chinese with English abstract)
Hall RJ, Skakun RS, Arsenault EJ, Case BS (2006). Modeling
forest stand structure attributes using Landsat ETM+ data:
application to mapping of aboveground biomass and stand
volume. Forest Ecology and Management, 225, 378–390.
Haralick RM (1979). Statistical and structural approaches to
texture. Proceeding of the IEEE, 67, 786–804.
Holben B, Tucker CJ, Fan CJ (1980). Spectral assessment of
soybean leaf area and leaf biomass. Photogrammetric En-
gineering and Remote Sensing, 46, 651–656.
Ingram JC, Dawson TP, Whittaker RJ (2005). Mapping tropical
forest structure in southeastern Madagascar using remote
sensing and artificial neural networks. Remote Sensing of
Environment, 94, 491–507.
Jiang H (江洪) (1992). Study on Donglingshan Mountain De-
ciduous Broadleaved Forest Biomass and NPP Research
(东灵山落叶阔叶林森林生物量和NPP的研究). Post-
doctoral research report, Institute of Botany, Chinese
Academy of Sciences, Beijing. (in Chinese with English
abstract)
Lu D, Batistella M (2005). Exploring TM image texture and its
relationship with biomass estimation in Rondonia, Brazil-
ian Amazon. Acta Amazonica, 35, 249–257.
Luo TX (罗天祥) (1996). Patterns of Net Primary Productivity
for Chinese Major Forest Types and Their Mathematical
Models (中国主要森林类型生物生产力格局及其数学模
型). PhD dissertation, The Commission for Integrated
Survey of Natural Resources, Chinese Academy of Sci-
ences, Beijing. 181–184. (in Chinese with English ab-
stract)
Pang Y (庞勇), Li ZY (李增元), Chen EX (陈尔学), Sun GQ
(孙国清) (2005). Lidar remote sensing technology and its
application in forestry. Scientia Silvae Sinicae (林业科
学), 41(3), 129–136. (in Chinese with English abstract)
Singh KP, Ojha P, Malik A, Jain G (2009). Partial least squares
and artificial neural networks modeling for predicting
chlorophenol removal from aqueous solution. Chemomet-
rics and Intelligent Laboratory Systems, 99, 150–160.
Tang SZ (唐守正), Zhang HR (张会儒), Xu H (胥辉) (2000).
Study on establish and estimate method of compatible
biomass model. Scientia Silvae Sinicae (林业科学), 36(1),
19–27. (in Chinese with English abstract)
Wang HW (王惠文), Wu ZB (吴载斌), Meng J (孟洁) (2006).
Partial Least-Squares Regression-Linear and Nonlinear
Methods (偏最小二乘回归的线性与非线性方法). Na-
tional Defence Industrial Press, Beijing. 57. (in Chinese)
Xue L (薛立), Yang P (杨鹏) (2004). Summary of research on
forest biomass. Journal of Fujian College of Forestry (福
建林学院学报), 24, 283–288. (in Chinese with English
abstract)
Yang CJ (杨存建), Liu JY (刘纪远), Zhang ZX (张增祥)
(2004). Study on the estimation of the tropical forest
vegetation biomass by using remote sensing data, mete-
orological data and topographical data. Geography and
Geo-Information Science (地理与地理信息科学), 20(6),
22–25. (in Chinese with English abstract)
Zhang HY (张海燕), Feng TJ (冯天瑾) (2002). A study on BP
networks with combined activitation functions. Journal of
Ocean University of Qingdao (青岛海洋大学学报), 32,
621–626. (in Chinese with English abstract)
Zeng WH (曾文华) (2006). Texture Information Extraction in
Remote Sensing Imageries with Gray Level Co-occurrence
Matrix and Wavelet Transform (基于灰度共生法和小波
变换的遥感影像纹理信息提取 ). PhD dissertation,
Northeast Normal University, Changchun. 11–14. (in Chi-
nese with English abstract)

责任编委: 李镇清 实习编辑: 黄祥忠