免费文献传递   相关文献

基于优化BP神经网络的香格里拉高山松蓄积量模型研究



全 文 :西北林学院学报 2015,30(6):190~195
Journal of Northwest Forestry University
  doi:10.3969/j.issn.1001-7461.2015.06.35
基于优化BP神经网络的香格里拉高山松蓄积量模型研究
 收稿日期:2015-03-25 修回日期:2015-05-21
 基金项目:国家自然科学基金(31460194);国家自然科学基金(31060114)。
 作者简介:徐云栋,男,在读硕士,研究方向:林业3S技术。E-mail:liyingjiaxue@163.com
*通信作者:舒清态,男,副教授,博士,研究方向:3S技术及森林景观经营。E-mail:shuqt@163.com
徐云栋,舒清态*,李圣娇,张 焱,王永刚
(西南林业大学 林学院,云南 昆明650224)
摘 要:以香格里拉县高山松为研究对象,以Landsat TM 8影像和DEM(30M)数据为信息源,结合森
林资源二类调查数据和地面样地实测数据,借助 MATLAB平台,在前期进行基于遗传算法(GA)和粒
子群算法(PSO)优化BP神经网络模型基础上,采用决定系数(R2)、均方根误差(RMSE)及预测精度
(P)3个指标对优化后的BP神经网络模型及进行评价,并建立了研究区高山松蓄积量估测模型。结
果表明,遗传算法效率(耗时1.9h)低于粒子群算法(耗时1.4h);采用遗传算法优化后的BP神经网
络模型R2、RMSE及P分别为0.636、4.216m3、81.748%,均优于粒子群算法。通过遗传算法优化后
的BP神经网络模型估测香格里拉高山松蓄积量总量为13 317 879.7m3。
关键词:高山松;蓄积量;BP神经网络;遗传算法;粒子群算法
中图分类号:S758.4   文献标志码:A   文章编号:1001-7461(2015)06-0190-06
Models of Pinus densata Stock Volume in Shangri-La County Based on
Optimized BP Neural Networks
XU Yun-dong,SHU Qing-tai*,LI Sheng-jiao,ZHANG Yan,WANG Yong-gang
(Southwest Forestry University,Kunming,Yunnan 650224,China)
Abstract:Taking the stock volume of Pinus densatain Shangri-La County,Yunnan as the research target,
with the data of forest management inventory,Landsat TM8images,DEM (resolution:30meters)and
the ground sample data,we estimated the stock volumes of P.densata using BP neural networks which
was optimized by genetic algorithms(GA)and particle swarm optimization algorithms(PSO)in MAT-
LAB.Three indices,such as the coefficient of determination(R2),the root mean squared error(RMSE)
and predict accuracy of model(P)were selected to evaluate optimized BP neural networks.The stock vol-
ume predict model was established.The results showed that the PSO which costed 1.4hours was more ef-
fective than GA which costed 1.9hours;but the R2,RMSE and P of the model which was optimized by
GA were 0.636,4.126m3 and 81.748%,respectively,better than the model’s which was optimized by
PSO.The stock volume of P.densata which was estimated by GA was 13 317 879.7m3.
Key words:Pinus densata;stock volume;BP neural network;genetic algorithm;particle swarm optimiza-
tion
  森林蓄积量是反映森林资源的丰富程度、衡量
森林生态环境优劣的重要依据,是森林数量评估的
关键指标之一,也是森林资源调查的一项重要内容。
传统的蓄积量调查方法有材积表法,标准木法
等[1-3];但这些传统的蓄积量调查方法需要大量的人
力、时间、费用。使用传统调查方法将很难满足大范
围的蓄积量监测[4]。随着遥感技术的出现和发展,
利用遥感方法对蓄积量的估测已越来越多的被应用
到实践中[5]。传统的遥感蓄积量估测有偏最小二乘
回归、多元回归、数字量化、逐步回归法等参数模型;
由于遥感因子和地形因子之间的复共线性的缺陷,
所以用参数模型估测蓄积量难以克服该缺陷[6-8]。
人工神经网络(ANN)是近年来兴起和发展较为迅
速的一种模拟人脑细胞、神经元结构、神经元信号传
输过程及信息处理方式的方法。在林业研究中,
ANN与遥感结合表现出强大非线性拟合的能力,
越来越多地被林业工作者和学者关注。使用神经网
络与遥感结合对蓄积量估测比传统的遥感估测方法
得到的蓄积量精度更高且具有普适性。高山松
(Pinus densata)是滇西北重要的森林用材之一,一
般分布于海拔2 800~3 500m之间,具有喜光、耐
寒、耐贫瘠的特点,是适应性强、更新能力强的先锋
树种。本研究采用遥感因子,地形因子以及地面调
查样地数据,并结合 Landsat TM 8遥感影像,在
MATLAB中使用粒子群(PSO)和遗传算法(GA)
优化的BP神经网络对香格里拉高山松蓄积量进行
估测,以期对林业相关部门和森林资源一、二类资源
调查数据起到补充、参考作用。
1 材料与方法
1.1 研究区概况
香格里拉县位于云南省西北部迪庆州东北部,
是滇、川及西藏的交汇处,99°20′-100°19′E,26°52′
-28°52′N。全县面积为:11 613km2,县内巴拉格
宗雪山海拔最高,达到5 545m,最低为洛吉乡的三
江口,海拔1 503m,相对高差达4 042m。全县森
林覆盖率约为74.99%,森林资源丰富,种类繁
多[9]。其主要林分为长苞冷杉(Abies georgei)林、
苍山冷杉(Abies delavayi)林、丽江云杉(Picea liki-
angensis)林、高山松(Pinus densata)林、云南松
(Pinus yunnanensis)林、落叶松(Larix gmelinii)林
等。
1.2 研究数据
1.2.1 遥感数据的获取及预处理 使用NASA于
2013年2月11号发射的Landsat 8卫星数据,其搭
载的传感器主要有 OLI(operation land imager,陆
地成像仪)和TIRS(thermal infrared sensor,热红外
传感器),选用OLI传感器数据,所使用的遥感数据
主要为OLI的2~7的可见光和红外波段。
采用2014年11月22号分辨率30m的Land-
sat 8数据,由于研究区地理位置特殊,需要3景影
像才能完全覆盖,条带号分别为131/041、132/041
和132/040。数据来源为中国科学院遥感与数字地
球研究所对地观测数据共享计划网站下载得到。对
利用ERDAS对数据进行辐射校正、几何精校正、拼
接裁剪等预处理,得到香格里拉县2014年TM 8影
像(7、5、4波段组合)(图1)。
1.2.2 高山松样地实测数据 采用的实测数据为
2014年10月24日-2014年11月14日之间,香格
里拉县实测高山松数据,包含了30m×30m样地
的平均树高、平均胸径、样地蓄积,及样地中心点
GPS等共120块样地。在高山松海拔分布范围内,
布设了不同龄级的120块样地,使模型的建立更符
合现实意义。样地中心 GPS坐标使用差分 GPS
(DGPS)测得样地4个角点坐标后计算得到。由于
DGPS精度相对手持GPS精度较高,其相对误差均
<1m,远小于遥感因子的30m分辨率,所以本次
样地采样在很大程度上减少了一般手持 GPS误差
较大而带来的样地位置和真实位置之间的差异。
1.2.3 辅助数据 香格里拉县2006年全国第二类
调查数据,对研究区的高山松进行提取,得到研究区
高山松林分布。
DEM(digital elevation model)数据,采用了香
格里拉县30m分辨率的DEM 数据,主要用DEM
衍生出坡度(slope)和坡向(aspect)等地形因子
(图2)。
1.3 研究方法
1.3.1 BP神经网络 BP(back propagation)神经
网络是1986年由Rumelhart和 McCeland为首的
科学家小组提出,是一种按误差逆传播算法训练的
多层前馈网络,是目前应用最广泛的神经网络模型
之一。BP神经网络一种多层前馈神经网络,该网络
的主要特点是信号前向传递,误差反向传播。在前
向传递中,输入信号从输入层经隐含层逐层处理,直
至输出层。每一层的神经元状态只影响下一层神经
元状态。如果输出层得不到期望输出,则转入反向
传播,根据预测误差调整网络权值和阈值,从而使
BP神经网络预测输出不断逼近期望输出[10]。由于
BP网络是一种局部搜索的优化方法,而要解决的问
题为复杂非线性函数全局极值,BP网络容易陷入局
部极值,而达不到全局最优[11]。
BP网络模型处理信息的基本原理是输入信号
Xi通过中间节点(隐层点)作用于输出节点,经过非
线形变换,产生输出信号Yk,网络训练的每个样本
包括输入向量X和期望输出量t,网络输出值Y 与
期望输出值t之间的偏差,通过调整输入节点与隐
层节点的联接强度取值Wij和隐层节点与输出节点
之间的联接强度Tjk以及阈值,使误差沿梯度方向
下降,经过反复学习训练,确定与最小误差相对应的
网络参数(权值和阈值),训练即告停止。此时经过
191第6期 徐云栋 等:基于优化BP神经网络的香格里拉高山松蓄积量模型研究
训练的神经网络即能对类似样本的输入信息,自行
处理输出误差最小的经过非线形转换的信息。
1.3.2 遗传优化算法 遗传优化算法(GA,genetic
algorithms)是 1962 年由美国 Michigan[12]大学
Holand教授提出的模拟达尔文生物进化论的自然
选择和遗传学机理的生物进化过程的计算模型,是
一种通过模拟自然进化过程搜索最优解的方法。遗
传优化算法把自然界“优胜劣汰,适者生存”的生物
进化原理引入优化参数形成的编码串联群体中,按
照所选的适应度函数,并通过遗传中的选择、交叉和
变异对个体进行筛选,适应度值好的个体被保留,适
应度值差的个体被淘汰,新的群体既继承了上一代
的信息,又优于上一代。这样的反复循环,直至满足
条件[13]。
1.3.3 粒子群优化算法 粒子群优化算法(PSO)
是一种进化计算技术(evolutionary computation),
1995年由Kennedy[14]等提出,源于对鸟群捕食的行
为研究。该算法最初是受到飞鸟集群活动的规律性
启发,进而利用群体智能建立的一个简化模型。粒
子群算法在对动物集群活动行为观察基础上,利用
群体中的个体对信息的共享使整个群体的运动在问
题求解空间中产生从无序到有序的演化过程[15],从
而获得最优解。
1.3.4 高山松信息及自变量提取 高山松海拔分
布范围为2 800~3 500m。在其分布上下限会有少
量混交林存在,由于香格里拉县高山松在其分布海
拔范围内几乎为纯林,故利用森林资源二类调查数
据、遥感影像数据,结合Arc GIS提取图3的香格里
拉县高山松林分布。
根据已有研究,对研究区 TM8影像的单波段
进行线性和非线性组合,在不同程度上增强植被信
息或抑制非植被信息,选取包括单波段、波段运算组
合和KT变换等在内的遥感信息作为备选遥感自变
量;利用研究区DEM 数据,提取样地点的海拔、坡
度和坡向作为备选地形因子。对备选变量进行相关
分析,选取相关性较好的备选建模因子作为建模因
子(表1)。
1.3.5 BP和PSO优化神经网络模型的建立 参
与建模的样本点为120个,随机不放回[16]的选取90
个样本点,进行模型建立,再随机选取30个样本点
进行精度检验,这样保证了参与建模的样本与参与
精度检验的样本不重复(图4)。
由于输入数据有实测数据,遥感数据和地形因
子等,因此存在数据单位不一致,为克服不同量纲的
影响[8],在模型训练前要对输入数据进行标准化处
理。MATLAB平台下对输入的样本数据进行归一
化处理,使其值介于[0,1]之间。
表1 高山松蓄积量遥感估测模型备选自变量
Table 1 Independent variables for remote sensing estimation
of P.densatastock volume
类型 自变量 变量说明











X1 TM8-band2
X2 TM8-band3
X3 TM8-band4
X4 TM8-band5
X5 TM8-band6
X6 TM8-band7
X7 (band5×band4)/band7
X8 band5/band3
X9 band7/band4
X10
(band5+band6-band3)/(band5+
band6+band3)
X11
(band5+band6+band4)/(band2+
band3+band7)
X12 (band2-band7)/band5
X13
(band5-band4)/(band5+band4)
(NDVI归一化植被指数)
X14 band5/band4(RVI比值植被指数)
X15 band5-band4(DVI差值植被指数)
地形因子 X16 坡度
X17 坡向
X18 海拔
BP网络输入节点过多会导致训练过程复杂,增
加训练时间,节点太少则不能满足非线性学习网络
系统所需的信息量。由于选出的建模因子有遥感因
子15个、3个地形因子,共18个因子,对蓄积量进
行估测,因此输入层节点为18,输出层节点数为1。
确定网络结构后使用遗传算法对网络进行优化
处理。
初始化种群需设置种群的设置迭代次数、种群
规模、交换概率和变异概率。本研究将初始化相同
种群,对比不同寻优迭代次数后模型的精度,选用模
型的决定系数(R2)、MSE、程序运行时间以及预测
精度4个因子对模型精度做出评价。
在 MATLAB平台下对初始化种群后计算个体
适应度值。根据初始化好的种群进行迭代寻优,得
到最后的适应度值,得到最优个体。将得到的最优
个体赋给BP神经网络的权值和阈值,设置BP神经
网络迭代次数为1 000次,学习率为0.1,收敛目标
为0.000 1。对设置好的网络进行训练、预测、反归
一化,得到优化后BP网络建模结果。
粒子群算法同遗传算法类似,是一种基于迭代
的优化算法。系统初始化为一组随机解,通过迭代
搜寻最优值。但是它没有遗传算法用的交叉以及变
异,PSO的优势在于简单容易实现并且没有许多参
291 西北林学院学报 30卷 
数需要调整。同遗传算法初始化种群一致,初始化 不同寻优迭代次数,对网络进行训练。
图1 香格里拉县遥感影像图
Fig.1 Remote sensing image of Shangri-La Country
图2 香格里拉县DEM图
Fig.2 DEM image of Shangri-La Country
图3 香格里拉县高山松分布
Fig.3 Remote sensing image of Pinus densata
distribution in Shangri-La County
图4 香格里拉县高山松样本地分布图
Fig.4 Distribution of P.densatasamples
in Shangri-La County
2 结果与分析
2.1 模型精度
对GA和PSO分别设置不同优化迭代次数,对
神经网络进行训练,计算模型决定系数(R2)、均方根
误差(RMSE)、程序运行时间以及模型预测精度(P),
得到不同种群寻优下蓄积量模型的精度(表2)。
在迭代次数为500、400、200、100时遗传优化算
法所得模型的决定系数均大于粒子群算法所得的决
定系数,而在迭代次数为300时,粒子群算法的决定
系数为0.75大于遗传算法的0.61;均方根误差均
在不同迭代次数下遗传优化算法均小于粒子群优化
391第6期 徐云栋 等:基于优化BP神经网络的香格里拉高山松蓄积量模型研究
算法;而在程序运算时间方面,粒子群算法优于遗传
算法,这是由于粒子群算法没有遗传算法的交换和
变异,粒子群算法是粒子在解空间追随最优的粒子
进行搜索,收敛速度较快。
当样本点为120,种群大小为50的情况下,迭
代次数为500是遗传算法耗时为4.18h,耗时约为
迭代次数为400时的1.89倍;相同样本数下,迭代
次数为400时耗时约为300次迭代次数时的1.49
倍;在种群大小不变的情况下粒子群算法在迭代次
数为400次时的耗时为1.88,当迭代次数为500次
时耗时约增加1.303倍,达到2.45h;在样本点和种
群不变的情况下,遗传算法耗时为原来的1.89倍,
大于粒子群算法耗时。
模型精度方面,遗传优化算法的模型预测精度均
大于粒子群优化算法的预测精度,遗传优化算法的预
测精度优于粒子群遗传算法的预测精度;模型预测精
度与迭代次数的增加没有正相关性。这是由于迭代
次数增加出现过度学习,而导致模型精度降低。
2.2 预测结果
对预测结果精度检验表2知,GA算法在100
次迭代时的预测精度为82.59%耗时为0.54h,
PSO算法在300次迭代时的预测精度为78.20%耗
时为1.37h,所以将分别进行100次和300次迭代
后的GA和PSO算法得到的最优初始权值和阈值
赋给神经网络,用训练数据训练100次后预测高山
松蓄积量,得到图5、图6的蓄积量预测值与真实值
以及误差值对比图。
表2 不同迭代次数下GA与PSO模型精度对比
Table 2 Model’s accuracy comparison of GA and PSO with different iterations
迭代次数
R2
GA  PSO
RMSE
GA  PSO
运行时间/h
GA  PSO
P/%
GA  PSO
500  0.74  0.67  3.15  4.026  4.18  2.45  84.89  74.36
400  0.63  0.56  3.61  4.088  2.21  1.88  80.83  74.17
300  0.61  0.75  3.62  4.180  1.48  1.37  80.46  78.20
200  0.53  0.51  5.63  6.667  1.10  0.88  79.97  64.26
100  0.67  0.47  5.07  7.020  0.54  0.49  82.59  71.37
图5 遗传算法优化下蓄积量预测结果
Fig.5 The predict result of stock volume by GA
图6 粒子群优化下蓄积量预测结果
Fig.6 The predict result of stock volume by PSO
491 西北林学院学报 30卷 
  图5可看出,使用遗传算法预测蓄积量时,9号
测试样本点预测值异常,误差较大,其余样本点预测
值均与实测值接近,且小于实测值,其误差值均<5。
图6可看出,使用粒子群得到的预测值没有出现异
常值,其预测值也均小于实测值。30个测试样本蓄
积量的误差值在0~10之间。比遗传算法误差大。
2.3 香格里拉县高山松蓄积量估测
由于遗传优化算法估测精度比粒子群优化算法
估测精度高,所以使用遗传算法估测香格里拉县高山
松蓄积量。由于香格里拉高山松面积较大,一次计算
数据量较大,所以使用分块估测的方法,将香格里拉
县分割为不同小块估测该区域高山松蓄积量,进行累
加,得到香格里拉高山松蓄积量。最终得到的香格里
拉县高山松蓄积量总量为13 317 879.7m3。
3 结论与讨论
遗传算法优化下的BP神经网络估测香格里拉
县高山松蓄积量精度优于粒子群算法优化下的BP
神经网络估测精度。使用遗传优化算法得到的香格
里拉县高山松蓄积量总量为13 317 879.7m3。
使用BP神经网络对蓄积量预测,尚无统一的
参数设置模式,仅凭借经验、试验对比,如何找到一
种普遍适用的参数设置模式,对研究区蓄积量估测
进行高效快速的估计,或为下一步研究重点。
使用GA或PSO优化BP神经网络后学习时间
明显增加,如何在保证精度的前提下进一步减少算
法学习时间,提高预测效率,以便对大面积高精度的
蓄积量估测提供更好的技术支持显得尤为重要。
较高的优化迭代次数下,模型预测精度反而降
低,这是因为迭代次数过高会导致出现过度学习的
现象,因此找到适合的优化迭代次数使模型预测精
度高、模型相关系数高、耗时少的模型对香格里拉高
山松蓄积量估测较为重要。
参考文献:
[1] 孟先宇.测树学[M].北京:中国林业出版社,1996.
[2] 于楠楠.基于TM数据的森林蓄积量估测模型研究—以呼和
浩特市大青山林场油松人工林为例[D].呼和浩特:内蒙古农
业大学,2012.
[3] 于宝义.基于GIS和高分辨率遥感的森林蓄积量定量估测核
心算法研究[D].西安:西安科技大学,2013.
[4] 王维枫,雷渊才,王雪峰,等.森林生物量模型综述[J].西北
林学院学报,2008,23(2):58-63.
WANG W F,LEI Y C,WANG X F.et al.A review of forest
biomass model[J].Journal of Northwest Forestry University,
2008,23(2):58-63.(in Chinese)
[5] 刘琼阁,彭道黎,涂云燕,等.基于片最小二乘法的森林生物
量遥感估测[J].东北林业大学学报,2014,42(7):44-47.
LIU Q G,PENG D L,TU Y Y,Estimation forest biomass by
partial least squares regression[J].Journal of Northeast For-
estry University,2014,42(7):44-47.(in Chinese)
[6] 翟晓江,郝红科,麻坤,等.基于TM的陕北黄龙山森林生物量
模型[J].西北林学院学报,2014,29(1):41-45.
ZHAI X J,HAO H K,MA K,et al.TM based estimation bi-
omass model of the Huanglong Mountain in Northern Shaanxi
[J].Journal of Northwest Forestry University,2014,29(1):
41-45.(in Chinese)
[7] 付虎艳,徐云栋,李圣娇,等.基于SVM 方法的高山松林蓄
积量遥感估测研究[J].西部林业科学,2014,43(4):83-88.
FU H Y,XU Y D,LI S J,et al.Study on the remote sensing
estimation of Pinus densata’s stock volume based on SVM
[J].Journal of West China Forestry Science,2014,43(4):
83-88.(in Chinese)
[8] 岳彩荣.香格里拉县森林生物量遥感估测研究[D].北京:北
京林业大学,2011.
[9] 史峰,王小川,郁磊,等.MATLAB神经网络30个案例分析
[M].北京:北京航空航天大学出版社,2010.
[10] 刘青.人工神经网络遥感影像分类系统的设计与实现[D].
昆明:昆明理工大学,2010.
[11] 琚存勇,蔡体久.用泛化改进的BP神经网络估测森林蓄积
量[J].林业科学,2006,42(12):59-62.
JU C Y,CAI T J.Forest volume estimate based on bayesian
regularization back propagation neural network[J].Scientia
Silvae Sinicae,2006,42(12):59-62.(in Chinese)
[12] 张辉.基于BP神经网络的遥感影像分类研究[D].济南:山
东师范大学,2013.
[13] 李娜.川西亚高山森林植被生物量及碳储量遥感估算研究
[D].成都:四川农业大学,2008.
[14] KENNEDY J,EBERHART R,FBERHAR R C.Particle
swarm optimization [C].Perth,Australia:Processings of
IEEE International Conference on Neural Networks,1995:
1942-1948.
[15] 许炜敏.基于BP神经网络的杉木林蓄积量估测方法研究
[D].福州:福建师范大学,2009.
[16] ALMEIDA A C,BARROS P L C,MONTEIRO J H A,et
al.Estimation of aboveground forest biomass in Amazonia
with neural networks and remote sensing[J].IEEE Latin A-
merica Transactions,2009,7(1):27-32.
591第6期 徐云栋 等:基于优化BP神经网络的香格里拉高山松蓄积量模型研究