免费文献传递   相关文献

A Study on the Forecast Model of Dendrolimus punctatus Occurrence Based on Artificial Neural Network

基于人工神经网络的马尾松毛虫发生量预测模型的研究



全 文 :收稿日期: 20020805
作者简介: 陈绘画( 1968  ) ,男,浙江仙居人,工程师.
林业科学研究  2003, 16( 2) : 159~ 165
Forest Research
  文章编号: 10011498( 2003) 02015907
基于人工神经网络的马尾松毛虫
发生量预测模型的研究
陈绘画1, 朱寿燕2, 崔相富1
(1.浙江省仙居县林业局, 浙江 仙居  317300; 2.浙江省仙居县气象局, 浙江 仙居  317300)
摘要: 运用人工神经网络的原理和方法,根据相关系数法和逐步回归法分别选取与马尾松毛虫有虫
面积、虫口密度、虫株率相关关系密切的气象因子作为样本的输入特征, 分别建立马尾松毛虫有虫面
积、虫口密度、虫株率与气象因子的 BP 网络模型。结果表明:所建立的各 BP模型, 具有令人满意的
拟合精度和预测精度。当隐含层神经元个数为 15个, 预报因子数为 8 个时, 2组预留有虫面积的 2 a
平均预测误差为 3 15% ; 虫口密度 BP模型的隐层神经元个数为 8 个,预报因子数为 6 个时,预留样本
的平均预测误差为 5 91% ; 虫株率 BP模型的隐层神经元个数为 4 个,预报因子数为 5 个时,预留样本
的平均预测误差为 10 65%。
关键词: 马尾松毛虫; 人工神经网络 ; 发生量 ; 预测预报; BP模型
中图分类号: S763   文献标识码: A
  森林害虫预测预报是森林害虫综合管理中极其重要的组成部分。加强对森林害虫发生趋
势和危害程度的研究,在其未大发生前及时加以控制, 可使森林害虫对森林资源危害造成的损
失减少到最低限度, 同时还能使森林害虫的综合管理工作收到事半功倍之效。
马尾松毛虫( Dendrolimus punctatus Walker)是我国南方马尾松( Pinus massoniana Lamb. )林
的最大害虫。马尾松毛虫的发生及其种群数量变化,除受到其自身的遗传特性影响外,还受到
气候、林相、植被、食料和天敌 5类因子的影响[ 1]。但林相、植被、食料和天敌 4类因子是定性
变量,很难进行数值表现,更难以预测其变化,而气象因子与马尾松毛虫的发生、生长及种群数
量变化的关系也十分密切,故前人根据气象因子与马尾松毛虫发生量的相互关系,利用逐步回
归分析[ 2]、判别分析[ 3]、模糊聚类分析[ 4]、马尔可夫链分析[ 5]等多种方法对其发生趋势或发生
量进行预测预报。但气象因子与马尾松毛虫的关系并非线性关系, 所以利用这些方法预测马
尾松毛虫的发生量, 由于还没有充分利用气象因子与马尾松毛虫有虫面积之间的相互关系,无
论是预测模型的拟合精度还是发生量的预测精度均有待进一步的提高,而对马尾松毛虫的虫
口密度、虫株率的预测预报则未见报道。
人工神经网络(简称神经网络)是一种基于生理学上的神经系统的理论抽象模型, 它是由
大量被称为神经元的简要信息处理单元通过高度并联、互联而成的非线性动力学网络系统,具
有很强的自学习、自组织、自适应及容错性等特点,善于联想、综合和推广[ 6, 7] ,且特别适用于
非线性问题的处理, 并已在农业病虫害发生趋势预测方面取得了良好的效果[ 8, 9]。因此, 本文
利用本县 1983年至 2002年的历年马尾松毛虫调查资料, 根据神经网络的原理和方法来研究
马尾松毛虫的有虫面积以及有虫面积的虫口密度、虫株率与气象因子之间的关系,分别建立马
尾松毛虫有虫面积、虫口密度、虫株率的预测模型,为人工神经网络理论在森林害虫预测预报
中的应用进行积极的探索。
1  材料与方法
11  材料来源
马尾松毛虫资料来自浙江省仙居县森林病虫防治站,气象资料来自浙江省仙居县气象局。
该县于1982年发现有马尾松毛虫危害,自 1983年起, 每年均在相对固定的时间内调查各代虫
情的危害情况。
12  预报因子的选择
预报因子的选择是发生量预测结果正确与否的关键。马尾松毛虫在本县 1年发生 2代,
由于越冬(后)代马尾松毛虫对马尾松林当年生长威胁性大, 是生产中防治的重点, 故将越冬
(后)代马尾松毛虫的有虫面积、虫口密度、虫株率作为因变量。从上年4月开始至当年 3月的
旬平均气温、旬降雨量、旬平均相对湿度等 8个气象因子作为预报因子, 即自变量。因自变量
个数太多(共计 288个) , 因此分 2步选取预报因子。第 1步, 先用相关系数法选取,凡自变量
与因变量的相关系数大于 R09的即选入。第 2步, 将相关系数法选出的自变量与因变量进行
逐步回归,选出与因变量相关最密切的气象因子作为预报因子。
12  BP 算法[ 6]
BP( Back Propagation)算法是一种采用误差反向传播算法的人工神经网络模型。它由一个
输入层,一个输出层和一个或多个隐层组成。每层有若干个互不连接的神经元节点,各相邻层
的节点之间单方向互联。这个算法的学习过程, 由正向传播和反向传播组成。在正向传播过
程中, 一个输入信息从输入层经隐单元层逐层处理, 并传向输出层, 每一层神经元的状态只影
响下一层神经元的状态, 在输出层得到网络输出。如果网络输出与期望输出有偏差,则转入反
向传播,将误差信号沿原来的连接通路返回, 通过修改各层神经元的权值, 使网络输出与期望
输出尽量一致。通过反复的修改即学习训练后,使得误差信号最小。
BP 算法的步骤可概述如下[ 10~ 13] :
( 1)权值和阈值初始化:随机地给输入层到隐含层之间的连接权值 W1l , m、隐含层到输出层
之间的连接权值 W2m, n和隐含层神经元的阈值 m、输出层神经元的阈值 n 赋以初始值, l 为
输入层第 l 个因子, m 为隐含层第m 个神经元, n 为输出层第n个神经元。
( 2)从学习样本集 x 中取出一个样本 xi ,将其信号输入网络学习训练, 并指明其期望输出
a^k。
( 3)信号向前传播,经输入层到隐含层之间 S型( sigmoid)作用函数
F ( x ) = 1/ [ 1+ exp( - x ) ] ( 1)
运算后,得到隐节点的输出 aj :
aj= f ( W1l , mxj- m ) ( 2)
160 林  业  科  学  研  究 第16卷
然后经隐层到输出层节点的线性激励函数作用后,得到网络输出节点的输出 ak :
ak = f ( W2m,naj-  n) ( 3)
( 4)计算输出节点的输出误差:
!k= ak ( 1- ak ) ( a^k- ak ) ( 4)
( 5)计算隐节点的误差:
Ej = aj ( 1- aj ) ( !kW2kj ) ( 5)
( 6)按下述递推公式向减少误差方向修正权值和阈值:
W
2
m+ 1, n= W
2
m, n+ ∀!ka
j
( 6)
W
1
l+ 1,m= W
1
l ,m+ #Ejxi ( 7)
m+ 1= m+ ∀!k ( 8)
n+ 1=  n+ #E j ( 9)
以上诸式中, ∀、#为在( 0, 1)之间取值的学习率。
( 7)依次输入学习样本,重复上述步骤,直到全部N 个样本学完一遍后,计算均方误差:
R= ( aj- a^j ) 2/ N ( 10)
若 R 指定精度 ∃或达到循环次数要求, 则输出结果。否则,更新学习次数,返回到步骤
( 2) ,将样本重新输入往复学习, 直到式( 10)满足收敛条件为止。
2  结果与分析
21  预报因子的确定
211  有虫面积预报因子的确定  利用相关系数法共筛选出 29个气象因子, 然后进行逐步
回归,最终入选 8个气象因子:当年2月下旬平均气温( X 1) ; 当年 3月上旬平均气温( X 2) ;当年
2月中旬相对湿度( X3) ; 上年 10月中旬降水量( X4) ; 上年 9月中旬日照时数( X 5) ;上年 6月上
旬最低气温( X 6) ;上年 8月中旬最低气温( X 7) ,上年 12月中旬最低气温( X 8)。历年的有虫面
积及预报因子详见表 1。
212  虫口密度预报因子的确定  利用相关系数法共筛选出 17个气象因子, 然后进行逐步
回归, 最终入选 6个气象因子:当年 3月下旬降水量( X 11) ; 上年 4月下旬日照时数( X 12) ; 上年
5月上旬相对湿度( X13) ;上年 9月中旬相对湿度( X 14) ; 上年 9月中旬极端最高气温( X 15) ;上
年10月上旬极端最高气温( X 16)。历年的预报因子及虫口密度详见表 2。
213  虫株率预报因子的确定  利用相关系数法共筛选出 19个气象因子, 然后进行逐步回
归,最终入选 5个气象因子:当年 3月上旬极端最低气温( X21) ;上年 8月中旬降水量( X22) ;上
年4月下旬日照时数( X23) ;上年 5月上旬相对湿度( X 24) ;上年 9月中旬极端最高气温( X 25)。
历年的虫株率及预报因子详见表 3。
22  网络隐层神经元个数的确定
隐层神经元个数的选择是一个十分复杂的问题,不同的研究者有不同的观点[ 6, 10~ 14]。结
合网络的泛化功能, 经多次拟合和筛选, 本文有虫面积 BP 网络的隐层神经元数最终确定为 8
个、虫口密度BP网络的隐层神经元数最终确定为8个,虫株率 BP 网络的隐层神经元数最终确
定为 4个。
161第 2 期 陈绘画等:基于人工神经网络的马尾松毛虫发生量预测模型的研究
表 1 各年份的预报因子与有虫面积的实际值、理论值和预测检验结果
年份 气象预报因子
X 1/ ! X 2/ ! X3/ % X 4/mm X 5/ h X 6/ ! X 7/ ! X 8/ !
有虫面积实际值/
( ∀ 103 hm2)
有虫面积理论值/
( ∀ 103 hm2) 误差
1983 70 93 73 01 276 128 237 - 35 4333 4333 0
1984 50 76 83 447 415 172 208 - 33 4826 4826 0
1985 70 76 83 613 241 192 211 04 4210 4210 0
1986 54 77 78 265 711 155 233 - 47 3106 3106 0
1987 62 111 84 463 354 154 225 - 41 3205 3205 0
1988 78 55 85 96 748 119 204 - 29 4018 4018 0
1989 84 81 81 01 527 153 229 - 59 4310 4310 0
1990 72 89 88 143 241 160 196 - 20 4178 4178 0
1991 84 116 75 26 429 179 231 15 0579 0579 0
1992 107 99 80 35 612 214 204 00 0913 0835 0085 4
1993 72 92 79 00 377 151 223 - 19 2137 2137 0
1994 74 95 84 119 618 155 239 - 19 1088 1089 0000 9
1995 79 110 85 76 391 166 221 07 0748 0748 0
1996 37 103 68 40 527 161 230 05 0756 0834 0103 2
1997 131 135 62 00 718 193 233 - 25 0453 0433 0044 2
1998 100 108 86 14 705 177 218 - 08 0171 0171 0
1999 102 125 64 93 612 181 238 03 0413 0433 0048 4
2000 61 99 78 04 608 191 232 - 23 0747 0747 0
(平均值) 0015 7
2001 # 117 109 75 161 548 167 232 22 1052 0834 0207 2
2002 # 131 129 71 00 341 161 219 - 27 1175 1164 0009 4
  注: # 代表预测样本,下同。
表 2 各年份的预报因子与虫口密度的实际值、理论值和预测检验结果
年份 气象预报因子
X 11/ mm X12/h X 13/ % X 14/ % X 15/ ! X16/ !
虫口密度实际
值/ (条∃株- 1)
虫口密度理论
值/ (条∃株- 1) 误差
1983 372 548 82 88 316 338 361 3614 2 0001 2
1984 310 522 84 88 333 356 311 3110 0 0
1985 296 626 76 88 279 340 429 4288 1 0000 4
1986 736 817 84 85 350 319 293 2930 2 0000 1
1987 570 560 80 84 348 288 116 116 00 0
1988 957 630 82 82 298 328 237 2370 4 0000 2
1989 231 645 82 83 302 283 342 3417 5 0000 7
1990 505 333 82 90 313 279 138 1379 9 0000 1
1991 1086 347 76 86 331 268 013 0245 2 0886 2
1992 1497 317 80 82 349 313 0073 0073 2 0002 7
1993 554 418 79 85 355 337 033 0298 7 0094 8
1994 302 602 81 86 370 279 022 0267 1 0214 1
1995 608 349 66 83 292 282 033 0245 7 0255 5
1996 678 76 75 80 316 307 029 0245 8 0152 4
1997 447 679 73 81 348 308 031 0306 6 0011 0
1998 1399 560 76 76 320 303 014 0139 8 0001 4
1999 672 461 82 79 330 320 134 1339 7 0000 2
2000 156 431 78 81 367 346 034 0340 6 0001 8
(平均值) 0090 2
2001 # 452 340 70 71 317 347 027 0270 6 0002 2
2002 # 1212 299 82 80 320 288 149 1317 1 0116 0
162 林  业  科  学  研  究 第16卷
表 3  各年份的预报因子与虫株率的实际值、理论值和预测检验结果
年份 气象预报因子
X21/ ! X 22/ mm X 23/ h X 24/ % X25/ !
虫株率
实际值
虫株率
理论值 误差
1983 - 21 110 548 82 316 0421 5 0440 5 0045 1
1984 - 23 273 522 84 333 0385 4 0336 1 0127 9
1985 0 190 626 76 279 0485 3 0490 3 0010 3
1986 - 51 142 817 84 350 0562 7 0555 9 0012 1
1987 - 02 45 560 80 348 0339 0 0325 7 0039 2
1988 - 11 102 630 82 298 0508 9 0506 9 0003 9
1989 - 20 388 645 82 302 0437 4 0438 1 0001 6
1990 0 990 333 82 313 0312 0 0288 3 0076 0
1991 45 1532 347 76 331 0087 6 0087 1 0005 7
1992 29 143 317 80 349 0042 6 0038 7 0091 5
1993 - 12 894 418 79 355 0235 0 0229 2 0024 7
1994 - 19 646 602 81 370 0157 6 0150 4 0045 7
1995 - 13 267 349 66 292 0236 0 0289 2 0225 4
1996 - 09 432 76 75 316 0166 4 0167 8 0008 4
1997 13 790 679 73 348 0245 2 0268 0 0093 0
1998 06 2228 560 76 320 0142 9 0142 8 0000 7
1999 32 402 461 82 330 0234 2 0242 1 0033 7
2000 40 782 431 78 367 0103 3 0101 1 0021 3
(平均值) 0048 1
2001 # 01 878 340 70 317 0231 3 0279 4 0208 0
2002 # 14 373 299 82 320 0179 6 0178 7 0005 0
23  网络模拟结果
在带有神经网络工具箱的MATLAB语言 53版环境下, 建立一个含一个隐层的 BP 网络,
将表 1中 8个气象因子作为输入样本, 各年度的有虫面积作为目标矢量。输入层到隐层的传
递函数为 tansig,隐层到输出层的传递函数为 purelin, 学习函数为 learngdm,训练函数为 trainlm
(各训练参数均采用默认值) , 利用 network/ sim 函数计算网络输出。当训练了 853次时,平均均
方误差 MSE= 7191 36 ∀ 10- 4达到最小, 于是中断网络学习,输出 18组学习信息的网络输出
值,结果列于表 1中。
  同理建立虫口密度的 BP 网络模型, 其训练次数为 202次, MSE= 1420 92 ∀ 10- 3, 网络的
模拟结果列于表2;虫株率模型的训练次数为 30次,MSE= 3960 74 ∀ 10- 4,网络的模拟结果列
于表 3。
从表 1~ 3的结果可以看出, 用人工神经网络所建立的有虫面积 BP 模型, 平均模拟误差为
0; 虫口密度模型的平均模拟误差为 902% ;虫株率模型的平均模拟误差为 481%。说明用人
工神经网络方法模拟马尾松毛虫的有虫面积、虫口密度、虫株率,其效果是非常理想的。
24  预报与验证
经过训练后的 BP网络,还具有联想学习功能(网络的泛化学习功能) , 即可以预测出没有
参与建模年份的有虫面积、虫口密度、虫株率。
利用 BP 网络的联想学习功能,计算出表1中预留的 2个年份有虫面积的理论值: 2001年,
0834∀ 103 hm2, 预测误差为 2072%; 2002 年, 1164 ∀ 103 hm2, 预测误差为 094%。两年平均
163第 2 期 陈绘画等:基于人工神经网络的马尾松毛虫发生量预测模型的研究
预测误差为1083%, 预测准确率为 100%。
表2中预留的 2个年份虫口密度的理论值: 2001年, 0270 6条∃株- 1,预测误差为 022% ;
2002年, 1317 1条∃株- 1, 预测误差为 1160%。两年平均预测误差为 591% ,预测准确率为
100%。
表3中预留的 2个年份虫株率的理论值: 2001年, 0279 4, 预测误差为 2080% ; 2002年,
0178 7,预测误差为 050%。两年平均预测误差为 1065%, 预测准确率为 100%。
3  小结与讨论
( 1)经计算用逐步回归预测方法进行预测, 2001年有虫面积的预测值为 0614 5 ∀ 103 hm2,
预测误差为 4159%; 2002年的预测值为 2897 7 ∀ 103 hm2,预测误差为 14661% ,两年平均预
测误差为 941%。虫口密度: 2001年,预测值为- 0024 9条∃株- 1,预测误差为 10922% ; 2002
年,预测值为0595 3条∃株- 1, 预测误差为 6005% ,两年平均预测误差为 8464%。虫株率:
2001年, 预测值为 0159 2, 预测误差为 3117% ; 2002 年, 预测值为 0243 6, 预测误差为
3563%,两年平均预测误差为 3340%。由此可见虽然所选择的预报因子一样,但由于气象因
子与森林害虫的关系并非单纯的线性关系,人工神经网络模型比逐步回归方程模型更充分地
利用了每一年马尾松毛虫的有虫面积、虫口密度、虫株率与各预报因子间相互关系的信息,所
以无论是所建立的 BP模型的拟合精度还是模型的预测精度, BP 模型均能比逐步回归模型取
得令人更满意的效果。
( 2) BP网络具有自适应、抗干扰和容错性强等能力,个别学习样本的分量偏差对网络的学
习效果影响较小,因此模型的稳定性较好。
(3) BP 网络建模精度高低与预报因子的选取有关。因此, 在选择预报因子时宜采用逐步
回归法选取。
( 4)由于马尾松毛虫多发生在人工纯林区中,人类活动对其种群变化影响较大, 如 20世纪
80年代过度的砍伐灌木引起松林内生态平衡的破坏; 长期采取化学、生物等防治, 改变了马尾
松毛虫自然种群变动规律;近年来的封山育林使松林的生态环境有了很大改善。所有这些使
得气候对马尾松毛虫发生的影响作用受到干扰,同时由于缺少系统的有关食料、天敌、林相、植
被等因素对马尾松毛虫发生影响的资料,因此马尾松毛虫发生量的预报精度有待今后进一步
的提高。
参考文献:
[ 1]  陈昌洁. 松毛虫综合管理[M ] . 北京:中国林业出版社, 1990. 345
[ 2]  薛贤清. 在马尾松毛虫测报中应用逐步回归电算方法的研究[ J] . 林业科学, 1984, 20( 1) : 42~ 49
[ 3]  薛贤清,冯晋臣,张石新,等. 马尾松毛虫定量测报的判别分析模型[ J] . 南京林产工业学院学报, 1982( 1) : 134~ 153
[ 4]  薛贤清,杨么明,史顺平,等. 模糊聚类分析在林业害虫测报中应用的研究[ J] . 广东林业科技, 1986( 5) : 1~ 5
[ 5]  江土玲,金崇华. 微电脑在马尾松毛虫预测预报中的应用[ J] . 森林病虫通讯, 1986( 3) : 23~ 24
[ 6]  焦李成. 神经网络系统理论[M ] . 西安:西安电子科技大学出版社, 1996. 1~ 36
[ 7]  楼顺天,施阳. 基于 MATLAB的系统分析与设计    神经网络[ M] . 西安:西安电子科技大学出版社, 1999. 1~ 126
[ 8]  孙凡,陈汉容. 稻瘿蚊发生趋势的 BP 网络预测模型[ J] . 计算机仿真, 2000, 17( 3) : 61~ 63
[ 9]  李祚泳,彭荔红. 基于人工神经网络的农业病虫害预测模型及其效果检验[ J] . 生态学报, 1999, 19( 5) : 759~ 762
164 林  业  科  学  研  究 第16卷
[ 10]  袁曾任. 人工神经元网络及其应用[M] . 北京:清华大学出版社, 1999. 118~ 130
[ 11]  闻新,周露,王丹力,等. MATLAB神经网络应用设计[ M] . 北京:科学出版社, 2000
[ 12]  吴简彤,王建华. 神经网络技术及其应用[ M] . 哈尔滨:哈尔滨工业大学出版社, 1998
[ 13]  王科俊,王克成. 神经网络建模、预报与控制[ M] . 哈尔滨:哈尔滨工业大学出版社, 1996
[ 14]  丛爽. 面向MATLAB工具箱的神经网络理论与应用[ M] . 合肥:中国科学技术大学出版社, 1998. 59
[ 15]  郎奎健,唐守正. IBMPC系列程序集[M] . 北京:中国林业出版社, 1989
A Study on the Forecast Model of Dendrolimus punctatus Occurrence
Based on Artificial Neural Network
 CHEN Huihua 1, ZHU Shouyan2 , CUI Xiangf u 1
( 1. Xianju Forestry Bureau of Zhejiang Province, Xianju 317300, Zhejiang, China;
2. Xianju Meteorological Bureau of Zhejiang Province, Xianju  317300, Zhejiang, China)
Abstract: The principle and methodology of artificial neural network were used to select some meteorological
factors closely correlated to the occurrence area, population density and damage rate by themethods of correla
tion coefficients and step regression. The BP network models of meteorological factors and occurrence area, pop
ulation density and damage rate of Dendrolimus punctatus were established. The results showed that these BP
models established have satisfied fitting and forecast precision. When the amount of implicit layer neuron is 15
and the amount of forecast factor is 8, the mean error of forecast of 2 groups of reserved occurrence zone was
315% in two years. When the amount of implicit layer neuron is 8 and the amount of forecast factor is 6, the
mean error of forecast of reserved occurrence zone was 591% , while when the amount of implicit layer neuron
is 4 and the amount of forecast factor is 5, the mean error of forecast of reserved occurrence zonewas 1065% .
Key words: Dendrolimus punctatus; artificial neural network; occurrence; forecast; BP model
165第 2 期 陈绘画等:基于人工神经网络的马尾松毛虫发生量预测模型的研究