Forest yield prediction with an artificial neural network and multiple regression-文献传递-植物通论文库

摘要：应用传统统计技术常会因样本小和测量数据不符某种分布而受到限制。本文评价一种前馈型神经网络算法以预测落叶阔叶林产量。另外,还介绍一种由定性变为定量的数据变换方法,以用相对小的样本建立多元回归预测模型。数据变换方法有助于改善多元回归模型的预测效果。在本实验的条件下,研究结果表明神经网络技术能够产生最好的预测效果.

Abstract:Use of traditional statistical techniques is often limited by shortage of observation samples and difference in data measurement scales. Neural network techniques have been extensively explored in many fields for prediction and classification as an alternative to statistical methods. In this paper, a feed forward neural network algorithm for predicting hardwood yield is introduced and evaluated. In addition, we report a data transformation method developed for converting qualitative variable data to quantitative data for use in multiple regression when relatively few samples are available for building prediction models. The method that converts qualitative data into quantitative data is helpful to improve hardwood yield prediction accuracy by multiple linear regression models. In this study, the best prediction results using the neural network technique are obtained.

全文：应用神经网络和多元回归技术预测森林产量 3
浦瑞良 3 3 　宫　鹏　(美国加利福尼亚大学森林与环境资源监测与评价中心 ,伯克利 CA94720 - 3110)
R. Yang 　(加拿大国家林务局 ,阿尔伯达 T6H3S5)
【摘要】　应用传统统计技术常会因样本小和测量数据不符某种分布而受到限制. 本文评价一种前馈型神经网
络算法以预测落叶阔叶林产量. 另外 ,还介绍一种由定性变为定量的数据变换方法 ,以用相对小的样本建立多
元回归预测模型. 数据变换方法有助于改善多元回归模型的预测效果. 在本实验的条件下 ,研究结果表明神经
网络技术能够产生最好的预测效果.
关键词　神经网络　多元回归　森林产量预测　数据变换
Forest yield prediction with an artif icial neural network and multiple regression. R. Pu , P. Gong ( Depart ment of
Envi ronmental Science , Policy , and M anagement , 151 Hilgard Hall , U niversity of Calif ornia , Berkeley
CA 9472023110 USA ) , R. Yang ( Canadian Forest Service , Northwest Region Edmonton , A lberta , Canada T6H
3S5) . 2Chin. J . A ppl . Ecol . ,1999 ,10 (2) :129～134.
Use of traditional statistical techniques is often limited by shortage of observation samples and difference in data mea2
surement scales. Neural network techniques have been extensively explored in many fields for prediction and classifica2
tion as an alternative to statistical methods. In this paper , a feed2forward neural network algorithm for predicting
hardwood yield is introduced and evaluated. In addition , we report a data transformation method developed for con2
verting qualitative variable data to quantitative data for use in multiple regression when relatively few samples are avail2
able for building prediction models. The method that converts qualitative data into quantitative data is helpful to im2
prove hardwood yield prediction accuracy by multiple linear regression models. In this study , the best prediction results
using the neural network technique are obtained.
Key words 　Neural network , Multiple regression , Forest yield prediction , Data tranformation.
　　3 国家杰出青年科学基金 B 类资助项目 (49825511) 和美国加州
IHRMP 资助项目.
　　3 3 通讯联系人.
　　1999 - 01 - 22 收稿 ,1999 - 02 - 26 接受.
1 　引　　言
　　在森林经营管理中 ,森林资源预测极为重要 ,譬如
森林生产率预测. 传统的森林资源预测方法以统计方
法为主. 用得最多的是多元回归方法. 例如利用影响森
林群落生长的因素 (如立地、土壤、气候等)预测森林产
量、生长量、总断面及立地指数等. Worrell 和 Mal2
colm[21 ,22 ]应用多元回归法预测英国北部的西加云杉
生产率. 他们以总产量等级 ( GYC) 为因变量 ,海拔、气
候 (转换成气温、风力及温度指标) 及立地因素 (如坡
向、土壤类型)为自变量预测. 最好的模型预测精度可
达 GYC 变异的 78 %～86 %. Hassall 等[11 ]亦研究过西
加云杉预测. 他们在作逐步回归分析之前先作主成份
分析 ,选取几个主成份作为自变量. Fralish[10 ]发现林
分断面积和土壤、地形因素密切相关. 这说明潜在的断
面可被用于评估伊利诺 Shawnee 山区的立地生产率.
Allison 等[3 ]综合统计产量模型和地理信息系统 ( GIS)
技术以在 1 km 格局上预测 GYC. 某些数量化方法 (作
为多元分析的一个分支) ,利用定性变量 ,诸如气候、土
壤和地形因素[14 ,17 ] ,经常被用来预测林地生产率. Pan
和 Raynal [15 ]使用卡尔曼滤波器 ( K2模型) 和多元回归模型 (R2模型)预测响应气候变化的树木生长量. 使用K2模型和 R2模型 ,Pan 和 Raynal 获得预测人工针叶林响应气候变化的生长量.　　使用统计分析方法 ,需要大量的野外测量数据 (如> 100 个样本)以建立多元回归模型. 假如自变量是定性的 (如名义值或类目值) ,则需要大约大于全部自变量总类目的 2 倍的样本 ,以建立理想的多元回归模型[2 ] . 否则 ,多元回归模型可能产生有偏估计值或预测无效.　　人工神经网络技术已在许多领域被应用[16 ] . 当在小样本条件下 ,此技术仍能工作良好[7 ] . 因此 ,神经网络算法已被广泛应用于多资源预测和分类的空间数据综合分析[20 ] . 例如 ,一种有监督误差后向传递神经网络技术[18 ]已被许多研究者探索 :利用遥感数据的土壤覆盖分类[12 ]等 ,自然资源规划和管理[23 ] ,利用森林覆盖图和数字地形数据等的生态系统分类[5 ] ,地质制图[7 ]及地震研究[13 ]等. Guan 和 Gertner[8 ,9 ]应用人工
应用生态学报　1999 年 4 月　第 10 卷　第 2 期　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　
CHIN ESE JOURNAL OF APPL IED ECOLO GY ,Apr. 1999 ,10 (2)∶129～134
神经网络于模拟树木残存率. 他们以神经网络的模拟
结果比较由逻辑斯蒂回归模型模拟的死亡率和由指数
模型得到的存活率. 胸高直径、年直径生长量和百分比
完好度被输入神经网络模型以确定树木死亡率和预测
单株木的存活率. 他们的结果推崇应用神经网络方法.
虽然神经网络技术应用成功率不尽相同 ,但是基于利
用地理、土壤和林业数据预测森林产量的复杂性以及
该数据的特性 ,我们决定测试神经网络算法. 因此 ,本
研究的目的是 :1) 基于有限的样本数据评价神经网络
算法用于森林产量预测的有效性 ;2) 当改变网络的结
构参数时评价该算法在森林产量预测中的敏感性 ;3)
发展定性变量数据变换方法以进行多元回归分析 ,在
样本相当小的前提下 ,比较神经网络算法和多元回归
方法之结果.
2 　研究地区与方法
2. 1 　研究地区及数据采集
　　森林产量数据测自加拿大阿尔伯达省的阿尔伯达环境保
护、土地和森林署设置的固定样地. 自 1960 年以来已建立了大
约 450 个这种固定样地 ,分布在该省林区的多个生态带内以监
测森林动态变化. 固定样地面积为 0. 10hm2 (幼林地) 、0. 20hm2
(成林地) . 详细调查每块固定样地以评价其土壤、自然地理及
植被特性.
　　每 5～10 年定期调查一次. 固定样地的调查因子包括树
种、胸高直径、树高、树冠高度、树冠类型及林相等. 这些调查数
据根据当地的材积方程转换成产量估计值. 在样地建立时 ,根
据森林类型 (云杉、松、落叶阔及混交林) 进一步将固定样地分
成数类. 根据 87 个样地数据 ,本次研究仅检查落叶阔叶林类的
产量.
2. 2 　前馈型神经网络算法
　　我们研究的目的之一是要发展一种能够利用多种尺度多
种来源的数据预测森林产量 . 因此 ,选用了训练基于一种广义δ
法则 ( GDR)的前馈型有监神经网络算法. 该 GDR 法则已在其
它书中[6 ,16 ]有详述. 图 1 说明隐层只有一层的前馈型神经网络
结构. 基本元素由节点 (即神经元) ,“o”,链接 ,“→”,一般来说 ,
节点被安排在数个层面上. 输入层的每个节点接受相应于输入
向量 , X p = { x p1 , x p2 , . . . x pm } , 每个分量的单个值. 每个分量
可以代表自变量 (如地形等级、中尺度立地位置等. 输出层的节
点可以代表 K 个不同森林类型产量 ( Y p = { yp1 , yp2 , . . . ypk} ) .
在本次研究中 ,我们只用一种落叶阔叶林类型 ,即 K = 1. 隐层
数可以多于 1 层 ,节点数可根据实验确定. 在某层上的节点输
出通过链接被传输到下一个层上的节点. 节点输出值的大小取
决于权重因素 ,可以被放大、缩小或抑制. 网络迭代是为了改变
权重系数. 一个新权重系数通常由两部分组成 :老权重加上权
重改变量. 由于大的学习率 (η) 响应高速学习但可能引起系统
振荡. 因此 ,Rumelhart 等[18 ]建议用包括某些前次网络迭代学
习的权重改变量乘上动量系数 (α)修正新的权重改变量.
图 1 　3 层结构的前馈型神经网络
Fig. 1 A three2layer structure feed2forward neural network.
o :表示神经元 (节点) Denotes nodes of neural network , →:代表节点间的
链接 Represents links between the nodes.
　　总之 ,神经网络方法并非为线性过程. 网络的学习过程是 :
从一组随机选定的权重开始 ,一次输入一个训练样本 ,并以前
馈方式评价其输出. 使用始于网络输出与样本实际产量之差值
的后向误差传递过程 ,网络对于一个具体样本为每个权重系数
计算增量. 对于所有的训练样本重复此过程 ,为每个权重系数
产生一个改变量. 这种迭代训练一直进行到训练样本的网络输
出值等于或接近已知产量值为止. 然而 ,此种学习过程并不能
确保取得全局最佳效果 [6 ,16 ] .
2. 3 　多元回归预测
　　多元回归模型亦被用于森林产量预测 . 一组输入数据 (立
地因素等)为自变量. 因变量为落叶阔叶林产量.
2. 4 　定性变量的变换
　　在多元回归分析中 ,多种变量类型可用作自变量 ,包括连
续、离散、类别以及名义变量等. 为建立一个合理的多元回归模
型 ,可先对定性变量作必要的变换.
　　在预测立地指数及评价立地生产率的方法中 [1 ,17 ]经常要
利用有限的样本数据构建回归模型 ,其中数量化方法是很有用
的.在本次研究中 ,我们为每个定性变量的类目指定一个定量
值. 该值是定性变量中一个类目的平均产量与该变量中所有类
目中平均产量最低的那个量的比值. 由此定义 ,易见最小定量
值为 1 ,而最大值却无限. 假如一个定性变量的每个类目响应于
因变量 (产量)的一个特殊范围 ,则指定该类目的值将很易与其
它值分开. 否则 ,为各个类目指定的定量值间的差异不大 ,因
而在产量预测中影响可能不大. 实践中每个类目的均值可从现
有的林调数据获得或通过预备调查估得. 例如 ,定性变量 X1 有
3 个类目. 此 3 个类目被赋于的定量值分别为 1. 70 (280. 00/
164. 94) 、1. 12 (184. 94/ 164. 94) 和 1. 00 (164. 94/ 164. 94) . 3 个
类目的均值 280. 00、184. 94 和 164. 94 分别通过平均 14、25 和
48 个样本产量而得.
2. 5 　算法测试
　　在 87 块可被用于本研究的样地中 ,我们随机选取不同大
小样本数套用于神经网络和多元回归模型的建立. 每套剩余的
样本作验证模型之用. 这些算法和模型执行性能优劣可用总平
均精度 ( OA A )来评价. OA A 定义为 :
　　OA A = (1 - sdymean) ·100 %
031 应　用　生　态　学　报　　　　　　　　　　　　　　　　　　　10 卷
式中 , sd =
6n
i = 1
( yi - y^ i) 2
n
; ymean =
6n
i = 1
yi
n
; yi ( i = 1 ,2 , . . . , n) 为产
量观测值 ; y^ i ( i = 1 , 2 , . . . , n) 为不同方法的预测值 ; n 为测试
样本数.
3 　结果与分析
3 . 1 　神经网络算法的测试
　　本研究应用一个 3 层网络结构. 输入层节点数等
于 12 ,相应于 12 个输入变量 :地形等级、中尺度立地
位置、大尺度立地位置、湿度、营养级、排水、坡向、树
龄、海拔、坡度及经纬度. 表 1 列出了 7 个定性变量
( X1～ X7)的类目. 输出层只有一个节点 ,代表落叶阔
叶林 (白杨、白桦等)产量 (m3·hm - 2) . 表 2 上半部分列
出了用于神经网络的数据格式. 在输入输出层上节点
的数据被线性压缩到[ 0 ,1 ]范围 ,以使网络在训练阶段
容易收敛[4 ] . 为使训练样本和测试样本有相同的压缩
范围 ,首先从全部样本中找出最大、最小样本值. 压缩
处理可能会引起潜在的问题 :假如存在的极值产量超
出全部样本定义的最大、最小范围 ,则该产量再也不能
被预测. 然而在实践中 ,人们根据野外观测或专家意见
总能找到或假定一个最大最小值以覆盖所有可能出现
的产量观测值.
表 1 　落叶阔叶林定性变量的类目及等级系数
Table 1 Classes and class coeff icients of each qualitative variable ( factor) for hardwood species ( n = 87)
因　素
Factor
代　号
Symbol
类目名称
Name of class
均　值
Mean (m3·hm - 2)
样本数
No. samples
等级系数
Class coeff .
地表形态级 Surface shape class(X1) X11 平直 Straight 280. 00 14 1. 70
X12 凹 Concave 184. 94 25 1. 12
X13 凸 Convex 164. 94 48 1. 00
中尺度立地位置 Meso site position X21 脊地 Crest 115. 00 3 1. 00
(X2) X22 上坡 Upper slope 213. 62 13 1. 86
X23 中坡 Middle slope 186. 30 30 1. 62
X24 下坡 Lower slope 238. 15 20 2. 07
X25 坡脚 Toe 163. 75 4 1. 42
X26 平地 Level 137. 12 17 1. 19
大尺度立地位置 Macro site position X31 上坡 Upper slope 229. 75 8 1. 45
(X3) X32 中坡 Middle slope 204. 90 30 1. 30
X33 下坡 Lower slope 172. 67 3 1. 09
X34 谷地 Valley floor 329. 50 4 2. 08
X35 平原 Plain 158. 07 42 1. 00
湿度级 Moisture regime (X4) X41 亚湿地 Submesic 257. 50 8 1. 57
X42 湿地 Mesic 183. 73 60 1. 12
X43 湿润 Subhygric 181. 33 15 1. 11
X44 很湿 Hygric 163. 75 4 1. 00
营养级 Nutrient regime (X5) X51 亚半自养 Submesotrophic 107. 33 3 1. 00
X52 半自养 Mesotrophic 180. 90 62 1. 69
X53 全自养 Permesotrophic 223. 73 22 2. 08
排水状况 Drainage (X6) X61 良好 Well drained 192. 48 31 1. 41
X62 中等 Moderately well drained 196. 63 35 1. 44
X63 稍差 Imperfectly drained 186. 07 15 1. 36
X64 差 Poorly drained 136. 67 6 1. 00
坡向级 Aspect class(X7) X71 东北 North east 169. 42 36 1. 10
X72 东南 South east 215. 12 34 1. 39
X73 西南 South west 198. 00 9 1. 28
X74 西北 North west 154. 33 6 1. 00
表 2 　使用神经网络算法和多元回归过程预测落叶阔叶林产量的输入样本
Table 2 Samples used as inputs for executing a neural net work algorithm and multiple regression procedure to predict hardwood yield
No
数据变换前 ,类目 Before data transformation , categories
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 Y
1 2 2 5 2 2 1 3 101 930 8 54. 32 116. 27 222
2 1 4 2 1 2 2 2 107 850 8 54. 04 115. 91 316
3 3 3 5 2 3 2 1 56 833 7 54. 77 118. 21 167
4 3 3 3 1 2 2 3 44 640 3 55. 78 114. 28 171
… …
No
数据变换后 ,等级系数 After data transformation , class coefficients
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 Y
1 1. 12 1. 86 1. 00 1. 12 1. 69 1. 41 1. 28 101 930 8 54. 32 116. 27 222
2 1. 70 2. 07 1. 30 1. 57 1. 69 1. 44 1. 39 107 850 8 54. 04 115. 91 316
3 1. 00 1. 62 1. 00 1. 12 2. 08 1. 44 1. 10 56 833 7 54. 77 118. 21 167
4 1. 00 1. 62 1. 09 1. 57 1. 69 1. 44 1. 28 44 640 3 55. 78 114. 28 171
… …
1312 期　　　　　　　　　　　　　浦瑞良等 :应用神经网络和多元回归技术预测森林产量　　　　　　　　　
　　45 个训练样本随机地从总样本中选取 ,剩下的 42
个作为算法的测试用. 隐层节点数由实验确定. 当固定
η= 0. 1 和α= 0. 7 时 ,变化 9 组不同的隐层节点数 ,观
其收敛速度和测试精度 (图 2) . 当取 30 个隐层节点数
时 ,测试精度达到最高.
图 2 　由不同数目的隐层节点数产生的最好测试精度
Fig. 2 Best test accuracies for different number of nodes in an one2hidden2
layer network with the number (in parentheses) of iterations at the training
stage.
括号内的数为训练阶段的迭代数. 使用的神经网络参数 :学习率 = 0. 1 ,
动量系数 = 0. 7 ,输入层节点数 = 12 ,输出层节点数 = 1 The parameters
used for the neural network are :learning rate = 0. 1 , momentum coefficient
= 0. 7 , number of nodes at input layer = 12 , and output layer nodes = 1.
　　当固定 30 个隐层节点及迭代 7000 次时 ,变化η
(0. 1～0. 7)和α(0. 2～0. 8) 值以观其对测试精度的影
响. 结果表明 ,当η= 0. 1 和α= 0. 7 时最佳测试精度可
达 83. 9 %(图 3) . 由图 3 可见 ,所有的测试精度均超过
75 %且由变化学习率引起的精度差异要大于由变化动
量系数引起的差异.
图 3 　由神经网络利用不同的学习率和动量系数产生的落叶阔叶林产
量的测试精度
Fig. 3 Testing accuracies of predicting the yield of hardwood species when
giving different values of learning rate and momentum coefficient .
神经网络结构参数 :隐层节点数 = 30 ,输入层节点数 = 12 ,输出层节点
数 = 1 ,迭代 7000 次 Other fixed structure parameters of the neural net2
work : number of nodes at one hidden layer = 30 , number of nodes at input
layer = 12 , output layer nodes = 1 , and number of iteration = 7000.
Ⅰ. 学习率 Learning rate = 0. 1 , Ⅱ. 学习率 Learning rate = 0. 15 , Ⅲ. 学习
率 Learning rate = 0. 2 , Ⅳ. 学习率 Learning rate = 0. 3 , Ⅴ. 学习率 Learn2
ing rate = 0. 5 , Ⅵ. 学习率 Learning rate = 0. 7 ;Lr : 83. 88 % (学习率 =
0. 1 ,动量系数 = 0. 7) 83. 88 % with learning rate = 0. 1 , momentum coef2
ficient = 0. 7.
　　在固定 30 个隐层节点且在η= 0. 1 和α= 0. 7 条
件下 ,进一步测试训练迭代次数对网络运行结果的影
响. 由图 4 可见 ,随着迭代次数增加以至接近 3000 次
时 ,训练样本精度迅速提高 (达 91. 2 %) ,之后继续迭
代 ,其训练精度仍有提高 ,但进展缓慢. 对于测试样本 ,
当迭代次数低于 5000 次时 ,测试精度改善较快 ,迭代
7000 次时 ,精度达最大值为83. 9 % ,随后迭代增加 ,精
度却缓慢下降. 这说明迭代 7000 次后 ,神经网络通过
学习更适合于训练样本 ,但其减弱了适合测试样本的
一般能力 ,这是神经网络应用中常见的“过渡拟合”问
题. 为防止其训练样本的“过渡拟合”,应使用测试样本
以监测网络的训练过程.
图 4 　作为神经网络训练迭代次数函数的训练和测试精度
Fig. 4 Training and testing accuracies as functions of number of neural net2
work training iterations for predicting the yield of hardwood species (aspen ,
birch etc. ) .
神经网络结构参数 :除隐层节点数 = 30 外 ,其余同图 2 The parameters
used to run the neural network are the same as Figure 2 except number of
nodes at one hidden layer = 30.
Ⅰ.测试样本 Testing samples (42) , Ⅱ. 训练样本 Training samples (45) ;
In. 83. 88 %(7000 次) 83. 88 % with 7000 iterations.
　　为了评价神经网络从小样本中学习的能力 ,随机
选取不同训练样本数 ,并将其对应的剩余样本作为该
网络模型的测试样本. 测试精度列于表 3. 对于每个网
络 ,迭代次数取自最高测试精度. 第 9 抽样方案不同于
随机抽样 ,共选取 8 个样本以确保所有定性变量的每
个类目中有一个样本被选上. 由表 3 可见 ,虽然测试精
度随着训练样本的加大而逐渐提高 ,但在我们的实验
中亦有例外的情形. 当用 52 个训练样本时 ,其测试精
度为 83. 19 % ,比 45 个训练样本得到精度低 0. 69 %.
用 9 个训练样本时 ,获得的测试精度为 52. 12 % ,高于
由17个训练样本的1 . 85 %. 这是因为在随机选取训
练样本时 ,并不能确保较大的样本总能比较小的样本
具有较大的代表性. 在神经网络训练中 ,没有全局最佳
解亦可能是部分原因. 值得注意的是 ,抽样方案 9 能获
得高达 65. 12 %的测试精度. 其精度高出一些训练样
本比它大的方案. 这说明当训练样本较小时 ,确保每个
231 应　用　生　态　学　报　　　　　　　　　　　　　　　　　　　10 卷
表 3 　利用不同样本大小由神经网络和多元回归算法对落叶阔叶林产量的预测精度
Table 3 Predicted accuracies from neural net works and multiple regression with different samples sizes
选样方案
Sampling scheme
训练样本数
Training samples
测试样本数
Testing samples
神经网络 Neural networks
迭代次数
Iterations
精度
Accuracy( %)
多元回归 Multiple regression
变换数据
Transformed data
原始数据
Raw data
1 61 26 3000 86. 64 75. 24 80. 46B
2 52 35 4250 83. 19 75. 22 48. 90B
3 45 42 7000 83. 88 80. 16 -
4 44 43 9000 83. 49 80. 36 -
5 35 52 3000 75. 27 46. 52 -
6 26 61 100 65. 76 21. 40 -
7 17 70 50 50. 27 - -
8 9 78 125 52. 12 - -
9 8 79 150 65. 12 56. 65B -
- :出现负值 ,样本太小 Appear negative value , not applicable to use those sample sizes. B :预测值有偏 ,不可靠 (基于 SAS 系统) Are biased and result from
not unique estimators of the parameters based on the SAS system.
类目有代表性的样本比随机选取样本更有效. 如同估
计网络的其它参数 ,具有选取训练样本的先验知识将
有助于改善神经网络的运作.
3 . 2 　基于多元回归模型的落叶阔叶林产量预测
　　利用和测试神经网络相同的训练和测试样本 ,建
立多元回归模型和计算测试精度 (表 3) . 原始数据 (表
2 上半部分)首先被用来输入 SAS[19 ]的 GLM (一般线
性模型)以建立多元回归模型. 在 9 个抽样方案中 ,均
因样本小而不符构建回归模型的要求 ,导致预测结果
为负值或有偏差. 据董文泉等[2 ]的研究 ,至少要有 58
个训练样本才能估计多元回归系数 ,因为我们有定性
变量的 29 个类目. 然而 ,在我们的实验中 ,即使用了
61 个训练样本 ,无偏差的预测结果仍未得到.
　　但是 ,将定性变量转换成定量变量可以解决样本
小而不够构建模型的要求. 将定性变量按前述方法数
量化后连同其它定量数据一起输入 SAS 的 REG 程
序. REG程序只运行连续变量. 借用先前相同的训练
和测试样本 ,其结果亦列于表 3 以便对照. 对于方案 1
～4 ,较好的预测精度已经取得. 但随着训练样本从 44
下降到 26 ,其预测精度快速下降. 当样本小于 17 时 ,
无法得到可靠结果. 值得一提的是 ,利用非随机抽样方
案 9 (表 3) ,仍能得到一个有偏差的精度为 56. 65 %预
测结果. 这进一步证实了在含有定性变量的回归分析
中非随机选取训练样本的价值.
　　表 4 中列出的回归系数 ,偏相关系数及复相关系
数是从样本选取方案 3 (表 3)算得的. 当比较相关系数
阈值 : R0. 01 = 0 . 716 , r0. 05 = 0 . 339 和 r0. 01 = 0 . 436 时 ,
复相关系数 ( R = 0. 885) 和林龄偏相关系数 ( r8 =
0. 499)在 0. 99 可靠性水平上是显著的. 其余偏相关系
数在 0. 95 可靠性水平上均不显著. 但根据其值之大
小 ,变量 X1～ X4、X7～ X8 和 X10～ X11 ,对于预测
落叶阔叶林产量比 X5、X6、X9 和 X12 较为重要. 对
于本次研究数据 ,林龄、纬度、土壤湿度和地形位置是
表 4 　对定性变量数量化处理后 ,由多元回归过程( REG)产生的结果
Table 4 Results from multiple regression procedure , after quantitative
processing to qualitative varialbes
变　量
Variable
回归系数
Regression
coefficient
偏相关系数
Partial
correlation
coefficieint
地表形态级 Surface shape class(X1) - 52. 5147 - 0. 205
中尺度立地位置 Meso site position (X2) 37. 1775 0. 210
大尺度立地位置 Macro site position (X3) 84. 5349 0. 229
湿度级 Moist regime (X4) 80. 7537 0. 242
营养级 Nutrient regime (X5) 22. 7594 0. 103
排水 Drainage (X6) 74. 8058 0. 167
坡向 Aspect class(X7) - 82. 0257 - 0. 214
年龄 Age (X8) 1. 6697 0. 499 3 3
海拔 Elevation (X9) 0. 0052 0. 061
坡度 Slope (X10) - 4. 1842 - 0. 218
纬度 Latitude (X11) - 19. 2239 - 0. 264
经度 Longitude (X12) 0. 5136 0. 016
回归常数 Regression constant (Bo) 857. 1790 0. 885 3 3 (Mc)
训练精度 Training accuracy( %) 80. 21 　n/ a
测试精度 Testing accuracy( %) 80. 16 　n/ a3 3 通过 99 %可靠性水平测试 ; n/ a :不适合. Passed significance test at
0. 99 confidence level ; n/ a2Not applicabl ; Mc :复相关系数 Multi2correla2
tion coefficient .
影响落叶阔叶林产量的主导因素.
　　通过比较表 3 中不同预测方法的测试精度 ,易见
神经网络算法在利用非常小的训练样本工作时有其独
特的优点. 当获取大量训练样本太昂贵时神经网络的
这一重要特征尤为重要. 当对定性变量数据作数量化
变换后 ,多元回归模型的可执行性有了较大改善. 结果
说明使用本文介绍的定性变量数量化方法能部分解决
由于样本不足不能构建多元回归模型的问题.
　　与多元回归方法相比 ,虽然神经网络一般能产生
较好的预测精度 ,但它无法确定输入变量的相对贡献 ,
连接相邻两层上的节点的权重因素亦很难被解释. 而
利用回归分析可以描述自变量的相对重要性.
　　本次研究使用的有限样本量并不允许我们充分比
较神经网络方法和多元回归模型的可执行性. 但考虑
到采集大量野外数据的困难性 ,从已经获得的结果看 ,
比起多元回归模型 ,特别是在样本相当小时 ,神经网络
方法似乎有一定的优点. 当定性变量被包含在多元回
3312 期　　　　　　　　　　　　　浦瑞良等 :应用神经网络和多元回归技术预测森林产量　　　　　　　　　
归分析时 ,数据变换方法亦有一定的应用潜力.
4 　结　　论
4 . 1 　基于 87 个野外样地资料和 12 个自变量 (其中 7
个为定性变量) ,我们评价了一个误差后向传递神经网
络算法在落叶阔叶林产量预测中的应用潜力. 当学习
率取 0. 1 ,动量系数取 0. 7 ,30 个单隐层节点 ,从总数
为 87 个样本中随机选取 35 个以上的训练样本时 ,我
们取得了大于 75 %的产量测试精度. 这说明神经网络
算法对于具有定性变量且训练样本较小时仍能工作良
好. 从总样本中随机分出 45 个为训练样本 ,剩余 42 个
为测试样本 ,我们通过变化隐层上的节点数 (从 10～
100) 、学习率 (0. 1～0. 7) 和动量系数 (0. 2～0. 8) 的变
化对网络可执行性的影响 ,发现所有这些结构参数的
组合均能导致大于 75 %的测试精度. 这说明神经网络
算法用于落叶阔叶林产量的预测是可行的.
4 . 2 　利用与测试神经网络相同的训练样本和测试样
本 ,我们亦测试了多元回归模型. 结果表明 ,使用变换
数据构建的多元回归模型比直接使用原始数据构建模
型有效. 因此 ,当样本相对小时且一些变量为定性时 ,
定性数据变换方法是有用的.
4 . 3 　考虑使用神经网络算法和多元回归分析方法时 ,
建议多元回归分析用于数据探索和评价各个自变量对
落叶阔叶林产量预测的相对贡献 ,而神经网络算法则
被用来预测落叶阔叶林产量.
参考文献
1 　成子纯等. 1980. 湖南杉木 (实生林) 数量化立地质量评价表的编
制. 中南林业科技 , (3) :8～15.
2 　董文泉、周光亚、夏立显编著. 1979. 数量化理论及其应用. 长春 :吉
林人民出版社.
3 　Allison , S. M. , Proe , M. F. and Matthews , K. B. 1994. The pre2
diction and distribution of general yield class of sitka spruce in scotland
by empirical analysis of site factors using geographic information sys2
tem. Can. J . For. Res . , 24 : 2166～2171.
4 　Azimi2Sadjadi , M. R. , Chaloum , S. and Zoughi , R. 1993. Terrain
classification in sar images using principal component analysis and neu2
ral networks. I EEE Transactions on Geoscience and Remote Sensing ,
31 : 511～515.
5 　Chen , J . , Gong , P. , Nie , J . and Blais , J . A. R. 1993. Application
of neural networks in forest ecological classification. Technical Papers
of ASPRS/ ACSM Annual Convention , New Orleans , Louisiana , Vol.
3. pp . 65～71.
6 　Eberhart , R. C. and Dobbins , R. W. 1990. Neural Network PC
Tools. Academic Press , Inc. , San Diego. pp . 35～58.
7 　Gong , P. 1996. Integrated analysis of spatial data from multiple
sources : using evidential reasoning and an artificial neural network for
geological mapping. Photogra. Engn. Rem . Sens . , 62 :513～523.
8 　Guan , B. T. , Gertner , G. 1991a. Using a parallel distributed pro2
cessing system to model individual tree mortality. Forest Science , 37 :
871～885.
9 　Guan , B. T. , Gertner , G. 1991b. Modeling red pine tree survival
with an artificial neural network. Forest Science , 37 :1429～1440.
10 　Fralish , J . S. 1994. The effect of site environment on forest produc2
tivity in the illnois shawnee hills. Ecol . A ppl . , 4 :134～143.
11 　Hassall , R. B. , Macmillan , D. C. and Miller , H. G. 1994. Predict2
ing sitka spruce yields in the Buchan area of North2East Scotland.
Forest ry , 67 :219～235.
12 　Hepner , G. F. , Logan , T. , Ritter , N. and Bryant , N. 1990. Arti2
ficial neural network classification using minimal training set . Pho2
togra. Engn. Rem . Sens . , 56 : 469～473.
13 　McCormack , M. D. , Zaucha , D. E. and Dushek , D. W. 1993. First2
break refraction event picking and seismic data trace editing using neu2
ral networks. Geophysics , 58 : 67～78.
14 　Page , G. 1976. Quantitative evaluation of site potential for spruce and
fir in Newfoundland. Forest Science , 22 :131～143.
15 　Pan , Y. and Raynal , D. J . 1995. Predicting growth of plantation
conifers in the Adirondack Mountains in response to climate change.
Can. J . For. Res . , 25 :48～56.
16 　Pao , Y. 1989. Adaptive Pattern Recognition and Neural Networks.
New York : Addison and Wesley. pp . 113～299.
17 　Pu , R. and Fang , Y. 1992. Application of remote sensing techniques
to forest site survey. Geocarto International , (3) : 19～24.
18 　Rumelhart , D. E. , Hinton , G. E. and Williams , R. J . 1986. Learn2
ing internal representations by error propagation. In : D. E. Rumel2
hart , J . L . McClelland eds. In Parallel Distributed Processing2Explo2
rations in the Microstructure of Cognition. The MIT Press , Mas2
sachusetts , Vol. 1 , pp . 318～362.
19 　SAS Institute , Inc. 1985. SAS User’s Guide : Statistics , 5th Edi2
tion. SAS Circle Box 8000 , Cary , NC. pp . 1～956.
20 　Sui , D. 1994. Recent applications of neural networks for spatial data
handling. Can. J . Rem . Sens. , 20 : 368～380.
21 　Worrell , R. and Malcolm , D. C. 1990a. Productivity of sitka spruce
in Northern Britain 1. The effects of elevation and climate. Forest ry ,
63 :105～118.
22 　Worrell , R. and Malcolm , D. C. 1990b. Productivity of sitka spruce
in Northern Britain 2. Prediction from site factors. Forest ry , 63 :119
～128.
23 　Yin , Y. and Xu , X. 1991. Applying neural net technology for multi2
objective land use planning. J . Envi ron. M an . , 32 :349～356.
作者简介　浦瑞良 ,男 ,1956 年生 ,1982 年毕业于南京林业大
学 ,1985 年硕士毕业. 曾先后在加拿大空间与地球科学研究所、
加拿大卡尔加里大学地球信息工程系访问研究两年. 现任美国
伯克利加州大学环境科学政策与管理系研究员. 现主要从事高
光谱分辨率数据在提取森林冠层结构参数、生化参数及树种识
别中的应用 ,以及利用遥感数据进行生态系统分类和模拟的研
究.发表学术论文 30 余篇 ,合著有“对地观测技术与地球系统
科学”一书. E2mail :rpu @nature. berkeley. edu
431 应　用　生　态　学　报　　　　　　　　　　　　　　　　　　　10 卷

Forest yield prediction with an artificial neural network and multiple regression

应用神经网络和多元回归技术预测森林产量

相关文献