Nrediction of Soybean Growth and Development Stages Using Artificial Neural Network and Statistical Models-文献传递-植物通论文库

摘要：预测大豆的物候期对指导大豆生产、安排农事活动等具有重大意义。本研究构建了一种简单、但有效的预测模型，使大豆种植者能够较准确地预测大豆各生育阶段的具体日期。试验地位于美国密西西比Delta研究推广中心(经度: 90°55‘W，纬度: 33°25‘N)。试验进行了5年，以前4年(1998—2001)数据构建模型，第5年(2002)的数据验证模型。为简化模型，杂草、病虫害、干旱等干扰因素被优化排除。采用逐步回归(SR)、神经网络(ANN)以及内插法构建模型。营养(V-stage)和生殖(R-stage)生长阶段分别建模。结果表明，通过播期(PD)和从播种到某阶段的相对平均天数能很准确地预测营养生长各阶段的具体日期；可通过播种日期和成熟期组数值(MG)准确预测生殖生长各阶段的具体日期。3种方法中，神经网络所构建的模型准确度最高，具有较好的推广应用价值。

Abstract:The prediction of soybean phenology is important in many aspects of soybean production. The study objective was to develop predictive models, using a simple and effective modeling technique, which can allow producers to predict soybean growth and development stages in their fields.

全文：作物学报 ACTA AGRONOMICA SINICA 2009, 35(2): 341−347 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由美国密西西比大豆促进委员会研究基金(20021013)资助。
第一作者联系方式: E-mail: joezhang85@126.com
Received(收稿日期): 2008-01-07; Accepted(接受日期): 2008-09-10.
DOI: 10.3724/SP.J.1006.2009.00341
应用神经网络和统计模型预测大豆生长发育阶段
张久权 1,2 张凌霄 2 张明华 3 WATSON Clarence 4
1中国农业科学院烟草研究所, 山东青岛 266101; 2 Delta Research and Extension Center, Mississippi State University, Stoneville 38776,
MS, USA; 3 Department of Land, Air and Water Resources, University of California, Davis 95616, CA, USA; 4 Oklahoma State University,
Stillwater 74078-6009, OK, USA
摘要: 预测大豆的物候期对指导大豆生产、安排农事活动等具有重大意义。本研究构建了一种简单有效的预测模
型, 使大豆种植者能够较准确地预测大豆各生育阶段的具体日期。试验地位于美国密西西比 Delta 研究推广中心(经
度: 90°55W, 纬度: 33°25N)。试验进行了 5年, 前 4年(1998—2001)数据构建模型, 第 5年(2002)的数据验证模型。
为简化模型, 杂草、病虫害、干旱等干扰因素被优化排除。采用逐步回归(SR)、神经网络(ANN)以及内插法构建模型。
营养(V-stage)和生殖(R-stage)生长阶段分别建模。结果表明, 通过播种日期(PD)和从播种到某阶段的相对平均天数能
很准确地预测营养生长各阶段的具体日期; 可通过播种日期和成熟期组数值(MG)准确预测生殖生长各阶段的具体日
期。3种方法中, 神经网络所构建的模型准确度最高, 具有较好的推广应用价值。
关键词: 大豆; 生长期; 成熟期组; 神经网络; 模拟; 播种日期; 物候学
Prediction of Soybean Growth and Development Stages Using Artificial Neural
Network and Statistical Models
ZHANG Jiu-Quan1,2, ZHANG Ling-Xiao2, ZHANG Ming-Hua3, and WATSON Clarence4
1 Tobacco Research Institute, Chinese Academy of Agricultural Sciences, Qingdao 266101, China; 2 Delta Research and Extension Center, Mississippi
State University, Stoneville 38776, MS, USA; 3 Department of Land, Air and Water Resources, University of California, Davis 95616, CA, USA;
4 Oklahoma State University, Stillwater 74078-6009, OK, USA
Abstract: The prediction of soybean phenology is important in many aspects of soybean production. The study objective was to
develop predictive models, using a simple and effective modeling technique, which can allow producers to predict soybean growth
and development stages in their fields. The experiments were conducted at the Delta Research and Extension Center in Stoneville,
Mississippi (latitude: 33°25 N, longitude: 90°55 W) under irrigated conditions. The models were constructed using four-year
field data (1998 to 2001), and validated with the fifth-year data (2002). Potential factors affecting stages of soybean growth and
development were considered for developing the models. Affecting factors, such as weeds, insects, diseases, and drought stress,
were controlled optimally to simplify the modeling procedures. In addition, stepwise regression (SR) analysis, artificial neural
networks (ANN), and interpolation approaches were used to construct the models. The modeling of soybean growth and develop-
ment processes was separated into two distinct periods: vegetative growth stage (V-stage) and reproductive growth stage (R-stage).
The models included ten V-stages (up to V8) and eight R-stages. In the V-stage models, PD (planting date) and mean relative
time-span from planting to a particular stage were the only significant parameters, whereas in R-stage models, PD and MG (ma-
turity group) were significant. The models obtained accurate predictions when only using PD, MG, and mean relative time-span
from planting to a particular stage. The ANN method provided the greatest accuracy in predicting phenological events, indicating
that the ANN method can be effectively applied in crop modeling.
Keywords: Soybean; Growth stage; Maturity group; Artificial neural networks; Modeling; Planting date; Phenology
在大豆生产中, 进行管理措施的决策时需要考
虑物候。通常需要预先安排大田劳作中的人力和机
械, 如喷洒抗病虫草害药剂, 也需要确定人工授粉
和收获的准确时间等。因此, 非常有必要准确预测
大豆各物候期出现的具体时间。
许多遗传和环境因子影响大豆的生长发育。从
遗传学角度来看, 大豆的物候期受一系列成熟基因
的控制[1-3], 但光周期、温度、水分胁迫等环境因素
342 作物学报第 35卷

也不容忽视。有研究[4-7]表明, 光周期对大豆的物候
期影响较大, 与成熟基因同属最显著的影响因子[8]。
在大田试验中, 可以通过设置不同种植日期, 研究
物候期对大豆生长发育的影响, 由此模拟不同地理
环境(或纬度)的日长影响。
已有许多大豆模型用于模拟大豆的生长发育过
程及预测产量[9-13], 但大多较复杂, 所考虑的参数很
多, 因此不适合实际的大田应用。
物候预测是许多大豆生长模型的重要组分之
一。与产量预测相比, 用模型预测大豆的生长阶段
比较容易。然而, 大豆种植者常常由于缺乏所需参
数数据, 无法使用这些模型, 因而无法应用于实际
生产。同时, 简单化的模拟模型不但易于理解, 而且
在大豆物候期预测中的效果不比复杂模型差。
近年来, 随着计算机和信息技术的发展, 新技
术也被应用于构建农业模型, 人工神经网络(artificial
neural network, ANN)即为其中之一[14]。Elizondo等[15]
采用神经网络方法预测了大豆在 3 个试验点的开花与
生理成熟期, 并得出结论认为该方法是可行的。
本研究旨在建立简单有效的物候模型, 帮助大
豆种植者进行大豆生产的有效管理, 同时检验一种
新的建模方法——神经网络在预测大豆生长阶段中
的应用。
1 材料与方法
1.1 地点和数据采集
试验于 1998—2002 年在美国密西西比州斯通威
尔(纬度：33′25″, 经度：90′55″)的 Delta研究推广中
心进行, 供试土壤为壤土。用前 4年的试验数据建模,
第 5 年(2002 年)的数据检测和验证模型。供试品种
和成熟期组见文献[16]。成熟期组的数值越大, 该品
种对光周期越敏感, 越晚熟。
4 月初以前播种的所有种子均用杀菌剂处理 ,
以免出苗时发病。5月下旬开始, 用高架喷灌系统按
需灌溉以避免水分胁迫。行距 50 cm, 小区长 10 m,
每小区 3~4 个重复, 因年度而异。在 3~4 叶龄期根
据需要喷洒除草剂。
每隔 3 d记录一次物候状况, 采用 Fehr等[17]的
大豆生长期分类系统确定物候期, 并特别注意以下
几点：(1)前期, 包括播种日期(PD)和出苗(VE); (2)
营养期 , 从子叶展开(VC)至第 1 片真叶出现(V1),
直至第 8片真叶出现(V8); (3)生殖生长期, 包括开花
(R1和 R2)、结荚、生长(R3~R4)、鼓粒(R5~R6)以及
成熟(R7和 R8)。
1.2 从播种到某阶段的相对平均天数的计算
由于受光周期影响 , 各阶段历期(时间跨度)不
固定, 取决于 PD和MG(成熟期组数), 这样, 在建模
过程中生长阶段就不能直接作为时间尺度来使用 ,
因此, 用从播种到某个特定阶段的平均相对时间跨
度(归一化的生长期)作为模型参数因子。营养生长各
阶段的计算方法如下：
(1) 根据所有记载的大田数据 , 计算从播种到
V8的总天数, 平均后记作 XPD-V8。
(2) 计算播种至各生长期(如 PD 到 VE, PD 到
VC, PD 到 V1 等)的天数, 然后将各阶段天数平均,
作为各生长期的时间, 例如 YPD-VE作为 PD到 VE的
时间。
(3) 平均相对时间跨度(归一化的生长期)从 PD
到 VE, 记作 x1, 计算方法如下：
1
8
100%PD VE
PD V
Y
x
X
−
−
= ×
生殖生长阶段的计算方法同上, 结果见表 1。
1.3 模型的构建
采用 3种建模方法进行探索和评价。
1.3.1 插值法表 2 中, 首列为播种日期, 第二
列为成熟期组, 首行为生长阶段。如对于 4月 5日播

表 1 营养和生殖生长阶段规一化的生长阶段
Table 1 The normalized growth stage for V-stages and R-stages
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
V-stage PD VE VC V1 V2 V3 V4 V5 V6 V7 V8
Unit 0 16 32 45 55 64 72 80 87 94 100

R-stage PD R1 R2 R3 R4 R5 R6 R7 R8
Unit 0 33 37 50 57 63 80 92 100
V-stage: 营养生长阶段; R-stage: 生殖生长阶段。xi: 平均相对历期; PD: 播种日期; VE: 出苗; VC: 子叶展开; V1: 第 1片真叶展
开; R1, R2: 开花; R3, R4: 结荚、生长; R5, R6: 鼓粒, R7, R8: 成熟。
V-stage: vegetative growth stage; R-stage: reproductive growth stage. xi: mean relative time-span; PD: planting date; VE: emergence;
VC: opening of the cotyledon; V1: opening of the first-leaf; R1, R2: pod setting and growth; R5, R6: seed filling, R7, R8: maturity.
第 2期张久权等: 应用神经网络和统计模型预测大豆生长发育阶段 343

表 2 通过播种日期(PD)和成熟期组数据(MG)来查寻各生长阶段的具体日期的数据库表举例
Table 2 A sample of a lookup table used as a database for retrieving dates of each growth stage by planting date (PD) and
maturity group (MG)
PD
(month/day) MG
VE
(month/day)
VC
(month/day)
V1
(month/day)
R1
(month/day)
R2
(month/day)
04/05 3.4 04/15 04/26 05/04 05/13 05/18
04/10 3.4 04/19 04/29 05/07 05/16 05/22
06/29 6.8 07/03 07/07 07/11 08/12 08/16
缩写同表 1。Abbreviations as in table 1.

种和成熟期组为 3.4的品种, 可查得 V1应该在 5月
4日。该表的制作主要按插值[16], 分 2步进行, 首先
固定成熟期组, 其次为一特定播种日期。例如, 成熟
期组为 3.4的品种的 V1期所有日期可以作如下插值
处理：(1) 找出成熟期组 3.4品种的相邻两播种期(如
4月 5日和 10日, 对应自然天数为 95和 100); (2) 找
出相对应的 V1 阶段大田记录数据(如 5 月 4 日和 7
日, 或自然天数 124和 127, 如果有 2个或多个数据
集 , 则取其平均值); (3) 计算天数增长量：(127 –
124)/(100 – 95) = 0.60; (4) 最后, 在每个播种日期上,
V1出现的日期加 0.60 d, 可得各个播种日期MG 3.4
V1 阶段可能出现的日期, 如 4 月 6 日播种的 V1 应
该出现在 5 月 5 日(5 月 4 日+0.6); 4 月 7 日播种的
V1应该出现在 5月 5日; 4月 8日播种的 V1应该出
现在 5月 6日, 等等。
上述计算可以通过计算机程序轻松完成, 最终
表包含了各播种日期与各成熟期组所有组合的、所
有生长阶段的预测日期。插值仅仅在田间试验所得
数据范围内(播种日期为 3月 6日~7月 5日, 成熟期
组范围在 3.4~6.8)进行, 未进行外延。
1.3.2 回归分析运用 SAS调查评价了各种模型,
包括线性的和对数回归等, 以建立各生长阶段出现
的日期与遗传、环境等因子之间的定量关系。涉及
的预测变量包括播种日期(以自然天数表示), 成熟
期组数值, 种植年份, 热量(以 GDD 表示), 规一化
的生长阶段和气温度。为了简化模型, 其他因素如
土壤湿度、虫害、病害和杂草等已控制在最佳状态,
未列入预测参数中。采用 SAS的前向逐步回归分析
法, 从所有候选参数中确定最后的预测参数组合。
1.3.3 神经网络(ANN) ANN是人脑神经网络的
简化模型[18]。神经元(ANN 的节)由突触(ANN 的权
重)互相连接。一个神经网络经过前例训练进行学
习。训练时, 不断调整节间权重, 直至该模型完全与
前例相符。然后, 就可以用该模型进行预测了。回
归分析与神经网络间存在某些相似性。它们都是为
了确定最显著的预测变量和相应的系数, 而在神经
网络中, 主要任务是确定各层节间的最佳权重, 从
而使预测准确度最高。尽管用神经网络可以确定最
佳输入变量集, 但计算成本很高, 人们常常使用预
先定义好的输入变量。本研究选用 3个输入变量(播
种日期 PD、成熟期组 MG 和归一化的生长期 GS)
来预测某特定生长阶段的具体日期。变量的选用参
考了此前的逐步回归分析结果。本研究运用 BP神经
网络(一种特殊的神经网络[19])构建模型(图 1), 该网
络包含 3层：(1) 输入层, 含 3个节点, 分别接收成
熟期组 MG、播种日期 PD和归一化生长期 GS的输
入数据; (2) 隐层, 有 3 个节点; (3) 输出层, 1 个节点,
用于模拟日期和回传误差至隐层。
神经网络的训练由前馈和反向传播组成。在前
馈中, 节点用 S 形函数计算输出, 并将结果传送至
输出层的节点, 隐层 S 形函数的输入 U 按照下式计

图 1 本研究所用的三层反向传播神经网络模型
Fig. 1 Schema of a back-propagation ANN with 3 layers used
in this study
隐层的每一个节点接受 3个输入(成熟期组、播种日期和生长阶
段), 并使用 S型函数计算输出值, 将结果传递给输出层的节点。
该节点的输出值(日期)与实际日期进行比较, 误差回传, 权重进
行相应地调整。带线箭头表示不同层节点间的信息流。
Each node of the hidden layer received three inputs (maturity group,
planting date, and growth stage), computed the output using a sig-
moid function and passed the results to a node in the output layer.
The output (date) was compared to the actual date, the error was
backtracked, and the weights were adjusted accordingly. Lines with
arrows indicate the information flow from a node in one layer to a
node in the next layer.
344 作物学报第 35卷

算(图 2), 其中 wt0是随机指定的常数, 而 wt1、wt2
和 wt3分别是 MG、PD和 GS的权重：
U = wt0 + wt1×MG + wt2×PD + wt3×GS
输出值(Y)的计算如下式：
1
1 e u
Y −= +
输出层重复该过程, 隐层的输出值 Y 作为输出
层的输入, 输出层的输出是某生长阶段的预测日期
(图 1和图 2)。预测值与实测值进行比较, 直至模型
达到稳定状态。否则, 使用 BP技术来确定误差来源
和调整权重。这些前进或回退的过程交互进行多次,
直至将误差降至最低。

图 2 某节点的 S型函数和计算过程
Fig. 2 A sigmoid function and calculation process for one node
MG：成熟期组; PD：播种日期; GS：数字化的生长阶段; wt：权
重。计算的 Y值为输出层节点的输入, 其输出为生长阶段的日期
的估计值。
MG: maturity group; PD: planting date; GS: growth stage in nu-
merical value; wt: weight. The computed Y is the input for the node
of output layer, which outputs estimated date of growth stage.
2 结果与分析
2.1 内插法
运用内插法计算所得结果见表 2
2.2 逐步回归
SAS 分析结果表明, 成熟期组对营养生长期(至
V8)各阶段的具体日期(因变量)影响不显著, 但对生
殖生长期各阶段的日期影响显著, 因此, 营养生长
期与生殖生长期分开建模。从 VE到 V8营养生长期
建模以播种日期和归一化后的生长期作为自变量。
生殖生长期以成熟期组和播种日期为自变量, 从 R1
到 R8各阶段分别建模。对营养生长期而言, 年度和
成熟期组对特定生长期所达到的日期的影响不显著,
说明营养生长期模型多年数据及成熟期组数据可以
合并。预测各生长期自然天数的最佳回归模型如下：
Date2 = 6183.3960 – 116.6233PD + 138.1695GS
+ 1.4536PD2
R2为 0.9947; 可切分为 PD2=0.8563, GS=0.1365,
PD=0.0029。800个样本总残差是 2.5%, 其中, 87.5%
和 68.5%的样本残差值分别小于 5.0%和 3.0%。
年度对生殖生长期的影响不显著, 多年数据合
并后进行模型构建。在生殖生长期, 用成熟期组、
播种日期和归一化后的生长期作为预测者, 为每一
生长期建立独立方程(表 3)。从表 3的偏相关系数可
以看出, 成熟期组的偏相关系数随生长期的延长而
增加, 与播种日期的关系则相反。从 R1到 R8, 播种
日期对某生长阶段的日期的影响逐渐降低, 但成熟
期组却逐渐升高。通常, 这 3个预测变量的变异解释
了 93%或更多的因变量的变化。R5的 588个样本的
平均残差为 4.6%, 其中, 59%和 40%的样本残差分
别小于 5.0%和 3.0%。其他 R阶段的结果与之相似。
R阶段的模型具有较高的预测准确度(图 3)。实测与
预测日期最大差距小于 8 d, 大多数低于 4 d。
2.3 BP神经网络
用神经网络构建营养生长期和生殖生长期的独
立模型。评价了带有不同参数的各种网络结构, 在
此只报道最优结果。营养生长期最佳模型含一个带
3 个节点的隐层(学习率＝0.1; 动量比＝0.1)。生殖
生长期最佳模型为带 2 个隐层的 4 层网络, 每一隐

表 3 运用逐步回归确定的生殖生长期模型
Table 3 Models fitted by stepwise regression analysis for R stages
Growth stage Equation R2 Partial R2 for PD Partial R2 for MG
R1 Date = 18.4048 + 9.2967MG + 0.8493PD 0.9741 0.8871 0.0870
R2 Date = 24.8938 + 9.3401MG +0.8267PD 0.9762 0.8839 0.0923
R3 Date = 33.6645 + 11.04MG + 0.8192PD 0.9723 0.8463 0.1260
R4 Date = 46.9111 + 11.1957MG + 0.7796PD 0.9619 0.8227 0.1392
R5 Date = 55.0305 + 11.9910MG + 0.7524PD 0.9487 0.7850 0.1637
R6 Date = 80.1182 + 12.9702MG + 0.6784PD 0.9496 0.7301 0.2195
R7 Date = 92.7780 + 14.6368MG + 0.6666PD 0.9389 0.6719 0.2670
R8 Date = 93.2517 + 16.3055MG + 0.6989PD 0.9347 0.6432 0.2895
缩写同表 1。Abbreviations as in table 1.

第 2期张久权等: 应用神经网络和统计模型预测大豆生长发育阶段 345

层带 4节点(学习率＝0.08; 动量比＝0.4)。通过生殖
生长期的数据探讨了误差均方(MSE)和训练次数(时
段)的关系, 结果见图 4。经过 800轮后, 2个误差均
方都接近最小值, 1 000轮后结束训练。

图 3 生殖生长阶段回归方程实测与预测数据对比(4月 16日播种)
Fig. 3 Observed and predicted dates for R-stages using the
regression equation for planting date(16 April)

图 4 生殖生长期模型误差均方与训练轮次的关系
Fig. 4 Mean square error (MSE) vs. epoch for V-stages

所构建的神经网络模型采用播期为 2002年 5月
8日的田间数据进行测试。结果见图 5和图 6。预测
误差变化不一, VC阶段为 0 d; V8为 12 d, 后者超出
了可接受值范围。2002 年 5 月下旬到 6 月初, 天气
反常寒冷, 这可能对预测值具有不良影响, 但 10 个
营养生长期中有 5 个预测误差少于 6 d。2002 年其
他播种日期的预测结果较理想, 而且多数营养生长
期的预测误差都少于 4 d。生殖生长期的预测准确率
较高(图 6), 最大误差为 7 d。其他如刀切法、交叉验
证等途径也有可能提高预测准确性, 但尚待验证。

图 5 营养生长阶段 ANN模型预测与实测数据对比(5月 8日播种)
Fig. 5 Predicted and observed dates for V-stages based on
ANN model for planting date( 8th May)

图 6 生殖生长阶段 ANN模型预测与实测数据对比(5月 8日播
种, 成熟期组 4.9)
Fig. 6 Predicted and observed dates for R-stages based on
ANN model for soybean maturity group 4.9 planted on 8th May

2.4 建模方法比较
为了比较 3 种模拟方法的准确度, 我们构建了
多种模型。根据训练和验证数据集, 选择了最优参
数。使用 2002年的数据测试预测准确度(表 4), 由于
篇幅有限, 表 4 仅仅列出了成熟组 3.9、在 4 月 16
日播种的数据。其他结果类似。总的来说, ANN 模
型准确度最高, 结果最可靠, 尤其对生殖生长阶段
而言。逐步回归分析准确度低一些, 尤其是生殖生
长后期。然而, 其准确度仍然可以接受。内插法所
得准确度最差, 不能推广应用。当缺乏计算机模型
时, 内插法是大豆种植者用来估算大豆某一特定生
长阶段的具体日期的最行之有效的方法, 因此, 在
本研究中, 我们用它作为对照, 进行比较。
3 讨论
3.1 ANN与回归的比较
在构建预测模型方面, ANN方法是传统统计方
法(如逐步回归分析)的一个补充。与回归分析和其他
统计模拟不同的是, ANN不必满足某些变量分布条
件[14], 传统统计方法只有当数据的方差和分布满足
346 作物学报第 35卷

表 4 运用内插法、回归和 ANN所得预测结果
Table 4 Predicted dates using interpolation approach (IP),
regression (Reg.), and ANN procedures
Date (month/day)

Difference(day)
Stage
Observed IP Reg. ANN IP Reg. ANN
VE 4/21 4/24 4/21 4/22 3 0 1
VC 4/27 5/02 4/30 4/30 5 3 3
V1 5/04 5/08 5/07 5/07 4 3 3
V2 5/09 5/12 5/12 5/12 3 3 3
V3 5/13 5/16 5/17 5/16 3 4 3
V4 5/18 5/20 5/21 5/20 2 3 2
V5 5/23 5/23 5/25 5/24 0 2 1
V6 5/29 5/27 5/28 5/28 –2 –1 –1
V7 6/03 5/30 5/31 5/31 –4 –3 –3
V8 6/08 6/02 6/03 6/03 –6 –5 –5

R1 5/23 5/19 5/24 5/24 –4 1 1
R2 5/26 5/24 5/28 5/28 –2 2 2
R3 6/11 6/10 6/12 6/11 –1 1 0
R4 6/18 6/16 6/21 6/19 –2 3 1
R5 6/25 6/25 6/30 6/27 0 5 2
R6 7/19 7/14 7/21 7/21 –5 2 2
R7 8/10 8/02 8/08 8/09 –8 –2 –1
R8 8/20 8/13 8/18 8/21 –7 –2 1
缩写同表 1。Abbreviations as in Table 1.

一定条件时, 才能作回归分析, 但这些条件往往满
足不了。由此可见, ANN 方法要优于回归方法。前
人[14]的研究结果显示, 预测准确度 ANN 模型往往高
于传统统计模型, 本研究进一步证实了这一结论。
使用 ANN 构建模型时 , 常常会出现过度拟合
(overfitting)的问题。可以采用多种措施来防止或尽
量减小该问题的出现, 最有效的方法之一是使用一
套独立的验证数据监控误差率, 如图 4 所示。当验
证数据的误差曲线开始升高时, 停止训练[20]。在本
研究中, 没有观察到误差升高的情况。训练和验证
数据的误差均趋近 0, 训练进行了 1 000轮后终止。
使用一套独立的验证数据可以大大提高预测准确度,
但只有当独立的验证数据和测试数据很相似时才
行。本研究在构建 ANN模型时, 我们使用了验证数
据来提高预测准确度, 也使用了测试数据来检查预
测的适合性。
3.2 模型所涉及的参数
如前所述, 我们仅仅使用播种日期, 成熟期组
和规一化的生长阶段作为预测参数。一个非常重要
的、也许应该考虑的参数是温度, 该参数常常用热
量单元或 GDD(growing degree-days)表示。许多作物
物候期模型主要将累积 GDD作为驱动力。本研究没
有使用累积 GDD, 而是使用了自然天数, 主要有 2
个理由。其一, 大豆为光周期敏感的植物。复杂的
光－热相互作用关系随生长阶段不是线性关系, 不
能简单地表达为热量单元累积量函数。而且, 播种
日期与成熟期组之间也存在相互作用。如果使用
GDD 而不是自然天数来进行模拟, 预测准确度不会
提高。第二, 本研究所构建的所有模型均为经验模
型, 采用了特定地点的大田数据, 这些数据以一种
历史性的方式已经将环境（如温度等）效应包含到
模型中。图 7展示了正常的大豆生长季节 2002年(用
于模型测试)与 4年平均(1998—2001)累积GDD的对
比情况, 可以看出, 两套数据存在非常紧密的关系,
说明运用多年平均可以很好地解释温度变化。
如果使用更多的参数, 我们有理由相信预测准
确度有可能会提高。然而, 模型的可用性可能会降

图 7 在一个正常的大豆生长季节 2002年与 4年平均(1998—2001)累积 GDD的对比
Fig. 7 Comparison of accumulative growing-degree-day (AGDD) between 2002 and the 4-yr average (1998 to 2001) during a
normal growing season for soybean
第 2期张久权等: 应用神经网络和统计模型预测大豆生长发育阶段 347

低, 因为在实际生产中当地农户可能无法获取这些
参数的数据。数据缺乏时反而会降低预测准确度。
我们需要在预测准确度和参数数量间进行折衷。
3.3 模型的运用
模型所使用的数据取自有灌溉条件的大田, 因
此, 最适合在有灌溉条件、雨量丰富、未出现干旱
的情况下使用。无灌溉条件时, 由于给定年份和田
块的雨量分布很难预测, 准确预测大豆的物候期将
很困难。一般地, 大豆生长阶段的具体日期无灌溉
条件的比有灌溉条件的早几天到 2 周, 具体情况与
降水和成熟期组有关。
构建模型时 , 数据取自密西西比的斯通威尔 ,
因此, 模型在密西西比三角洲及周边具有相似纬度
地区最为实用。然而, 如果当地有现成的数据, 很容
易就地构建适合当地的模型, 所用方法一样。使用
气象资料和 GIS 技术, 也可以导出针对某地点的模
型, 这些问题正在进一步研究中。这类模型对大豆
生产者, 基层农技推广人员和科技人员都很实用。
为使大豆种植者能方便地预测大豆的生长阶段,
我们开发了一个网站程序 (http://msucares.com/del-
tasoy/gsModelFrame.htm), 其核心是本研究所得的
模型。由于程序只需要播种日期和成熟期组 2 个参
数 , 理解和使用方便 , 预测准确度较好 , 收到许多
用户的好评。这些方法在更宽的纬度范围和其他作
物上的实用性需要做进一步的研究。
4 结论
使用神经网络、内插法和逐步回归 3 种方法构
建模型来预测大豆生长阶段的具体日期, 神经网络
预测准确度最高, 说明在此类模拟中, 神经网络方
法优于回归方法。神经网络模型构建容易, 可以使
用有限的数据构建模型 , 而且 , 在大多数情况下 ,
当地大豆种植户能提供这些数据, 使用该模型进行
预测, 所得结果能为种植决策提供很大便利。
References
[1] Bernard R L. Two major genes for time of flowering and maturity
in soybeans. Crop Sci, 1971, 11: 242–244
[2] Buzzel R I, Voldeng H D. Inheritance of insensitivity to long day
length. Soybean Genet News, 1980, 7: 26–29
[3] McBlain B A, Bernard R L. A new gene affecting the time of
flowering in soybeans. J Hered, 1987, 78: 160–162
[4] Borthwick H A, Parker M W. Effective of photoperiodic treat-
ments of plants of different age. Bot Gaz, 1938, 100: 245–249
[5] Cregan P B, Hartwig E E. Characterization of flowering response
to photoperiod in diverse soybean genotypes. Crop Sci, 1984, 24:
657–660
[6] Johnson H W, Brothwick H A, Leffel R C, Effects of photoperiod
and time of planting on rate of development of soybeans in vari-
ous stages of life cycle. Bot Gaz, 1960, 122: 77–95
[7] Thomas F J, Raper C D Jr. Photoperiodic control of seed filling
for soybeans. Crop Sci, 1976, 16: 667–672
[8] Cartter J L, Hartwig E E. The Management for Soybeans. In:
Norman A G ed. The Soybean. New York: Academic Press, 1963,
pp 161–226
[9] Acock B, Pachepsky Y A, Acock M C, Reddy V R, Whisler F D.
Modeling soybean cultivars development rate, using field data
from the Mississippi valley. Agron J, 1997, 89: 994–1002
[10] Foroun N, Mundel H H, Saindon G, Entz T. Effect of level and
timing of moisture stress on soybean plant development and yield
components. Irrig Sci, 1993, 13: 149–155
[11] Jones P G, Laing D R. Simulation of the phenology of soybeans.
Agric Syst, 1978, 3: 295–311
[12] Specht J E, Elmore R W, Eisenhauer D E, Klocke N W. Growth
stage scheduling criteria for sprinkler-irrigated soybeans. Irrig Sci,
1991, 10: 99–111
[13] Welch S M, Jones J W, Brennan M W, Reeder G, Jacobson B M.
PC Yield: Model-based decision support for soybean production.
Agric Syst, 2002, 74: 79–98
[14] Blackard J A, Dean D J. Comparative accuracies of artificial
neural networks and discriminate analysis in predicting forest
cover types from cartographic variables. Comput Electron Agric,
1999, 24: 131–151
[15] Elizondo D R, McClendon R W, Hoogenboom G. Neural network
models for predicting flowering and physiological maturity of
soybean. Transact ASAE, 1994, 37: 981–988
[16] Zhang L X, Zhang J, Kyei-Boahen S, Watson C E. Developing
phenological prediction tables for soybean. Crop Management.
doi: 10.1094/ CM-2004-1025-01-RS (2004-10-25) [2008-01-04]
http://www.plantmanagementnetwork.org/pub/cm/research/2004/t
ables/.
[17] Fehr W R, Caviness C E. Stage of soybean development. In: Iowa
State University Cooperative Extension Service Special Report,
1977, p 80
[18] Bishop C M. Neural Networks for Pattern Recognition. Oxford,
England: Clarendon Publishing, 1995
[19] Jain A, Mao J. Artificial Neural Networks: A tutorial. Computer,
1996, 29: 31–44
[20] Mitchell T M. Machine Learning. Boston, MA: McGraw-Hill Co,
1997

Nrediction of Soybean Growth and Development Stages Using Artificial Neural Network and Statistical Models

应用神经网络和统计模型预测大豆生长发育阶段

相关文献