研究利用近红外光谱(near-infrared, NIR)和化学计量学方法估测小麦(Triticum aestivum)新鲜叶片和粉末状干叶中全氮含量的可行性, 并建立小麦叶片氮含量估测模型, 以期为小麦氮素营养的精确管理提供理论依据。以3个小麦田间试验观测资料为基础, 分别运用偏最小二乘法(partial least squares, PLS)、反向传播神经网络(back-propagation neural network, BPNN)和小波神经网络(wavelet neural network, WNN), 建立小麦叶片氮含量的鲜叶和粉末状干叶近红外光谱估测模型, 用随机选择的样品集对所建模型进行测试和检验。结果显示, 利用PLS、BPNN和WNN 3种方法构建的近红外光谱模型均能准确地估测小麦叶片氮含量, 其中基于BPNN和WNN的模型优于基于PLS的模型, 且以基于WNN的模型表现最好。对模型进行检验的结果显示, 粉末状干叶模型的预测均方根误差(RMSEP)分别为0.147、0.101和0.094, 鲜叶模型的RMSEP分别为0.216、0.175和0.169, 模型的相关系数均在0.84以上。因此, 利用近红外光谱估算小麦叶片氮素营养精确可行, 对其他作物的氮素营养估测提供了借鉴和参考。
Aims Our objectives were to determine the feasibility of estimating nitrogen content in fresh and dry wheat leaves using near-infrared (NIR) spectroscopy and chemometrics and to establish the near-infrared model for estimating nitrogen content in wheat leaves in order to lay a foundation for wheat nitrogen management. Methods We conducted three field experiments with different years, wheat varieties and nitrogen rates and determined time-course near-infrared absorbance spectroscopy and total nitrogen content from fresh and dry wheat leaves. The methods of partial least squares (PLS), back-propagation neural network (BPNN) and wavelet neural network (WNN) were used to establish the calibration models, and a dataset selected at random was used to evaluate the established models. Important findings Near infrared calibration models based on PLS, BPNN and WNN could be used to estimate nitrogen content in wheat leaves with high precision and stable performance, especially WNN. The validation results showed that the root mean square errors of prediction (RMSEP) for the power model are 0.147, 0.101 and 0.094, respectively, while those for the fresh leaves model are 0.216, 0.175 and 0.169, respectively. The correlation coefficients (R2) for all models are >0.84. Therefore, near-infrared spectrometry can be an efficient method to estimate the nitrogen nutrition of crops.
全 文 :植物生态学报 2011, 35 (8): 844–852 doi: 10.3724/SP.J.1258.2011.00844
Chinese Journal of Plant Ecology http://www.plant-ecology.com
——————————————————
收稿日期Received: 2010-04-11 接受日期Accepted: 2010-6-08
* 通讯作者Author for correspondence (E-mail: yanzhu@njau.edu.cn)
应用近红外光谱估测小麦叶片氮含量
姚 霞 汤守鹏 曹卫星 田永超 朱 艳*
南京农业大学/国家信息农业工程技术中心, 江苏省信息农业高技术研究重点实验室, 南京 210095
摘 要 研究利用近红外光谱(near-infrared, NIR)和化学计量学方法估测小麦(Triticum aestivum)新鲜叶片和粉末状干叶中全
氮含量的可行性, 并建立小麦叶片氮含量估测模型, 以期为小麦氮素营养的精确管理提供理论依据。以3个小麦田间试验观测
资料为基础, 分别运用偏最小二乘法(partial least squares, PLS)、反向传播神经网络(back-propagation neural network, BPNN)和
小波神经网络(wavelet neural network, WNN), 建立小麦叶片氮含量的鲜叶和粉末状干叶近红外光谱估测模型, 用随机选择的
样品集对所建模型进行测试和检验。结果显示, 利用PLS、BPNN和WNN 3种方法构建的近红外光谱模型均能准确地估测小
麦叶片氮含量, 其中基于BPNN和WNN的模型优于基于PLS的模型, 且以基于WNN的模型表现最好。对模型进行检验的结果
显示, 粉末状干叶模型的预测均方根误差(RMSEP)分别为0.147、0.101和0.094, 鲜叶模型的RMSEP分别为0.216、0.175和0.169,
模型的相关系数均在0.84以上。因此, 利用近红外光谱估算小麦叶片氮素营养精确可行, 对其他作物的氮素营养估测提供了
借鉴和参考。
关键词 叶片, 近红外光谱, 神经网络, 偏最小二乘法, 氮含量, 小麦
Estimating the nitrogen content in wheat leaves by near-infrared reflectance spectroscopy
YAO Xia, TANG Shou-Peng, CAO Wei-Xing, TIAN Yong-Chao, and ZHU Yan*
National Engineering and Technology Center for Information Agriculture / Jiangsu Key Laboratory for Information Agriculture, Nanjing Agricultural Univer-
sity, Nanjing 210095, China
Abstract
Aims Our objectives were to determine the feasibility of estimating nitrogen content in fresh and dry wheat
leaves using near-infrared (NIR) spectroscopy and chemometrics and to establish the near-infrared model for
estimating nitrogen content in wheat leaves in order to lay a foundation for wheat nitrogen management.
Methods We conducted three field experiments with different years, wheat varieties and nitrogen rates and
determined time-course near-infrared absorbance spectroscopy and total nitrogen content from fresh and dry
wheat leaves. The methods of partial least squares (PLS), back-propagation neural network (BPNN) and wavelet
neural network (WNN) were used to establish the calibration models, and a dataset selected at random was used to
evaluate the established models.
Important findings Near infrared calibration models based on PLS, BPNN and WNN could be used to estimate
nitrogen content in wheat leaves with high precision and stable performance, especially WNN. The validation
results showed that the root mean square errors of prediction (RMSEP) for the power model are 0.147, 0.101 and
0.094, respectively, while those for the fresh leaves model are 0.216, 0.175 and 0.169, respectively. The
correlation coefficients (R2) for all models are >0.84. Therefore, near-infrared spectrometry can be an efficient
method to estimate the nitrogen nutrition of crops.
Key words leaf, near-infrared spectroscopy, neural network, partial least squares, total nitrogen content, wheat
氮素是作物生长及产量品质形成的必要元素。
快速、准确地评价小麦(Triticum aestivum)叶片全氮
含量, 对于小麦氮素营养的精确管理具有重要意
义。近红外光谱(NIR)技术以其快速、环保、准确和
可多组分同时测定的优点, 被广泛应用于农业领域
(Halgerson et al., 2004; 严衍禄, 2005; Cozzolino et
al., 2006; Cozzolino & Morón, 2006; Christy, 2008)。
前人利用NIR基于偏最小二乘法(PLS)或主成分分
姚霞等: 应用近红外光谱估测小麦叶片氮含量 845
doi: 10.3724/SP.J.1258.2011.00844
析法等化学计量学方法对植物全氮含量进行了大
量研究(Blakeney et al., 1996)。Kokaly和Clark (1999)
研究表明可利用长波近红外光的光谱吸收特征来
预测植物叶片氮含量, 后来Curran等(2001)验证了
该结论的可靠性和准确性。张录达等(2000)利用主
成分回归方法和PLS建立了烤烟 (Nicotiana ta-
bacum)和小麦样品不同组分的NIR定量分析模型,
模型的预测表现较好。Riley和Cánaves (2002)以及
Morón 等 (2007) 应 用 NIR 和 PLS 分 别 对 棉 花
(Malvaceae)叶片和小麦新鲜植株的全氮含量进行
估测, 均取得了较好的效果。Mroczyk和Michalski
(1995)运用NIR和主成分回归法准确地预测了不同
肥力水平下甜菜(Beta vulgaris)粉末状干叶的氮含
量。Gislum等(2004)用PLS建立了两种粉末状草样氮
含量的近红外预测模型。张玉森(2010)等基于NIR
技术, 应用PLS、主成分回归和逐步多元回归, 建立
了水稻(Oryza sativa)叶片氮含量NIR模型。
由上可见, 前人利用NIR来快速监测作物的生
长信息, 取得了可喜进展。但缺乏对叶片乃至不同
叶位的探讨, 不利于了解作物氮素状况的精细信
息; 其在室外采集的光谱信息易受到水分、大气和
土壤等多种因素影响, 所建模型较难外推应用; 已
有研究大多集中在估测干燥和捣碎的植株或叶片
的氮含量, 有必要建立针对鲜叶氮素的光谱估测模
型; 或基于数个光谱位置特征的线性回归。充分发
挥化学计量学方法尤其是应用神经网络法来构建
小麦叶片氮素营养估算模型, 在国内外鲜有报道。
因此如何最大限度地克服外界环境对NIR的影响,
结合化学计量学定量分析的优势, 并充分挖掘氮素
在NIR谱区的丰富信息, 来综合实现小麦叶片鲜叶
和烘干粉末2种不同形态的叶片氮含量的精确估测,
有待于深入系统地研究。
本文旨在以不同年份、不同施氮水平和不同品
种的小麦田间试验为基础, 利用小麦新鲜叶片和烘
干粉末的NIR信息, 基于PLS、反向传播神经网络
(back-propagation neural network, BPNN)和小波神
经网络(wavelet neural network, WNN) 3种化学计量
学方法, 探明NIR与小麦新鲜叶片和烘干粉末氮含
量之间的关系, 构建小麦叶片氮素营养NIR估测模
型, 以期为小麦叶片氮素营养的快速估测和精确诊
断提供准确适用的技术, 为将NIR技术应用到其他
作物氮素营养的监测中提供参考。
1 材料和方法
1.1 试验设计
本研究共进行了3个田间试验, 涉及不同年份、
不同小麦品种和不同施氮水平, 具体试验设计描述
如下。
试验1 (EXP. 1): 2006–2007年在江苏省南京市
农林局试验站(118°59′ E, 31°56′ N)进行。供试品种
为‘宁麦9号’和‘豫麦34号’, 设4个施氮水平, 分别为
0、90、180和270 kg·hm–2纯氮。土壤有机质含量为
1.01%, 全氮含量为 0.11%, 速效磷含量为 40.29
mg·kg–1, 速效钾含量为100.27 mg·kg–1, 前茬为水
稻。试验设两因素随机区组排列, 3次重复, 小区面
积约为23 m2, 基本苗1.5 × 106株·hm–2, 行距25 cm。
氮肥基肥追肥比2:1:1, 追肥时期为拔节期和孕穗
期。各处理配施105 kg·hm–2 P2O5和80 kg·hm–2 KCl,
全部用作基肥。其他管理措施同高产小麦田。
试验2 (EXP. 2): 2007–2008年在南京农业大学
江浦试验站(118°37′ E, 32°02′ N)进行。供试品种为
‘宁麦9号’, 设4个施氮水平, 分别为0、90、180和270
kg·hm–2纯氮。土壤有机质含量为1.95%, 全氮含量
为0.08%, 速效磷含量为13.41 mg·kg–1, 速效钾含量
为48.86 mg·kg–1, 前茬为玉米(Zea mays)。试验设两
因素随机区组排列, 3次重复, 小区面积约为16 m2,
基本苗1.5 × 106株·hm–2, 行距25 cm。氮肥基肥追肥
比1:1, 追肥时期为拔节期。各处理配施150 kg·hm–2
P2O5和150 kg·hm–2 K2O, 全部用作基肥。其他管理
措施同高产小麦田。
试验3 (EXP. 3): 2007–2008年在南京农业大学
江浦试验站进行。供试品种为‘宁麦9号’、 ‘淮麦17
号’和‘扬麦12号’, 设2个施氮水平, 分别为75和225
kg·hm–2纯氮。土壤有机质含量为0.64%, 全氮含量
为0.09%, 速效磷含量为13.94 mg·kg–1, 速效钾含量
为151 mg·kg–1, 前茬为玉米。试验为两因素随机区
组排列, 3次重复, 小区面积约为18 m2, 基本苗1.65
× 106株·hm–2, 行距25 cm。氮肥基肥追肥比为1:1,
追肥时期为拔节期。各处理配施120 kg·hm–2 P2O5
和135 kg·hm–2 K2O, 全部用作基肥。其他管理措施
同高产小麦田。
1.2 光谱测定
在关键生育时期, 取上部3片完全展开叶, 即
顶1叶、顶2叶和顶3叶, 用于鲜叶光谱测定, 每个处
理每个叶位测9片代表性叶片。与鲜叶光谱测试同
846 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (8): 844–852
www.plant-ecology.com
步, 于拔节期每小区取有代表性的小麦20株, 至孕
穗后取50个单茎, 将叶片按叶位分离, 105 ℃下杀
青并在80 ℃下烘干后粉碎, 过40目筛, 用自封袋密
封后置于干燥器中, 用于全氮测定和叶片粉末光谱
测定。
1.2.1 鲜叶光谱
用Thermo Nicolet 5700 FT-IRNIR仪 (Thermo
Nicolet, Maclison, USA), 自带InGaAs检测器的漫反
射附件、OMNIC 7.2集成软件。光谱采集前, 先在
室温下开机预热约1 h, 将叶片中部对准样品台的
通光孔, 然后用镀金内壁紧压后进行扫描, 每次操
作前均采集背景光谱。扫描范围12 500–4 000 cm–1,
分辨率4 cm–1, 每次光谱数据采集均扫描64次, 每
张叶片重复采集光谱3次, 取平均值代表该处理样
品的光谱, 并以吸光度的形式存储于计算机中。
1.2.2 粉末光谱
将过筛样品装入内径2.5 cm、高5 cm的专用石
英杯, 容量约1/3, 并用专用砝码压紧, 置于样品台
扫描, 每份样品重复采集光谱9次, 取平均值代表
该粉末样品光谱, 光谱采集参数同鲜叶光谱。所有
光谱数据都转化为单位为nm的波长形式, 范围为
1 000–2 500 nm, 数据点间隔为1 nm。为描述方便,
记鲜叶为Fresh, 粉末状干叶为Dry。图1为鲜叶和粉
末状干叶近红外原始吸光度谱图。
1.3 氮含量测定
叶片全氮含量采用凯氏微量定氮法测定, 每份
样品重复测定3次, 取平均值作为该样品全氮含量。
1.4 数据处理
1.4.1 样品集划分
为了减少偶然误差、提高模型精度, 本文首先
运用马氏距离法(Smith & Gemperline, 2000)从采集
到的鲜叶和干叶各180份样品中分别剔除5份奇异
样品, 剩下175份样品, 再从中随机选择出136份样
品作为校正集, 其余39份作为检验集。
1.4.2 光谱预处理
为了消除光谱散射、平移和偏转, 减少环境噪
声对光谱的干扰, 采用多元散射校正(MSC) (Fer-
nandez et al., 2007)、Savitzky-Golay平滑与导数(Luo
et al., 2005)和Norris导数滤波(Norris & Williams,
1984)预处理方法对原始光谱数据进行预处理, 并
采用校正均方根误差(RMSEC)及其决定系数(R2)来
行评价预处理的表现, 最后选择最适宜的预处理方
图1 小麦鲜叶和粉末状干叶近红外光谱原始光谱。
Fig. 1 Original near infrared spectra of fresh and dry wheat
leaf.
法。所有预处理方法均在Matlab 7.0下编程实现。
1.5 模型构建
采用PLS、BPNN和WNN (Zhang & Benveniste,
1992) 3种方法对经过预处理后的小麦样品NIR与全
氮含量进行建模。所有算法和程序均在Matlab 7.0
下编程实现。
1.5.1 PLS主成分数的确定
采用PLS建立校正模型时, 采用的主成分数过
少或者过多, 模型的预测准确度均会降低(Moros et
al., 2008)。本文利用交叉验证得到的内部交叉验证均
方差(RMSECV)来确定主成分数(Dou et al., 2006), 即
当RMSECV达到最小时, 该主成分数确定为最佳。
1.5.2 神经网络的结构和参数确定
BPNN和WNN的网络均采用常见的三层结构
——输入层、隐层和输出层。为了在保证输入数据
具有高精度的前提下加快网络收敛速度, 可以将压
缩后的主成分作为网络输入节点(闻新等, 2001)。
1.5.3 BPNN的隐层传递函数
采用常用的Tansig函数, 输出层采用Purelin函
数, 综合考虑网络稳定性和训练时间, 将学习速率
都设为0.01, 网络优化算法选择Levevberg-Marq-
uardt算法, 最大训练次数都为1 000, 鲜叶和干叶网
络模型期望误差分别为0.001 5和0.001 0。
1.5.4 WNN的隐层小波基函数
采用通用的时频域分辨率较高的Morlet函数
姚霞等: 应用近红外光谱估测小麦叶片氮含量 847
doi: 10.3724/SP.J.1258.2011.00844
表1 校正集和检验集小麦叶片全氮含量统计参数
Table 1 The statistical parameters of calibration set and testing set for total nitrogen content in leaf of wheat
统计参数
Statistical parameter
样品数
Number of
samples
最小值
Minimum
value (%)
最大值
Maximum
value (%)
平均值
Mean
value (%)
标准偏差
Standard
deviation (%)
变异系数
Coefficient of
variation (%)
校正集 Calibration set 136 0.57 4.42 2.50 1.01 40.40
检验集 Testing set 39 0.60 4.26 2.42 0.95 39.26
(刘莉等, 2008)。WNN的隐层节点数的选择对网络
具有非常重要的影响, 若节点过少, 则网络难以达
到训练要求; 但若节点过多, 则会使网络学习时间
急剧增加, 而且还可能造成过拟合, 同样会增大预
测误差(闻新等, 2001)。小波基函数的隐层节点数一
般不宜超过10 (Subasi et al., 2005)。本文尝试取不同
的隐层节点数来进行建模, 并把RMSECV最小时的
隐层节点数确定为最佳隐层节点数。
1.6 模型测试
为了测试检验模型的可靠性和稳定性, 利用随
机选择出来的鲜叶和干叶各39份样品分别对模型
进行了测试, 采用预测均方根误差(RMSEP)和复相
关系数(RSQ)来综合评价模型性能(李冬云和李彩
云, 2007)。
2 结果和分析
2.1 小麦叶片全氮含量的特征
校正集和检验集样品全氮含量的统计结果(表
1)显示, 校正集和检验集样品全氮含量的变幅范围
分别为0.57%–4.42%和0.60%–4.26%, 变异系数为
39.26%–40.40%, 显示样品具有较好的代表性。
2.2 光谱预处理方法的确定
采用MSC、Savitzky-Golay平滑与导数和Norris
导数滤波3种光谱预处理方法对原始的光谱数据进
行了预处理, 结果表明(表2), 对于鲜叶光谱, 3种回
归方法中均为MSC和Savitzky-Golay二阶导数相结
合的预处理方法RMSEC最低、R2最高、效果最好;
对于干叶光谱, 采用MSC和Norris一阶导数相结合
的方法进行处理后的光谱校正效果最好。因此, 在
用800–2 500 nm全谱区进行建模前, 鲜叶光谱和干
叶光谱分别采用上述最佳预处理方法进行处理。
2.3 PLS主成分数的确定
图2为RMSECV随主成分数的变化规律, 可以
看出, 鲜叶和干叶光谱PLS模型的最佳主成分数分
别为6和5, 此时累计贡献率分别达到98.82%和
99.86%, 基本可涵盖样品信息。
2.4 神经网络结构和参数的确定
根据图2结果, 鲜叶和干叶监测模型的网络输
入节点可分别确定为6和5, 依次对应于各主成分;
输出层节点数为1, 即为叶片氮含量。从图3可以看
出, 对于鲜叶, BPNN和WNN中的最佳隐层节点数
分别为5和4, 干叶中分别为5和6。因此BPNN和
WNN的结构形式在鲜叶上分别为6-5-1和6-4-1, 干
叶上分别为5-5-1和5-6-1 (输入节点数-隐层节点数-
输出节点数)。
2.5 模型的构建与评价
对鲜叶和粉末状干叶分别运用PLS、BPNN和
WNN方法在其经过预处理的NIR光谱与氮含量之
间进行建模, 建模所用样品为随机选择出来的136
份。然后利用随机选择出来的鲜叶和干叶各39份样
品分别对模型进行测试, 并用RMSEP和R2来综合评
价模型性能。结果显示(图4), 用3种回归方法所建模
图2 内部交叉验证均方差(RMSECV)随偏最小二乘法主成
分数(PC)的变化。
Fig. 2 Changes of root mean square error of cross validation
(RMSECV) with the number of partial least squares principal
components (PC). Dry, dry leaf powder; Fresh, fresh leaf.
848 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (8): 844–852
www.plant-ecology.com
表2 不同光谱预处理方法下定标方程的表现
Table 2 Performance of the calibration equations under different methods of spectra preprocessing
回归类型
Regression type
样品
Sample
预处理方式
Preprocessing method
校正均方根误差
RMSEC (%)
R2
MSC+SG 0.252 0.805
MSC+SG+1D 0.243 0.824
MSC+SG+2D 0.231 0.832
MSC+N+1D 0.276 0.786
鲜叶
Fresh leaf
MSC+N+2D 0.269 0.791
MSC+SG 0.247 0.829
MSC+SG+1D 0.275 0.811
MSC+SG+2D 0.264 0.821
MSC+N+1D 0.153 0.904
偏最小二乘法
PLS
粉末状干叶
Dry leaf powder
MSC+N+2D 0.161 0.900
MSC+SG 0.195 0.852
MSC+SG+1D 0.186 0.873
MSC+SG+2D 0.174 0.881
MSC+N+1D 0.206 0.844
鲜叶
Fresh leaf
MSC+N+2D 0.198 0.856
MSC+SG 0.111 0.956
MSC+SG+1D 0.121 0.950
MSC+SG+2D 0.118 0.951
MSC+N+1D 0.108 0.962
反向传播神经网络
BPNN
粉末状干叶
Dry leaf powder
MSC+N+2D 0.129 0.946
MSC+SG 0.199 0.872
MSC+SG+1D 0.185 0.884
MSC+SG+2D 0.173 0.899
MSC+N+1D 0.201 0.847
鲜叶
Fresh leaf
MSC+N+2D 0.196 0.875
MSC+SG 0.105 0.958
MSC+SG+1D 0.113 0.954
MSC+SG+2D 0.102 0.967
MSC+N+1D 0.091 0.983
小波神经网络
WNN
粉末状干叶
Dry leaf powder
MSC+N+2D 0.118 0.961
1D, 一阶导数; 2D, 二阶导数; MSC, 多元散射校正; N, Norris导数滤波; SG, 平滑导数。表中黑体字表示较好的预处理方法。
BPNN, back propagation neural network; PLS, partial least squares; RMSEC, root mean square error of calibration; WNN, wavelet neural network.
1D, 1st derivative; 2D, 2nd derivative; MSC, multiple scatter correction; N, Norris derivative filter; SG, Savitzky Golay filter. The boldface indicated
the better preprocessing mothed.
型的RMSEP都在0.22%以下, 相关系数R2在0.84以上,
偏差Bias绝对值在0.019–0.064之间, 表明模型具有较
好的预测效果。同时发现, 鲜叶光谱的估测精度明显
低于干叶光谱。对于两种样品状态的光谱模型, 神经
网络方法明显优于PLS, 且WNN预测精度最高。
3 讨论和结论
3.1 光谱预处理方法的选择
NIR包含的信息除了样品组分的信息特征外,
还包含仪器参数、制样参数和环境参数等背景信息
(严衍禄, 2005), 所以, 建模前必须进行预处理。本
研究基于室内环境采集光谱, 一定程度上克服了外
界环境对光谱的影响。同时, 本研究通过马氏距离
法剔除了奇异样品 , 然后对鲜叶采用M S C和
Savitzky-Golay二阶导数, 干叶采用MSC和Norris一
阶导数光谱预处理的方法, 建模效果令人满意。当
然, 为了进一步提高模型的预测精度和鲁棒性, 其
他光谱预处理方法, 比如基线校正、小波变换、独
姚霞等: 应用近红外光谱估测小麦叶片氮含量 849
doi: 10.3724/SP.J.1258.2011.00844
图3 内部交叉验证均方差(RMSECV)随隐层节点数的变化。
BPNN, 反向传播神经网络; Dry, 粉未状干叶; Fresh, 鲜叶;
WNN, 小波神经网络。
Fig. 3 Changes of root mean square error of cross validation
(RMSECV) with the number of neurons in hidden layer. BPNN,
back propagation neural network; Dry, dry leaf powder; Fresh,
fresh leaf; WNN, wavelet neural network.
立分量分析、正交信号校正、支持向量机等, 还有
待进一步研究分析。
3.2 光谱化学计量学方法的应用
光谱化学计量学方法是现代NIR技术的一个重
要组成, 将稳定、可靠的NIR分析仪器与功能全面
的化学计量学软件相结合。光谱化学计量学方法研
究在现代NIR技术的发展中占有非常重要的地位。
NIR中化学计量学方法的研究主要涉及两个方面的
内容: 一是光谱预处理方法的研究; 二是NIR定性和
定量校正方法的研究。本研究运用PLS、BPNN和
WNN等化学计量学方法, 基于适宜的光谱预处理方
法, 建立了小麦叶片氮含量定量估测模型。这种基于
光谱的作物营养快速估测方法, 有效地改进了传统
的小麦叶片氮含量测定方法的耗时性和繁琐性。
3.3 PLS、BPNN和WNN的比较
PLS是一种多元数据处理技术, 解决了多元线
性回归中变量多、重相关性等问题, 是目前NIR分
析中应用较广泛的一种方法。本文综合考虑全谱区
各波长点的光谱参数, 兼顾被分析样品内部各成分
之间的关系, 基于PLS建立线性回归模型。但是在
NIR模型的校正过程和实际应用中, 存在很多非线
性关系, 此时PLS表现力较弱, 而神经网络可解决
连续非线性函数的逼近, 因此在NIR分析领域得到
了广泛应用。神经网络中的BPNN是采用最多也是
最成熟的神经网络训练算法之一, 但是BPNN存在
着易陷于局部最小和收敛速度慢等弱点。WNN是由
Zhang和Benveniste (1992)提出来的, 将小波理论与
人工神经网络的思想相结合而形成的一种新的神
经网络, 综合了小波多尺度分析和神经网络自学习
的优点, 因而具有比传统神经网络更快的收敛速度
和更强的逼近性能, 因此, 基于WNN估测小麦叶片
氮含量方法的表现最佳。与前人的基于有限的数个
光谱位置特征进行回归很难得到较好的估测效果
相比(Kokaly & Clark, 1999; Curran et al., 2001; 冯
伟等, 2008), 本文综合运用全光谱信息, 充分发挥
了化学计量学的信息提取优势, 所建模型更稳健,
精确度更高。与张录达(2000)、张玉森(2010)等的研
究相比, 本文所构建的BPNN和WNN可用来解决
NIR光谱与叶片氮含量之间可能存在的非线性关
系, 因而所建模型精确度更高, 更适用于建模以外
的环境条件, 准确性和普适性更高。
3.4 基于PLS的神经网络法
为了保证输入数据在具有高精度的前提下加
快网络收敛速度, 可以将PLS压缩后的主成分作为
网络输入节点(Dou et al., 2006)。本文利用PLS方法
提取特征光谱, 然后将PLS提取的特征光谱作为神
经网络的输入层输入网络, 结果显示, 鲜叶光谱前
6个主成分和干叶光谱前5个主成分累计贡献率分
别达到98.82%和99.86%, 基本可涵盖样品信息, 获
得了最优的网络拓扑结构和参数。因此, 本文所提
出的基于PLS的神经网络分析方法, 既提高了预测
的速度和效率, 又增强了预测的机理性和准确性。
本文基于多个试验分别建立了稳定可靠的小
麦鲜叶和粉末状干叶NIR光谱的PLS、BPNN和
WNN模型, 尤其是基于PLS的神经网络法构建的叶
片氮含量模型, 与前人的研究成果相比, 效率、速
度、机理性和准确性在一定程度上都得到了提高和
改善。该研究涉及3个不同年份、4个不同品种、4
个不同施氮水平的田间试验, 样品涵盖较广范围,
在一定程度上可适用于不同栽培条件下、不同生育
期和不同叶位的小麦叶片氮含量预测, 具有较好的
应用前景。然而, 这些估测模型在不同水分管理、
播种时期等其他生产条件下的普适性和可靠性还
需要进行更多的检验和评价。另外, 本文中提出的
估测模型是在一个生态区多年大田试验资料上构
850 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (8): 844–852
www.plant-ecology.com
图4 小麦叶片全氮含量预测值与观测值的相关性。BPNN, 反向传播神经网络; Dry, 粉末干叶状; Fresh, 鲜叶; PLS, 偏最小
二乘法; RMSEP, 预测均方根误差; WNN, 小波神经网络。
Fig. 4 Correlation between predicted and observed values of total nitrogen content in wheat leaf. BPNN, back-propagation neural
network; Dry, dry leaf powder; Fresh, fresh leaf; PLS, partial least squares; RMSEP, root mean square errors of prediction; WNN,
wavelet neural network.
建和测试的, 今后若能通过不同生态点的广泛检验
并不断完善, 有助于实现模型估测精度和普适性的
有效统一, 更好地应用于不同环境下小麦氮素营养
的精确监测诊断和高效调控管理。
姚霞等: 应用近红外光谱估测小麦叶片氮含量 851
doi: 10.3724/SP.J.1258.2011.00844
致谢 国家“863”资助项目(2011AA100703)、国家
自然科学基金(30871448)、教育部新世纪优秀人才
支持计划(NCET-08-0797)、江苏省创新学者攀登计
划 (BK20081479) 和 江 苏 省 自 然 科 学 基 金
(BK2008330和BK2010453)共同资助。
参考文献
Blakeney AB, Batten GD, Welsh LA (1996). Leaf nitrogen
determination using a portable near-infrared spectrometer.
In: Davies AMC, Williams P eds. Near Infrared Spec-
troscopy: the Future Waves. The Proceedings of the 7th
International Conference on Near Infrared Spectroscopy.
NIR Publications, Chichester. 149–152.
Christy CD (2008). Real-time measurement of soil attributes
using on-the-go near infrared reflectance spectroscopy.
Computers and Electronics in Agriculture, 61, 10–19.
Cozzolino D, Fassio A, Fernández E, Restaino E, La Manna A
(2006). Measurement of chemical composition in wet
whole maize silage by visible and near infrared reflectance
spectroscopy. Animal Feed Science and Technology, 129,
329–336.
Cozzolino D, Morón A (2006). Potential of near-infrared re-
flectance spectroscopy and chemometrics to predict soil
organic carbon fractions. Soil and Tillage Research, 85,
78–85.
Curran PJ, Dungan JL, Peterson DL (2001). Estimating the
foliar biochemical concentration of leaves with reflectance
spectrometry: testing the Kokaly and Clark methodolo-
gies. Remote Sensing of Environment, 76, 349–359.
Dou Y, Mi H, Zhao LZ, Ren YQ, Ren YL (2006). Determina-
tion of compound aminopyrine phenacetin tablets by using
artificial neural networks combined with principal com-
ponents analysis. Analytical Biochemistry, 351, 174–180.
Feng W (冯伟), Yao X (姚霞), Zhu Y (朱艳), Tian YC (田永
超), Cao WX (曹卫星) (2008). Monitoring leaf nitrogen
concentration by hyperspectral remote sensing in wheat.
Journal of Triticeae Crops (麦类作物学报), 25, 851–860.
(in Chinese with English abstract)
Fernandez JE, Badiali M, Guidetti A, Scot V (2007). Multiple
scattering corrections for density profile unfolding from
Compton scattering signals in reflection geometry. Nu-
clear Instruments and Methods in Physics Research Sec-
tion A (Accelerators, Spectrometers, Detectors and Asso-
ciated Equipment), 580, 77–80.
Gislum R, Micklander E, Nielsen JP (2004). Quantification of
nitrogen concentration in perennial ryegrass and red fes-
cue using near-infrared reflectance spectroscopy (NIRS)
and chemometrics. Field Crops Research, 88, 269–277.
Halgerson JL, Sheaffer CC, Martin NP, Peterson PR, Weston
SJ (2004). Near-infrared reflectance spectroscopy predic-
tion of leaf and mineral concentrations in alfalfa. Agron-
omy Journal, 96, 344–351.
Kokaly RF, Clark RN (1999). Spectroscopic determination of
leaf biochemistry using band-depth analysis of absorption
features and stepwise multiple linear regression. Remote
Sensing of Environment, 67, 267–287.
Li DY (李冬云), Li CY (李彩云) (2007). Optimization method
of near infrared spectroscopy signal. Computers and Ap-
plied Chemistry (计算机与应用化学), 24, 1418–1420. (in
Chinese with English abstract)
Liu L (刘莉), Huang L (黄岚), Yan YL (严衍禄), Wang ZY
(王忠义) (2008). Progress in the study of impact of scat-
tering on stability of quantitative analysis model using
near infrared spectroscopy technology and correction
methods. Spectroscopy and Spectral Analysis (光谱学与
光谱分析), 28, 2290–2295. (in Chinese with English ab-
stract)
Luo JW, Ying K, Bai J (2005). Savitzky-Golay smoothing and
differentiation filter for even number data. Signal Proc-
essing, 85, 1429–1434.
Morón A, García A, Sawchik J, Cozzolino D (2007). Prelimi-
nary study on the use of near-infrared reflectance spec-
troscopy to assess nitrogen content of undried wheat
plants. Journal of the Science of Food and Agriculture, 87,
147–152.
Moros J, Llorca I, Cervera ML, Pastor A, Garrigues S, de la
Guardia M (2008). Chemometric determination of arsenic
and lead in untreated powdered red paprika by diffuse
reflectance near-infrared spectroscopy. Analytica Chimica
Acta, 613, 196–206.
Mroczyk WB, Michalski KM (1995). Quantitative and qualita-
tive analyses in near infrared analysis of basic compounds
in sugar beet leaf. Computers & Chemistry, 19, 299–301.
Norris KH, Williams PC (1984). Optimization of mathematical
treatments of raw near-infrared signal in the measurement
of protein in hard red spring wheat. I. Influence of particle
size. Cereal Chemistry, 61, 158–165.
Riley MR, Cánaves LC (2002). FT-NIR spectroscopic analysis
of nitrogen in cotton leaves. Applied Spectroscopy, 56,
1484–1489.
Smith BM, Gemperline PJ (2000). Wavelength selection and
optimization of pattern recognition methods using the ge-
netic algorithm. Analytica Chimica Acta, 423, 167–177.
Subasi A, Alkan A, Koklukaya E, Kiymik MK (2005). Wavelet
neural network classification of EEG signals by using AR
model with MLE preprocessing. Neural Networks, 18,
985–997.
852 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (8): 844–852
www.plant-ecology.com
Wen X (闻新), Zhou L (周露), Wang DL (王丹力), Xiong XY
(熊晓英) (2001). MATLAB Design for Neural Networks
Application (MATLAB神经网络应用设计 ). Science
Press, Beijing. 225–232. (in Chinese)
Yan YL (严衍禄) (2005). Theoretical Principle of Near Infra-
red Spectroscopy and Its Application (近红外光谱分析基
础与应用). China Light Industry Press, Beijing. 1–189.
(in Chinese)
Zhang LD (张录达), Shen XN (沈晓南), Zhao LL (赵龙莲), Li
JH (李军会), Zhang JP (张建平), Xie WY (谢雯燕), Shu
RX (束茹欣) (2000). Application of principal component
―all possible regression in quantitative analysis of flue-cured
tobacco and wheat using near-infrared spectroscopy. Chi-
nese Journal of Analytical Chemistry (分析化学), 28,
723–726. (in Chinese with English abstract)
Zhang Q, Benveniste A (1992). Wavelet networks. IEEE
Transactions on Neural Networks, 3, 889–898.
Zhang YS (张玉森), Yao X (姚霞), Tian YC (田永超), Cao
WX (曹卫星), Zhu Y (朱艳) (2010). Estimating leaf ni-
trogen content with near infrared reflectance spectroscopy
in rice. Chinese Journal of Plant Ecology (植物生态学
报), 34, 704–712. (in Chinese with English abstract)
责任编委: 蒋高明 责任编辑: 李 敏