免费文献传递   相关文献

基于高光谱图像技术的沙梨无损检测



全 文 :基于高光谱图像技术的沙梨无损检测
王海建, 洪添胜, 代 芬, 欧阳玉平, 罗瑜清, 倪慧娜
(华南农业大学工程学院/南方农业机械与装备关键技术教育部重点实验室/国家柑橘产业体系机械研究室,广东 广州 510642)
摘 要:为探讨基于高光谱图像技术对沙梨糖度无损检测的可行性,采集 80 个沙梨样本在 400~1 000 nm 内的高光谱图像数
据及其对应的糖度,采用变量标准化、多元散射校正(MSC)、平滑滤波、基线校正等方法对原始光谱数据进行预处理,发现 MSC 预
处理效果最佳,再通过无信息变量消除法对 MSC 预处理后的光谱数据进行压缩,最后分别建立 BP 神经网络和 PLS 沙梨糖度预测
模型。 结果表明:无信息变量消除法将光谱变量压缩到 234 个,有效减少了建模的输入变量,建立的 PLS 预测模型和 BP 神经网络
的预测相关系数均在 0.85 以上,而 PLS 预测模型的相关系数为 0.9508,均方根误差为 0.268,优于 BP 神经网络模型。
关键词:高光谱技术; 沙梨; 多元散射校正; 无信息变量消除法; BP 神经网络
中图分类号:S24 文献标识码:A 文章编号:1004-874X(2013)09-0185-04
Nondestructive testing in pyrifolia based on
the hyper spectral image technology
WANG Hai-jian, HONG Tian-sheng, DAI Fen, OUYANG Yu-ping, LUO Yu-qing, NI Hui-na
(College of Engineering, South China Agricultural University/Division of Citrus Machinery, China Agriculture Research System/Key
Laboratory of Key Technology for South Agricultural Machine and Equipment Ministry of Education ,Guangzhou 510642, China)
Abstract:In order to explore the probability of nondestructive testing based on hyperspectral image technology, the experiment
collected hyperspectral image data of 80 pyrifolia samples range in 400~1 000 nm and its sugar content. Then pretreat the original
spectrum data by SNV, MSC, S.Golay, Baseline methods, and found the denoising effect of MSC pretreatment was the best. Then
compressed the spectrum data of MSC pretreatment through uninformative variable eliminate method. Finally respectively established the
BP neural network and PLS prediction model. The experiment results showed that uninformative variable eliminate had compressed the
spectrum variable to 234, which could reduce the modeling of input variable effectively. The PLS prediction model and BP neural network
prediction correlation coefficient were both more than 0.85, but PLS prediction model of the correlation coefficient was 0.9508, the root
mean square error was 0.268, which was higher than the BP neural network model .
Key words: hyperspectral technology; pyrifolia; multiplicative scatter correction; uninformative variable elimination; BP neural
network
沙梨又名金珠果,原产于我国华东、华中、华南、西
南,现主要分布于长江流域至华南、西南。 沙梨果皮色泽
多为褐色或绿色,果肉细嫩脆爽,汁多味甜,深得消费者
喜爱[1]。
目前, 国内外对水果品质检测方法常采用有直接破
坏性的化学检测方法、 近红外光谱检测技术以及高光谱
图像检测技术等, 近红外光谱和高光谱图像技术都具有
样品处理简单、分析速度快、检测无损等特点 [2-3],而高光
谱图像技术比近红外光谱检测技术具有波段数更多、光
谱分辨率更高等优势 [4-6],因此本研究采用高光谱图像技
术对沙梨进行无损检测。 高光谱图像技术是一种结合了
光谱技术和图像技术的新型检测技术。 由于光谱技术可
以检测水果的物理结构,反映水果的内部化学成分,图像
技术则体现水果表面特征以及损伤和污染情况,所以通过
提取光谱内水果的对应的特征波长,可以对水果品质进行
全面、快速的检测[7]。
近年来,高光谱图像技术被广泛用于水果品质无损检
测,ElMasry 等 [8]利用高光谱图像技术对草莓内部含水率、
可溶性固形物以及酸度进行检测;Cogdill 等 [9]利用高光谱
图像系统,采用主成分分析法、偏最小二乘法分析玉米含
水率和含油率;洪添胜等[10]用高光谱图像技术检测雪花梨
含糖率和含水率,用人工神经网络建立的预测模型相关系
数 R 分别为 0.996、0.94;程国首等 [11]利用高光谱图像技术
对苹果重量进行预测,建立多元线性回归重量预测模型的
相关系数 R为 0.9927;索少增等[12]用高光谱图像技术检测
两种不同浓度在梨表面的农药残留,用人工神经网络建模
预测的相关系数分别大于 0.99 和 0.95; 但未见有应用高
光谱图像技术对沙梨进行无损检测的相关研究。
本研究首先评价高光谱图像系统对沙梨糖度无损检
测的可行性, 同时采用不同方法对原始高光谱数据进行
预处理,比较不同预处理方法对沙梨样本糖度去噪效果,
利用无信息变量消除法对光谱数据进行压缩处理, 探讨
高光谱图像技术结合无信息变量消除法对沙梨糖度无损
收稿日期:2013-02-27
基金项目:国家现代农业(柑橘)产业技术体系建设专项资金
(CARS-27)
作者简介:王海建(1988-),男,在读硕士生,E-mail:wanghaijian
2046@126.com
通讯作者:洪添胜(1955-),男,博士,教授,E-mail:tshong@scau.
edu.cn
广东农业科学 2013 年第 9 期 185
C M Y K
DOI:10.16768/j.issn.1004-874x.2013.09.019
1:高光谱相机(含 CCD);2:光源;3:沙梨样本;4:载物台;5:计算机
图 1 HyperSIS 高光谱成像系统
4.5
4.0
3.5
3.0
2.5
2.0
1.5
1.0
0.5
0
400 500 600 700 800 900 1000
波长(mm)
图 2 沙梨样品原始光谱图



Lo
g(
1/
R

检测的可行性, 将压缩后的光谱变量分别采用 BP 神经
网络和 PLS 建立沙梨糖度预测模型,比较两个模型的预
测效果。
1 材料与方法
1.1 试验材料
供试沙梨分批购于超市,选择色泽光鲜、形状规整、表
皮无明显损伤的 80 个样本,其中单果平均重 146 g,最大
单果重 190 g。 试验前将当天购买的沙梨进行清洗擦拭干
净后,采集沙梨整果光谱,对其标号,再通过榨汁机榨汁提
取沙梨果汁,分别测量沙梨的糖度。
光谱采集主要利用北京卓立汉光仪器有限公司
HyperSIS-VNIR-QE 高光谱成像仪,高光谱成像系统主要
由光源、高光谱相机(含 CCD)、暗箱、样品移动台以及计
算机组成(图 1)。 光谱波长测量范围为 400~1 000 nm,分
辨率为 2.8 nm,曝光时间为 15 ms,传送带的传输速度为 5
mm/s。
1.2 试验方法
1.2.1 光谱采集 高光谱图像数据的采集软件为 Gilden-
Photonics 公司开发的 Spectra SENS 软件。 PLS 建模采用
CAMO 公司开发的 Unscrambler 9.8,无信息变量消除法及
BP神经网络采用 Matlab 2011b进行处理。
在采集高光谱图像数据之前,为减少摄像头中暗电流
以及光强分布较弱波段下的图像噪声对图像的影响,必
须对图像进行校正,首先采集反射率为 100%的标准白板
对图像进行全白标定 Pwhite,然后盖上摄像头盖采集反射率
为 0%的全黑标定图像 Pdark, 进行黑白标定之后再进行样
本光谱采集图像 Psample,根据式(1)得到校正后光谱图像对
应的反射率 R[11]。
R= Psample-PdarkPwhite-Pdark
(1)
为减少单一光谱采集所带来的误差,对每个沙梨样本
的正反两面采集其光谱图像, 对每个样本的光谱数据进
行平均。 图 2为经过平均后的 80个沙梨样本原始光谱图
像,X 轴为波长,Y 轴为吸光度。 由图 2 可知,在 400~780
nm的可见光波段,吸光度光谱曲线出现比较大的降幅,在
780~1 000 nm的近红外波段,吸光度光谱曲线趋于平缓。
1.2.2 糖度测量 将采集完光谱的沙梨样本捣碎、提取果
汁后,利用数显手持式折射计(PAL-1 型,日本 ATAGO 株
式会社)测量糖度,把预先提取好的沙梨果汁滴到折射计
的测量屏上,即可得到相应的糖度数据。
1.2.3 样本划分 目前校正集和预测集样本划分没有固
定具体比例,一般样本划分比例有 2∶1、3∶1 和 4∶1 等,我们
在剔除异常样本的前提下, 把 80个沙梨样本以 3∶1 的比
例划分校正集和预测集, 选择前 3个样本作为校正集,第
4 个样本作为预测集,如此类推,划分出 60个沙梨样本作
为校正集,20个沙梨样本作为预测集。沙梨样本校正集与
预测集的糖度统计数据见表 1。
1.2.4 无信息变量消除法 无信息消除法(Uninformative
Variable Elimination,UVE)是一种基于偏最小二乘法回归
系数的波长选择算法 [13-14]。 在 PLS 模型中,光谱矩阵与浓
度矩阵存在如下关系:
Y=bX+e
式中,b为回归向量,e为误差向量。 无信息变量消除法就
是把相同于自变量矩阵的变量数目的随机变量矩阵加入
光谱矩阵中, 然后通过交叉验证的逐一剔除法建立 PLS
模型,得到回归系数矩阵 B,分析回归系数矩阵中会系数
向量 b的平均值和标准偏差的商 C 的稳定性, 即如下公
式:
Ci= mean(bi)S(bi)
式中,mean(bi)表示回归向量 b 的平均值,S(bi)为表示回
归向量 b的标准偏差,i表示光谱矩阵中第 i列向量。根据
Ci 的绝对值大小确定是否把第 i 列变量用于最后 PLS 回
标准差
0.935
0.945
均值
9.032
9.145
范围
6.35~11.6
7.45~10.3
样本数
60
20
校正集
预测集
表 1 沙梨样本的糖度统计数据
糖度
项目
186
C M Y K
RMSECV
0.5033
0.4518
0.4470
0.4470
0.5545
0.5216
RV
0.8494
0.8771
0.8801
0.8801
0.8166
0.8410
RMSEC
0.3113
0.2898
0.2819
0.2820
0.3544
0.3323
Rc
0.9420
0.9499
0.9527
0.9526
0.9259
0.9352
预处理

SNV
MSC
SNV+MSC
S.Golay
Baseline
表 2 不同预处理方法建立的沙梨糖度 PLS 模型
糖度
注:Rc为校正相关系数,RMSEC 为校正均方根误差,RV为验证
相关系数,RMSECV 为验证均方根误差。
RMSEP
0.451
0.268
Rp
0.8723
0.9508
光谱变量
234
234
建模方法
BP神经网络
PLS 模型
表 3 BP 神经网络与 PLS 模型预测效果比较
糖度
16
14
12
10
8
6
4
2
0
1 201 401 601 801
光谱变量 随机变量



图 3 UVE 稳定性分布曲线
12
11
10
9
8
7
7 8 9 10 11 12
实测值
图 4 BP 神经网络的预测回归图



y=0.842x+1.477
R=0.8723
10.5
10.0
9.5
9.0
8.5
8.0
7.5
7.0



7 8 9 10 11
实测值
图 5 PLS 模型预测值与真实值的回归图
y=0.912x+0.691
R=0.9508
归模型中。 具体算法步骤参考文献[15]。
2 结果与分析
2.1 光谱数据预处理
在光谱数据获取时,由于仪器或检测环境、光照强弱
等因素影响,导致光谱数据夹杂着很多的噪声。 为最大限
度地提取光谱内的有效信息, 我们分别采用了变量标准
化 (Standard Normal Variate, SNV)、 多 元 散 射 校 正
(Multiplicative Scatter Correction, MSC)、 平 滑 滤 波 (S.
Golay)、基线校正(Baseline)以及 SNV与 MSC 相结合的方
法对原始光谱数据进行预处理。
通过对原始光谱数据的进行不同预处理,分别采用偏
最小二乘法建模, 分析比较不同预处理方法下对沙梨样
本集的原始光谱消噪效果。 由表 2可知,通过比较未经过
预处理以及多种预处理后的数据, 发现其验证相关系数
均在 0.81 以上,且验证均方根误差较小,其中以 MSC 预
处理效果最好,其糖度的校正相关系数达到 0.9527,验证
相关系数达到 0.8801。因此后续分析均采用经多元散射校
正处理后的光谱数据。
2.2 无信息变量消除法优选波长
全波段光谱数据包含数百个光谱变量,其中包含一部
分相关性不大的光谱信息,同时在建模分析时,由于输入
变量太多,不仅造成计算量过大,而且严重影响建模精度
和建模稳定性,因此必须压缩模型光谱变量的个数,提高
模型校正的速度和建模效率。
使用校正集 60 个沙梨样本建立糖度校正模型。 将
400~1 000 nm 范围的全波段光谱数据采用无信息变量消
除法进行压缩, 在使用无信息变量消除法对光谱变量进
行压缩时,将随机产生噪声变量个数设置为 487 个,同时
为了避免引入的随机噪声过大而影响整个预测模型,将
个别影响较大的随机噪声剔除, 再引入相同数量随机噪
声与所测光谱数据组成共 974个变量。
图 3 所示的为采用无信息变量消除法得出的沙梨糖
度稳定性 C 分布曲线, 根据稳定性 C 分布曲线保留光谱
变量中大于随机变量最大值的光谱, 最终得出糖度光谱
变量为 234个。
2.3 建模效果比较
采用 BP 神经网络和 PLS 对压缩后的光谱进行建
模,并对预测集中沙梨样本进行预测,预测结果如表 3
所示,预测值与实测值回归曲线如图 4、图 5 所示。 采
用 BP 神 经 网 络 对 沙 梨 糖 度 预 测 的 相 关 系 数 为
0.8723,而 PLS 模型预测的相关系数达到 0.9508,试验
结果表明 : 无信息变量消除法能有效提取特征波段 ,
剔除不敏感波段 ,提高模型预测能力 ,而采用 PLS 模
型能有效地对沙梨糖度进行预测 , 明显优于 BP 神经
网络模型。
187
C M Y K
Camshift 跟踪算法, 充分利用不同特征之间的互补性,更
好地适应了猪舍环境的变化; 利用 Kalman 滤波, 克服
Camshift 算法不能进行运动预测的缺点。 实验结果表明,
多特征 Camshift 与Kalman 滤波结合的跟踪算法优于传统
的 Camshift算法。本研究为实现全天候无接触的猪只智能
跟踪、获取猪只的状态信息、及时发现异常情况以及深入
开展猪只健康养殖研究提供了一个新的思路。 然而,联合
特征概率分布图计算公式有 3个参数需凭经验来设定,因
此如何实现参数的自适应确定来提高猪只跟踪的准确率
是今后需要进一步研究的内容。
参考文献:
[1] 钟芳葵.基于 RFID 和 ARM 嵌入式技术的猪行为自动监测系统
设计[D].镇江:江苏大学,2010.
[2] Weixing Zhu,Fangkui Zhong,Xiangping Li. Automated Monitoring
System of Pig Behavior Based on RFID and ARM-LINUX[J].
Intelligent Information Technology and Security Informatics,
2010,62(l):431-434.
[3] 浦雪峰,朱伟兴,陆晨芳.基于对称像素块识别的病猪行为监测系
统[J].计算机工程,2009,35(21):250-252.
[4] 浦雪峰.基于行为监测的病猪自动识别系统设计[D].镇江 :江苏
大学,2009.
[5] Otsu N. A Threshold Selection Method from Graylevel Histogr-
am[J].IEEE Trans System Man Cybernet, 1978,SMC-8:62-66.
[6] Bradski G.R. Computer Vision Face Tracking For Use in a
Perceptual User Interface[C]/ /Proceedings IEEE Workshop on
Applications of Compu.Princeton, NJ,1998:214-219.
[7] Ojala T, Matti Pietika咬 inen, D. Harwood. A Comparative Study of
Texture Measures with Classification based on Feature
Distributions[J].Pattern Recognition,1996,29(1):51-59.
[8] Ojala T, Matti Pietika咬 inen, Topi Ma咬 enpa咬 a咬 .Multiresolution Gray-
scale and Rotation Invariant Texture Classification with Local
Binary Patterns [J].IEEE Transactions on Pattern Analysis and
Machine Intelligence,2002,24(7):971-987.
[9] M a咬 enp a咬 a咬 T, M Pietik a咬 inen.Handbook of Pattern Recognition
and Computer Vision[M].World Scientific,Singapore,2001:711-736.
[10] 钱永青,谢勤岚.结合 Camshift和 Kalman预测的运动目标跟踪[J].
计算机工程与科学,2010,32(8):81-83,137.
[11] 孙红光,张瑾,刘延涛等.基于多特征 CamShift 优化的粒子滤波跟
踪[J].光电工程,2010,37(2):1-6,31.
[12] M S,Maskell S,Gordon N. A Tutorial On Particle Filters for
On -line Nonlinear/Non -Gaussian Bayesian Tracking [J] . IEEE
Transactions on Signal Processing(S1053-587X),2002,50(2):174-
188.
3 结语
本研究利用高光谱图像技术采集沙梨样本光谱数据,
采用多元散射校正以及无信息变量消除法对光谱变量进
行处理,建立沙梨糖度预测模型。 采用变量标准化、多元
散射校正、平滑滤波、基线校正等预处理方法对原始光谱
数据进行处理, 多元散射校正能更有效地提高光谱数据
的信噪比,降低在试验过程中外部因素带来的噪声影响,
使得后期建立模型更理想。 无信息变量消除法将光谱变
量压缩到 234 个,有效地减少建模的输入变量,同时剔除
了对待测成分不敏感的波段, 所建立的 PLS 预测模型和
BP神经网络的预测相关系数均在 0.85以上。 在建模效果
比较中,PLS 预测模型的相关系数达到 0.9508, 均方根误
差为 0.268,明显优于 BP神经网络模型。 本研究将高光谱
图像技术与无信息变量消除法相结合,建立沙梨糖度 PLS
预测模型,为实现水果快速、无损检测奠定了理论基础。
参考文献:
[1] 潘璐 ,王加华,李鹏飞,等 .沙梨糖度近红外光谱波段遗传算法优
化[J].光谱学与光谱分析,2009,29(5):1246-1250.
[2] 严衍禄.近红外光谱分析基础与应用[M].北京 :中国轻工业出版
社,2005.
[3] 洪涯,洪添胜,代芬,等.连续投影算法在砂糖橘总酸无损检测中
的应用[J].农业工程学报,2010,26(S):380-384.
[4] 黄培贤,姚志湘,栗晖,等.高光谱图像技术在食品无损检测中的
研究进展[J].食品工业科技,2012(15):412-417.
[5] 代芬,洪添胜,罗霞,等.基于可见-近红外光谱的砂糖橘总酸无损
检测[J].华中农业学报,2012,31(4):518-523.
[6] 田友文,李天来,张琳,等.高光谱图像技术诊断温室黄瓜病害的
方法[J].农业工程学报,2010,26(5):202-206.
[7] 洪添胜,李震,吴春胤,等.高光谱图像技术在水果品质无损检测
中的应用[J].农业工程学报,2007,23(11):280-285.
[8] Elmasry G, Wang N, Elsayed A, et al. Hyperspectral imaging
for nondestructive determination of some quality attributes for
strawberry[J].Journal of Food Engineering,2007,81(1):98-107.
[9] Cogdill R P, Hurburgh C R, Rippke G R.Single—kernel maize
analysis by near—infrared hyperspectral imaging [J].Transactions
of the ASAE,2004,47(1):311-320.
[10] 洪添胜,乔军,Wang N,等.基于高光谱图像技术的雪花梨品质无
损检测[J].农业工程学报,2007,23(2):151-155.
[11] 程国首,郭俊先,吴京珠,等.基于高光谱图像技术的新疆红富士
苹果重量预测[J].新疆农业大学学报,2011,34(3):249-252.
[12] 索少增,刘翠玲,吴静珠,等.高光谱图像技术检测梨表面农药残
留试验研究[J].北京工商大学学报,2011,29(6):73-77.
[13] 吴迪,吴洪喜,蔡景波,等.基于无信息变量消除法和连续投影算
法的可见-近红外光谱技术白虾种分类方法研究[J].红外与毫米
波学报,2009,29(6):423-427.
[14] 陈斌,陈蛋.无信息变量消除法在近红外光谱测定的应用[J].光谱
仪器与分析,2005(4):26-30.
[15] Centner V, Massart D L, DeNoord O E, et al. Elimination of
uninformative variables formultivariate calibration [J]. Anal. Chem.
1996, 68(21):3851-3858.
(上接第 177页)
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
188
C M Y K