免费文献传递   相关文献

基于支持向量机的苹果叶部病害识别方法研究



全 文 :山 东 农 业 科 学 2015,47(7):122 ~ 125,141 Shandong Agricultural Sciences
DOI:10. 14083 / j. issn. 1001 - 4942. 2015. 07. 028
收稿日期:2015 -02 -13
基金项目:河南省科技厅科技发展计划项目(No. 134300510037)
作者简介:王建玺(1981 -) ,女,河南社旗人,讲师,硕士,主要研究方向:模式识别、图像处理等。E - mail:wangjianxi81@ 163. com
基于支持向量机的苹果叶部病害识别方法研究
王建玺,宁菲菲,鲁书喜
(平顶山学院软件学院,河南 平顶山 467000)
摘 要:为提高苹果叶部病害自动识别水平并实现快速有效地识别苹果叶部病害,本研究首先采用小波
滤波算法对采集的苹果叶部锈病、斑点落叶病的图像进行去噪平滑,然后利用病斑颜色差异和边界跟踪算法
对病斑进行分离,最后提取病斑颜色、形状和纹理等方面的特征,采用支持向量机(SVM)技术对病害进行自
动识别。试验表明,该方法对苹果叶锈病和斑点落叶病样本进行处理识别的正确率较高,能够满足实际需求。
该结果对苹果叶部病害的自动快速诊断和防治具有一定的指导意义。
关键词:苹果叶部病害;小波滤波算法;最大类间方差法;边界跟踪算法;支持向量机(SVM) ;模式识别
中图分类号:S436. 611:TP391. 4 文献标识号:A 文章编号:1001 -4942(2015)07 -0122 -05
Study on Apple Leaf Disease Recognition
Method Based on Support Vector Machine
Wang Jianxi,Ning Feifei,Lu Shuxi
(College of Software,Pingdingshan University,Pingdingshan 467000,China)
Abstract To improve the level of automatic identification and implement quickly and effectively identifi-
cation of apple leaf diseases,the images of rust and alternaria leaf spot were firstly pre - processed using wave-
let filtering algorithm,then,the disease spots were correctly segmented based on color difference and boundary
following algorithm,finally,the disease features of color,shape and texture were extracted for auto - recogniz-
ing via SVM technology. The tests showed that the method showed a high accuracy for disease recognition and
could meet the actual needs. The results had certain significance to the rapid automatic diagnosis and control
of apple leaf diseases.
Key words Apple leaf diseases;Wavelet filtering algorithm;Otsu method;Boundary following algo-
rithm;Support vector machine (SVM) ;Pattern recognition
苹果是我国常见的一种经济作物,全国种植
面积达 600 余万公顷。在苹果种植过程中,病害
对其产量和品质影响非常大,据统计,病害致使果
农每年平均损失高达 12% ~ 16%。为防治病害,
果农长期大规模使用农药,不仅造成苹果农药含
量超标,还污染环境,影响自然界的生态平衡,给
人类和环境都带来了极大的伤害[1]。因此,研究
并实现苹果病害的快速有效诊断,便于果农及时
准确地掌握病害信息,并有针对性地采用科学合
理的方法进行防治,有利于苹果的优质高产,从而
减少果农的经济损失,降低对环境的破坏。本研
究利用图像处理技术和模式识别技术,针对苹果
叶部病害———锈病和斑点落叶病,提出了一种基
于支持向量机(Support Vector Machine,SVM)的
苹果病害自动快速识别方法。
1 病害图像获取与预处理
1. 1 图像获取
图像采集是实现病害自动识别的一个很关键
的环节[2],如果前期获取的图像存在某方面缺陷
或不足,就会给后续的图像分割和识别带来较大
困难,而且对后续图像处理和图像识别的策略和
方法也会产生较大的影响[3]。因此,为获取标准
可靠的图像,本研究相关人员在植保专家的指导
下,在河南农业大学园艺学院研究基地,在自然光
照较好的情况下,使用分辨率设定为 640 × 480 的
佳能数码相机进行拍摄,采集到苹果叶部病
害———锈病、斑点落叶病、花叶病的图像共计
1 244幅,用图像处理软件 Photoshop 简单处理后
以. JPG格式存储于电脑上供后续使用。
1. 2 图像去噪
在图像采集过程中,不可避免的存在一些噪
声,如数码相机的脉冲噪声,故需对图像进行平滑
处理以消除图像的干扰信息,保留并增强有用信
息,提高后续图像处理的速度和可靠性。常用的
对彩色图像进行去噪的方法有矢量中值滤波法、
偏微分方程滤波法和小波滤波法,其中,矢量中值
滤波法存在滑动窗口大小不易确定、滑动窗增大
时运算量增加过快的缺点;偏微分方程滤波法虽
有平滑图像噪声效果好和能够保留边缘细节特征
的优点,但存在迭代处理时间过长的问题[4];小波
滤波法虽然设计起来比较复杂,但可以灵活选择处
理的尺度,时频分辨效果好,且能够有效减少干扰,
在信号处理领域应用比较广泛。故本研究基于
haar和 sym4小波基分别对图像进行滤波处理。
利用小波变换对图像进行滤波的思路:首先
确定噪声小波的系数值,即通过比较小波变换中
少数变换域系数的量能值和分散的噪声小波系数
的量能值来确定小波系数,这一过程称为阈值化;
若小波系数绝对值比确定的阈值小就归零,否则
就缩减比阈值大的小波系数,从而过滤掉噪声;然
后通过小波逆变换得到最终所需的信息。阈值的
计算公式为:
δ = 2logN槡 σ (1)
式中,δ是阈值;N 是有限长度的小波信号;σ 是
噪声的方差。
采用小波变换对彩色图像进行滤波的算法过
程描述如下:
步骤 1:将病害图像分解成 R、G、B 三个矩
阵,分别计算 R、G、B三个矩阵的小波变换系数 F
和小波系数阈值;
步骤 2:按照式(2) ,对系数 F 进行阈值化处
理,得到新的小波系数;
Fδ =
sgn(F) (| F | - δ) | F |≥δ
0 | F | <{ δ (2)
步骤 3:对小波进行逆变换处理,将分别去噪
后的 R、G、B重新组合在一起。
采用 Matlab7. 0 编程实现苹果叶部病害图像
的滤波,以苹果叶部锈病为例,采用小波滤波算法
进行处理,选用基于 haar 和 sym4 的两层小波分
解滤波和软阈值化的处理方法,滤波后效果如图
1 所示。为评价滤波效果,选用处理时间、均方误
差(Mean Squared Error,MSE)及峰值信噪比
(Peak Signal to Noise Ratio,PSNR)这三种常用的
评价指标对处理结果进行评价,评价结果如表 1
所示,可见,基于 haar和 sym4 的小波基图像处理
效果都比较好,其中,当小波基为 sym4 时,信噪比
高、均方误差低,但处理时间比较长。
图 1 苹果叶部锈病图像小波滤波结果
表 1 小波滤波评价结果
评价指标 基于 haar小波基 基于 sym4 小波基
MSE 112. 3161 96. 0791
PSNR 25. 8041 28. 6036
处理时间(s) 0. 2513 0. 4627
1. 3 图像分割
病斑图像分割的效果直接影响病害识别的结
果,虽然目前图像分割的方法和种类非常多,但还
没有一个完善的理论来指导如何根据图像的自身
特点选用合适的分割方法[5]。在实际对图像进
321第 7 期 王建玺,等:基于支持向量机的苹果叶部病害识别方法研究
行分割时,多根据经验去选择方法,然后经过多次
尝试找到最佳的分割算法。本研究通过对采集到
的苹果锈病、斑点落叶病病斑[6]外观进行观察,
发现这些病斑的外边界比较清晰,故提出利用颜
色特征和边界跟踪算法进行病斑分割的方法,具
体步骤如下:
步骤 1:图像预处理后,利用公式(3)提取图
像的颜色特征值 Sg、Sr,并绘制成相应的直方图。
Sg = 2G - R - B
Sr{ = 2R - G - B (3)
其中,R、G、B 分别为该图像 red、green、blue 通道
的像素值。
步骤 2:根据 Sg、Sr 所对应的直方图,用最大
类间方差法计算阈值 Ta、Tb,利用公式(4)对病害
图像进行分割。
fPs(x,y)=
(0,0,0) Sg > Ta + 10 且 Sr < Tb - 10
fPr(x,y) Sg < Ta + 10 且 Sr > Tb
{ - 10
(4)
其中,(x,y)为像素点的坐标值;fPr(x,y)为原始
图像中对应点的像素值;fPs(x,y)为病斑初始分
割区域中对应点的像素值。因此,该病斑初始的
分割区域 M可表示为:
M ={Ps(x,y) fPs(x,y)≠(0,0,0) } (5)
其中,Ps(x,y)是病斑初始分割区域中的像素点。
步骤 3:利用公式(6)将分割后的彩色图像转
化为灰度图像 G,接着利用最大类间方差法获取
阈值并将灰度图 G转化为二值图像 P。处理后的
图像会存在干扰噪声或者边缘出现毛刺状,不利
于后续轮廓的提取,故需用形态学滤波器对二值
图像 P进一步平衡去噪。
Y =0. 212671R +0. 715160G +0. 072169B
(6)
步骤 4:利用边界跟踪算法从二值图像 P 中
获取病斑 M 的外边缘轮廓,获取轮廓后,根据公
式(7)从原始图像中获取完整彩色病斑,如图 2
所示。
fpd(x,y)=
(0,0,0) pr(x,y)M
fpr(x,y) Pr(x,y)∈
{ M (7)
其中,fpd(x,y)是病斑区域中Pd(x,y)像素点的像
素值;Pr(x,y)是原始图像中像素点。
图 2 分割后的图像
本研究采用上述分割方法分别对 468 张苹果
锈病病害图像和 524 张斑点落叶病病害图像进行
病斑分割,将分割后的每种病斑图像等分成两份,
分别作为训练样本和识别样本;另外选取 252 张
苹果花叶病图像作为验证样本。
2 病害图像特征提取
在病害图像的识别过程中,图像特征参数的
选取和计算是非常关键的环节,参数的好坏关系
到识别系统识别的精确度、效果和最终结果。苹
果叶部病斑特征包括病斑颜色、形状和纹理等,其
中颜色特征非常明显,与获取的病斑图像的大小、
方向和角度相关性较小,可通过直方图进行处理;
形状是对图像封闭边界和封闭区域的描述,能很
好地反映病斑图像特征,故在病害识别领域颜色
和形状使用都很广泛[7];图像的纹理特征是从遥
感图像的处理识别过程中发展起来的,目前在图
像的分析识别研究中应用也非常广泛,纹理特征
需要在灰度共生矩阵的基础上进行提取和分析。
本研究利用苹果叶部分割出来的病斑,从形状、纹
理和颜色三方面特征出发,根据易区分、高可靠
性、不相关性和适度复杂度等原则,提取了 6 个特
征参数:颜色特征中的均值和方差,形状特征的紧
凑度和伸长度,纹理特征的惯性矩和熵,它们的计
算方法如下:
(1)颜色特征均值:反映了病斑图像的平均
亮度。在病害图像的 L直方图中,设 q为灰度值,
p(q)为灰度值为 q的像素的概率值,均值可表示
为:
μL =∑q qp(q) (8)
(2)颜色特征方差:反映了图像灰度级分布
的离散性。可表示为:
σ2L =∑q (q - μL)
2p(q) (9)
(3)形状特征紧凑度:用来描述区域紧凑程
421 山 东 农 业 科 学 第 47 卷
度的参数。可表示为:
C =1 - 4πS
L2
(10)
其中,S 为病斑区域的面积,L 为病斑区域的周
长。紧凑度反映了病斑边界的复杂性,当 C 值为
0 时,表示病斑为圆形;C 值较大时,表示目标区
域的紧凑度低,边界比较粗糙。可以看出对病斑
图像进行缩放或者旋转都不影响病害紧凑度,故
该参数能很好地描述病害的特征。
(4)形状特征伸长度:伸长度也称偏心率,反
映了病害区域的紧凑性。计算公式为:
E = (A + B)- (A - B)
2 + 4H槡 2
(A + B)+ (A - B)2 + 4H槡槡 2 (11)
其中,A =∑mi(y
2
i + z
2
i) ,B =∑mi(x
2
i + z
2
i) ,均为
转动惯量;H =∑mixiyi 为惯性积。图像为圆形
时,伸长度为 1;为其它形状时,E 均大于 1。伸长
度也不受病斑图像缩放、移动或旋转的影响。
(5)纹理特征惯性矩:即对比度,反映病斑小
区域内图像灰度变化总量,其值表示整个图像的
灰度变化情况。当病害图像纹理较细时,其惯性
矩较大。计算公式为:
CON =∑
i

j
(i - j)2p(i,j,d,θ) (12)
(6)纹理特征熵:反映病害图像中纹理的非
均匀程度或复杂程度。计算公式为:
ENT = -∑
i

j
p(i,j,d,θ)lnp(i,j,d,θ) (13)
3 基于 SVM的苹果病害识别
支持向量机由 Vapnik 于 20 世纪 90 年代[8]
第一次提出,是基于统计学理论的新的机器学习
分类方法。传统的分类识别模式大都基于经验风
险最小化的原理,而该方法是基于结构风险最小
化的原理,目的是为了减少训练和置信区间的误
差。大量实践证明,SVM 在处理小样本、非线性
和高维模式识别诊断问题中效果较好[9]。其主
要思想是:在二维且两类线性可分情况下,寻找能
使两类样本正确分开并且分类间隔最大的分类
线,若推广到多维空间中,则叫做最优分类面,该
决策面能通过二次规划问题计算出来[10]。
病斑识别是图像处理的核心环节,本研究首
先对 992 个病斑样本的特征值集合进行提取计
算,等分成两部分,一部分用于训练,另一部分用
于识别检验,然后使用 SVM分类器对样本进行学
习,再利用检验样本进行分类测试,其识别技术路
线如图 3 所示。
图 3 病害识别技术路线
在 VC6. 0 环境下编写支持向量机,其中核函
数为 k(x,y)= exp(- r2‖x - y‖)2,根据实际情
况,式中参数的最佳取值为 0. 0005,其中输入数
据为从每幅苹果叶部病害图片中提取的 6 个特征
值,输出为 3 种病害。首先用获取的 496 幅训练
样本的参数集进行训练来获取支持向量机模型,
然后根据训练的结果对另外 748 幅检验样本进行
预测,预测结果如表 2 所示。可以看出,对锈病和
斑点落叶病这种病斑形状轮廓比较独立完整的病
害的平均识别准确率较高,验证了本技术手段的
可行性;但对花叶病这样边缘轮廓不清晰的病害
识别效果不明显。在实际生产中,把自动识别和
果农的经验结合起来,就可以快速有效地对苹果
叶部病害进行识别,并且研究中采用的 SVM算法
简易,不会出现不收敛或者随机性大的状况。
表 2 利用支持向量机分类器识别的病害结果
样本 病害名称 输入数目识别数目误识数目拒识数目
训练 锈病 234 234 0 0
样本集 斑点落叶病 262 262 0 0
锈病 234 212 22 0
验证样本集 斑点落叶病 262 231 31 0
花叶病 252 0 16 236
4 结束语
本研究采用图像处理技术和基于 SVM的模式
识别技术实现了对苹果叶部病(下转第141页)
521第 7 期 王建玺,等:基于支持向量机的苹果叶部病害识别方法研究
(Diptera,Sciaridae) [J]. Brazilian Journal of Medical and
Biological Research,2010,43(12) :1143 - 1152.
[34] De Almeida J C. A 28 - fold increase in secretory protein syn-
thesis is associated with DNA puff activity in the salivary gland
of Bradysia hygida (Diptera,Sciaridae) [J]. Brazilian Jour-
nal of Medical and Biological Research,1997,30:605 - 614.
[35] Monesi N,Sousa J F,Paó - Larson M L. The DNA puff
BhB10 - 1 gene is differentially expressed in various tissues of
Bradysia hygidalate late larvae and constitutively transcribed in
transgenic Drosophila [J]. Brazilian Journal of Medical and
Biological Research,2001,34:851 - 859.
[36] Fontes A M,Conacci M E,Monesi N,et al. The DNA puff
BhB10 - 1 gene encodes a glycine - rich protein secreted by the
late stage larval salivary glands of Bradysia hygida[J]. Gene,
1999,231 (29) :67 - 75.
[37] Fontes A M,de Almeida J C,Edstrom J E,et al. Cloning of a
B - 10 DNA puff sequence developmentally amplified and ex-
pressed in the salivary gland of Bradysia hygida[J]. Brazilian
Journal of Medical and Biological Research,1992,25:777 -
780.
[38] Conacci M E,Coelho P S R,Valente V,et al. The control of
BhB10 - 1 gene expression in the salivary gland of Bradysia hy-
gida(Diptera,Sciaridae) is disrupted in vivo by a delayed
effect of cycloheximide[J]. Insect Biochemistry and Molecular
Biology,2002,32 (7) :737 - 745.
[39] Monesi N,Silva J A Jr,Martins P C,et al. Immunocharacter-
ization of the DNA puff BhC4 - 1 protein of Bradysia hygida
(Diptera:Sciaridae) [J]. Insect Biochemistry and Molecular
Biology,2004,34:531 - 542.
[40] Monesi N,Candido - Silva J A,Paó - Larson M L,et al.
Regulation of sciarid DNA puffs by ecdysone:mechanisms and
perspectives[M]/ /Smagghe G. Ecdysone: structures and
functions. Netherlands:Springer Science + Business Media B.
V. 2009,165 - 183.
[41] Soares M A M,Monesi N,Basso L R Jr,et al. Analysis of the
amplification and transcription of the C3 - 22 gene of Rhyncho-
sciara americana (Diptera,Sciaridae) in transgenic lines of
Drosophila melanogaster[J]. Chromosoma,2003,112:144 -
151.
[42] Dibartolomeis S M,Gerbi S A. Molecular characterization of
DNA puff Ⅱ /9A genes in Sciara coprophila[J]. Journal of
Molecular Biology,1989,210:531 - 540.
[43] Gerbi S A,Liang C,Wu N,et al. DNA amplification in DNA
puff Ⅱ /9A of Sciara coprophila[J]. Cold Spring Harbor Sym-
posia on Quantitative Biology,1993,58:487 - 494.
[44] De Carvalho D P,Coelho P S R,de Almeida J C. A dual role
of 20 - hydroxyecdysone in the control of protein synthesis relat-
ed to DNA puff activity in the anterior region of Bradysia hygi-
da (Diptera,Sciaridae)salivary gland[J]. Insect Biochemis-
try and Molecular Biology,2000,30:541 - 548.
[45] Candido - Silva J A,Monesi N. Bradysia hygida (Diptera,
Sciaridae)presents two eukaryotic Elongation Factor 1A gene
homologues:partial characterization of the eukaryotic elongation
factor 1A - F1 gene[J]. Brazilian Journal of Medical and Bio-
logical Research,2010,43(5) :
櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠櫠
437 - 444.
(上接第 125 页)害的自动识别,介绍了病害图像
获取、采用小波滤波技术去噪、基于病斑颜色和边
界跟踪法的图像分割及基于 SVM 的模式识别的
过程,该系统能快速识别苹果叶部病害且识别率
较高。本研究对于提高苹果病害的快速识别、减
少农药的滥用和提高产量具有一定的指导意义。
参 考 文 献:
[1] 李宗儒,何东健.基于手机拍摄图像分析的苹果病害识别技
术研究[J]. 计算机工程与设计,2010,31(13) :3051 -
3053.
[2] 刁智华.大田小麦叶部病害智能诊断系统研究与应用[D].
合肥:中国科学技术大学,2010.
[3] 李宗儒.基于图像分析的苹果病害识别技术研究[D]. 杨
凌:西北农林科技大学,2010.
[4] 田有文,李天来,李成华,等.基于支持向量机的葡萄病害图
像识别方法[J].农业工程学报,2007,23(6) :175 - 180.
[5] Zheng L Y,Zhang J T,Wang Q Y. Mean - shift - based color
segmentation of images containing green vegetation[J]. Com-
puters & Electronics in Agriculture,2009,65(1) :93 - 98.
[6] 李保华,王彩霞,董向丽.我国苹果主要病害研究进展与病
害防治中的问题[J].植物保护,2013,39(5) :46 - 54.
[7] 宋凯.基于计算机视觉的农作物病害识别方法的研究[D].
沈阳:沈阳农业大学,2008.
[8] Vapnik V N. The nature of statistical learning theory[M]. 2nd
ed. Springer - Verlag New York Inc.,1999.
[9] Vioix J B,Douzals J P,Truchetet F. Development of a spatial
method for weed detection and localization[C]/ / Frédéric
Truchetet. Wavelet Applications in Industrial Processing.
SPIE,Bellingham,WA,2004:169.
[10] Yue S H,Li P,Hao P Y. SVM classification:Its contents and
challenges[J]. Appl. Math. J. Chinese Univ. (Ser. B) ,
2003,18(3) :332 - 342.
141第 7 期 高欢欢,等:眼蕈蚊科昆虫唾液腺研究进展