免费文献传递   相关文献

基于主分量分析的苹果叶部3种常见病害识别方法



全 文 :师 韵,王旭启,张善文. 基于主分量分析的苹果叶部 3 种常见病害识别方法[J]. 江苏农业科学,2016,44(9) :337 - 340.
doi:10. 15889 / j. issn. 1002 - 1302. 2016. 09. 098
基于主分量分析的苹果叶部 3 种常见病害识别方法
师 韵,王旭启,张善文
(西京学院信息工程学院,陕西西安 710123)
摘要:苹果叶部的 3 种常见病害(斑点落叶病、花叶病和锈病)严重影响苹果的产量和质量。病害识别是病害防
治的基础,传统的苹果病害识别方法不能有效选择病害的分类特征。基于主分量分析算法,提出一种叶片颜色、形状
和纹理特征相结合的苹果病害识别方法。首先对苹果病害叶片图像进行预处理,降低图像干扰;然后利用改进的分水
岭方法分割病斑,提取病斑图像的颜色、形状和纹理特征,组成特征矩阵;再利用主分量分析(PCA)对该矩阵进行维数
约简,得到低维分类特征;最后利用 BP神经网络识别苹果的 3 种病害类型。结果表明,该方法能够有效识别苹果的 3
种病害,平均识别率超过 94%。
关键词:苹果病害识别;特征提取;主分量分析(PCA) ;BP神经网络
中图分类号:S126;TP391. 41 文献标志码:A 文章编号:1002 - 1302(2016)09 - 0337 - 04
收稿日期:2015 - 08 - 03
基金项目:国家自然科学基金(编号:61473237) ;陕西省教育厅专项
科研计划(编号:XJ13ZD01) ;陕西省教育厅科研项目(编号:
16JK2237)。
作者简介:师 韵(1968—) ,女,陕西西安人,硕士,工程师,主要从事
计算机数据分析研究。E - mail:shiyun@ xijing. edu. cn。
通信作者:张善文,博士,教授,主要从事模式识别及其在植物识别中
的应用研究。E - mail:wjdw716@ 163. com。
苹果含有丰富的碳水化合物、维生素、微量元素和果胶
等,是世界水果中产量和消费以及益处最多的水果之一。但
是,苹果病害严重影响了苹果的产量和质量[1 - 3]。当前,西部
广大果农病害防治技术水平不高,防治粗放,农药乱配滥用现
象比较普遍,造成果品农药残留超标,果品质量下降,且防治
成本大。要防治苹果病害,首先要识别病害类型[4 - 8]。叶片
是很容易观察、采集和处理的部位,也是一般苹果病害症状首
先出现的部位。因此,多年来苹果叶片症状是果农和植保人
员诊断病害的重要依据之一。目前苹果病害诊断大多采用经
验定性诊断方法。该方法的主观性较强,对专家的依赖性较
高,容易混淆症状相似的病害。为了准确识别病害,计算机图
像处理是一种很好的方法,但由于苹果病害种类多,病害叶片
形状及叶片病斑的颜色、纹理和形状的差异性大,呈现出复
杂、多样、无规则的特点,使得目前很多病害识别方法的效果
不理想[5,9 - 11]。本研究提出一种基于主分量分析(PCA)的苹
果病害叶片的颜色、形状和纹理特征相结合的苹果病害识别
方法,该方法综合提取苹果病害叶片图像的多种分类特征,然
后利用 PCA进行维数约简,再利用 BP神经网络进行训练,实
现对苹果病害的快速分类识别。
1 材料与方法
为了研究基于苹果病害叶片图像处理的苹果病害识别的
方法,选用了 3 种易混淆的常见苹果病害:斑点落叶病、花叶
病和锈病为研究对象。苹果斑点落叶病危害叶片,造成早落,
叶片染病初期出现褐色圆点,其后逐渐扩大为红褐色;苹果花
叶病主要在叶片上形成环斑型、狼斑型等各种类型的鲜黄色
病斑;苹果锈病叶片初患病正面出现油亮的橘红色小斑点,逐
渐扩大,形成圆形橙黄色的病斑,内含大量褐色粉末状锈孢
子。肉眼不容易区分斑点落叶病和锈病 2 种病害。本研究所
使用的这 3 种苹果病害叶片图像均是在西北农林科技大学苹
果园利用佳能 EOS 700D单反数码相机在上午 10:00—11:00
时间段采集得到。为了便于后续处理,以灰色纸片作为背景
色,在自然光照的非强光条件下对自然发病的苹果叶片进行
活体图像采集,得到苹果病害叶片数字图像。拍摄时尽量使
相机的镜头与苹果叶面所在的平面平行,使光线在苹果叶片
上均匀分布,避免产生明显的形变。为了使测量准确,每次采
集叶片图像时,尽量使苹果叶片充满整个画面。由于拍摄环
境的影响,采集到的有些叶片图像难免存在阴影和大量噪声。
因此,在采集到的数字叶片图像中挑选出光照较均匀的图像
各 50 幅作为试验的样本图像。图 1 为试验中采集到的苹果
常见 3 种病害叶片图像实例,图像格式为 BMP,图像宽度为
320 像素、高度为 240 像素。
2 苹果病害叶片图像预处理
苹果病害叶片图像的质量直接影响后续的病害识别率。
在叶片图像采集过程中,由于受到采集设备、环境等影响,图
像存在分辨率低、背景复杂、病斑边缘模糊等特点。所以,需
要对病害叶片图像进行预处理。常用的病害叶片图像预处理
操作有图像格式转化、图像去噪、图像增强、削弱图像中颜色、
叶柄、虫洞等无用或干扰信息,使病斑区域的特征更明显。为
了有效去除噪声,较好地保留图像的细节并突出病斑特征,在
试验对比的基础上,首先选用自适应直方图均衡化方法,扩展
叶片图像灰度范围,对叶片图像进行对比度增强,然后选用叶
片彩色图像中值滤波方法,即在叶片图像的 R、G、B通道上分
别应用中值滤波方法滤波后,再进行通道融合,得到滤波后的
彩色图像,较好地抑制叶片图像的噪声,保留叶片图像的分类
信息。再利用Top - Hat方法与归一化彩色空间法相结合,
—733—江苏农业科学 2016 年第 44 卷第 9 期
可使不同光照度下所采集的叶片图像的 R、G、B 通道数据处
理结果差异很小,以此降低图像亮度对色彩的影响。图 2 为
叶片图像预处理流程。
3 苹果叶片图像病斑分割
病斑图像分割是病害叶片图像分析与模式识别中一个重
要的环节,病斑分割的好坏直接影响后续特征提取与识别结
果。本研究的对象是自然环境下拍摄的苹果病害叶片图像,
背景复杂、分辨率低,不能直接用于病害分类特征提
取[3,10 - 11]。因此,采用改进的水平集彩色图像分割方法,即基
于区域和边缘的变分水平集彩色图像分割方法[12 - 13]。该方
法充分利用了目标图像的区域信息和边缘信息,并用欧氏距
离代替了灰度加权值,使得彩色图像的颜色空间信息得到充
分利用。首先,用 N1 个水平集函数将图像分割成 N(N ﹥ 1)
个区域,每个水平集函数代表 1 个分割区域,通过建立独立多
水平集函数可以消除冗余的轮廓,从而避免分割区域的重叠
和漏分,获得更加精确的颜色边缘。为了避免水平集函数在
每次迭代后需重新初始化符号距离函数,增加的能量惩罚项
能使水平集函数在演化过程中保持为逼近的符号距离函数。
再将分割的病斑归一化图像转化为灰度图。最后,采用形态
学中的开运算和闭运算处理,得到不受叶片虫洞和叶柄等影
响的二值化图像。3 种苹果病害叶片原图与病斑分割结果如
图 3 所示。
4 特征提取
由于苹果病害叶片的病斑图像复杂、多样、无规律,且随
时间而变换,不能用数学模型来表示[14]。很多基于图像维数
约简的人脸、掌纹和步态等识别方法不能用于苹果病害识别。
由于不同类型病害叶片的病斑图像的颜色、形状和纹理之间
存在差异,可以提取病斑图像的分类特征,构成特征向量,进
行病害识别。下面介绍从分割后苹果病斑图像中提取病害的
颜色、形状和纹理的分类特征计算方法[9,11,15 - 16]。
4. 1 颜色特征
由 RGB颜色模型转换到 HIS和 YCbCr颜色模型,利用归
一化直方图的统计特征分别计算颜色 R、G、B、H、I、S、Y、Cb
和 Cr的均值、方差、偏度、能量、熵等 5 个统计特征参数,作为
病害叶片图像分类的颜色特征。
4. 2 形状特征
计算病害叶片病斑图像的面积、周长、周长直径比、周长
长宽比、圆形度、纵横轴比等 6 个无量纲的量,作为病斑图像
的形状分类特征,具体如下:
—833— 江苏农业科学 2016 年第 44 卷第 9 期
(1)面积 S:面积为病斑区域的像素个数的总和,简单为
经分割得到病斑二值图像中像素值为 0 的像素点的个数,计
算公式为:
S =∑
m
x = 1

n
y = 1
f(x,y)。 (1)
式中:f(x,y)表示病斑二值图像,m、n分别代表二值图像的长
和宽。
(2)周长 L:病斑的周长是指病斑区域的外轮廓的长度,
一般用病斑区域中相邻边界点之间的距离之和来表示。
(3)周长直径比 PD:
PD =
Pc
De
。 (2)
式中:Pc 是叶片凸包周长,De 为叶片的外接圆直径。
(4)周长长宽比 PL:叶片凸包周长与其最小包围盒长和
宽的和的比值;
PL =
Pc
Dmax + Dmin
。 (3)
式中:Dmax是叶片最小包围盒的长,Dmin是叶片最小包围盒的
宽。其中最小包围盒为坐标系中平行于横轴和纵轴方向的能
够包围图像的最小矩形。
(5)圆形度 C:圆形度表示病斑区域的形状和最接近的圆
形的相似程度,表达式:
C = 4πS
L2
。 (4)
式中:C 的取值范围在 0 ~ 1 之间,C 值越大表明病斑区域越
接近圆形。
(6)纵横轴比 AD:
AD =
Dmax
Dmin
。 (5)
4. 3 纹理特征
病害叶片病斑的纹理特征是一种全局特征,对病斑图像
整体分析时表现出一定的规则性,本研究采用灰度共生矩阵
和分形维数来描述病斑的纹理特征。设 f(i,j)为病斑灰度图
像中点(i,j)的灰度值,则
(1)对比度 N1:反映纹理的清晰程度
N1 =∑i ∑j (i - j)
2 f(i,j)。 (6)
(2)相关性 N2:反映叶片图像邻域灰度的线性依赖
N2 =

i

j
(i - i) (i - j)f(i,j)
σiσ j
。 (7)
式中:i =∑
i
i∑
j
Y(i,j) ,j =∑
j
j∑
i
Y(i,j) ,σi
2 =∑
i
(1 - i)2∑
j
Y(i,
j) ,σ j
2 =∑
j
(1 - j)2∑
i
Y(i,j)。
(3)能量 N3:反映叶片图像灰度分布的均匀性
N3 =∑i ∑j f(i,j)
2。 (8)
(4)均匀度 N4:反映叶片图像纹理的局部同质性
N4 =∑i ∑j
1
1 +(i - j)2
f(i,j)。 (9)
由以上分析可以得到每幅病斑图像的 45 个颜色特征、6
个形状特征和 4 个纹理特征,由此组成一个维数为 55 的特征
向量。
5 基于主分量分析(PCA)的苹果病害识别
尽管可以提取病斑图像的很多分类特征,但这些特征之
间可能存在相关性,而且各个特征对病害分类的贡献大小不
同,一些特征可能降低病害的识别率。所以,需要对得到的众
多特征进行特征提取或维数约简。但当特征维数较大时,不
容易快速地提取出对分类结果贡献大、独立、不相关的特征。
主分量分析(PCA)考虑了各个特征之间的相互关系,利
用维数约简的思想,在损失很少信息的前提下将多个特征转
换为少数几个互不相关的特征,成为主成分。每个主成分均
是原始变量的线性组合,且各个主成分之间互不相关,这就使
得主成分比原始变量具有某些更优越的性能,从而进一步使
病害类型识别过程变得简单、快速、准确[17]。
主成分分析常常通过以下 5 步解决:
第 1 步,将提取的特征进行标准化处理,以消除各个特征
在数量级或量纲上对后续分类结果的影响。
第 2 步,将训练集中每个病斑图像标准化后的特征组成
1 个特征向量,再将所有的特征向量组成 1 个特征矩阵,计算
相关系数矩阵。
第 3 步,计算特征矩阵的特征值及对应的单位特征向量。
特征值在某种程度上可以看成表示主成分分类力度大小。如
果特征值小于 1,说明该主成分的解释力度还不如直接引入
原变量的平均解释力度大。因此一般可以用特征值大于 1 作
为纳入标准。
第 4 步,计算主成分的方差贡献率和累积方差贡献率。
一般来说,提取主成分的累积方差贡献率超过 85%就可以,
由此确定需要提取多少个主成分。
第 5 步,计算主成分。由具有最大特征值的特征向量构
成映射矩阵。大量实际情况表明,如果根据累积贡献率来确
定主成分个数往往较多,而用特征值来确定又往往较少,很多
时候应当将两者结合起来,以综合确定合适的个数。
由以上分析,可以归纳出 PCA 的苹果病害识别的过程
为:(1)对苹果病害叶片图像进行预处理;(2)对病害叶片图
像分割,得到病斑图像; (3)提取病斑图像的颜色、形状和纹
理特征,进行归一化处理,得到特征向量矩阵,再构造特征矩
阵;(4)利用 PCA得到主分量,构造映射矩阵 A; (5)由 A 对
待识别的病斑的特征向量进行维数约简;(6)利用 BP神经网
络分类识别病害类型。
BP神经网络分类器包括输入层、隐层和输出层。输入层
神经元个数由叶片病斑特征矩阵主分量的个数决定,输出层
神经元个数为病害类别数。试验时需要人工设定 BP 神经网
络的隐层个数、隐层神经元数量和学习率等参数。待识别的
病斑图像进行预处理、特征提取、基于 PCA 的维数约简等步
骤后得到待分类低维向量,再输入训练好的 BP 神经网络分
类器可得到病害识别结果。
6 验证试验
为了验证所提出的方法的有效性,对常见的 3 种苹果病
害斑点落叶病、花叶病和锈病的叶片图像数据库上各 50 幅叶
片图像进行病害识别试验。每种病害叶片的前 30 幅,共 90
幅作为训练样本,其余的 60 幅作为测试集,依次编号。对所
—933—江苏农业科学 2016 年第 44 卷第 9 期
有叶片图像进行预处理和病斑分割,然后提取每幅苹果图像
的颜色、形状和纹理等共 55 个特征值,组成特征向量;由所有
训练集中的特征向量组成 1 个 60 × 55 的特征矩阵 A;利用统
计产品与服务解决方案软件(Statistical Product and Service
Solutions,SPSS)中的 PCA 过程:“分析→降维→因子分析”,
求 A的协方差矩阵,取前 M 个特征值所对应的特征向量,构
成一个 55 ×M的矩阵 B,这个矩阵为映射矩阵,A 乘以 B,就
得到了 1 个 60 ×M的新的降维后的低维矩阵 C,作为 BP 分
类器的训练集数据。由 B 可以得到任一待识别病害叶片的
病斑图像的低维特征向量,输入 BP 分类器,进行类别识别。
试验中采用 Matlab软件进行 BP神经网络训练。在利用训练
数据集训练 BP神经网络前,先将训练数据 C 进行归一化处
理,以避免数据饱和,加快网络收敛。网络训练的输出目标矩
阵大小为 1 × 60,每个元素分别对应于 60 个输入样本的类
别。训练 BP神经网络,直至总误差小于给定值,认为网络训
练完毕。本试验中,PCA 的主分量数取为 10,其累计方差贡
献率在 90%以上。BP分类器的误差取为 0. 001,试验重复进
行 50 次,计算识别结果的平均值,试验结果见表 1。为了说
明本研究算法的有效性,与文献[5]和[10]的苹果叶片病害
识别方法进行比较。这 2 种方法都是提取分类特征和 Hu 提
出的 7 个不变矩,再分别利用 BP 神经网络和支持向量机进
行病害识别。表 1 中给出了 3 种算法的识别结果。试验结果
表明,在 3 种苹果病害识别中,本研究算法的平均识别率达到
94. 34%,高于其他 2 种算法,其中苹果花叶病的识别率超
过 98%。
表 1 3 种苹果病害叶片不同算法的识别结果
算法
识别率(%)
斑点落叶病 花叶病 锈病 平均
平均运行
时间(s)
文献[5]算法 90. 24 95. 65 92. 4 92. 71 44
文献[10]算法 91. 31 97. 32 92. 55 93. 71 41
本研究算法 92. 16 98. 05 92. 65 94. 34 47
7 讨论与结论
文献[5]应用二值图像标记法提取病斑边缘,计算出病
斑个数、面积、圆形度、与叶片面积比、复杂度和叶子的面积等
6 个形状特征参数,以及 Hu的 7 个不变矩共 13 个参数,再利
用 BP神经网络进行识别;文献[10]提取病害叶片病斑图像
的颜色直方图、颜色矩、灰度共生矩阵、常规形状和 Hu 的 7
个不变矩等特征,并对提取特征进行比较,选择了 15 类特征
参数,再利用支持向量机进行识别。这 2 种方法没有考虑提
取的特征对病害分类的贡献大小。而本研究算法提取 55 个
特征,不是进行特征选择,而是利用 PCA 快速得到主分量,再
在新的低维特征空间进行识别。所以,该方法适用于提取很
多特征情况下,而且考虑了各个特征的重要程度。
3 种算法对斑点落叶病的识别率都比较高,是因为该病
害的特征与另外 2 种病害叶片的区别较大。出现错分的原因
是斑点落叶病与早期的锈病病斑很像,只是颜色有所差异,在
纹理特征和形状特征方面很相近,而文献[5]中没有选用颜
色特征,所以识别率不高。
本研究利用 SPSS进行 PCA。由于在 SPSS中并没有完整
的主成分分析过程,其主成分分析过程集成在因子分析过程
中,但并不完善。而主成分的得分需要对因子得分情况进行
进一步计算,所以在 SPSS中不需保存因子得分情况。对于提
取因子的个数问题,一般遵循 2 个标准,一是累计方差贡献率
大于 80%;二是其特征值大于 1。本试验中之所以设置因子
数目为 10,是因为通过预先分析,发现前 10 个主成分可以解
释总体信息的 99%。
本研究探讨了苹果病害叶片图像预处理、病斑分割、病害
特征提取和特征降维方法,分析了基于 BP 神经网络的病害
识别过程。训练后 BP 神经网络可实现对苹果的斑点落叶
病、花叶病和锈病 3 种病害识别,平均准确率达到 94. 33%。
试验结果表明,该算法对苹果叶部病害识别是可行的。进一
步的研究重点是基于农业物联网视频传感器得到的苹果病害
叶片图像分割和病害识别方法。
参考文献:
[1]胡 林,周国民,丘 耘. 苹果树图像分割算法研究综述[J]. 中
国农业科技导报,2015,17(2) :100 - 108.
[2]郝青梅. 苹果树常见病害识别和防治[J]. 河北果树,2010(6) :
12 - 14.
[3]尹秀珍,何东健,霍迎秋. 自然场景下低分辨率苹果果实病害智
能识别方法[J]. 农机化研究,2012(10) :29 - 32.
[4]薛永发. 农业生态控制苹果病虫害的有效途径和措施[J]. 果农
之友,2010(11) :26 - 28.
[5]李宗儒. 基于图像分析的苹果病害识别技术研究[D]. 杨凌:西
北农林科技大学,2010
[6]李宗儒,何东健. 基于手机拍摄图像分析的苹果病害识别技术研
究[J]. 计算机工程与设计,2010,31(13) :3051 - 3053.
[7]霍迎秋,唐晶磊,尹秀珍,等. 基于压缩感知理论的苹果病害识别
方法[J]. 农业机械学报,2013,44(10) :227 - 232.
[8]樊景超. 苹果果实病害近红外光谱信息获取与识别模型研究
[D]. 北京:中国农业科学院,2011.
[9]王芸芸,王 玺,蒋建兵,等. 山西省苹果树主要病虫害的种类及
综合防治[J]. 现代园艺,2014(15) :117 - 118.
[10]毕傲睿. 苹果叶子病害图像识别系统的设计与实现[D]. 西安:
西安建筑科技大学,2014.
[11]胡荣明,魏 曼,竞 霞,等. 基于成像高光谱的苹果树叶片病
害区域提取方法研究[J]. 西北农林科技大学学报:自然科学
版,2012,40(8) :95 - 99.
[12]方江雄. 基于变分水平集的图像分割方法研究[D]. 上海:上海
交通大学,2012.
[13]毛 亮,薛月菊,孔德运,等. 基于稀疏场水平集的荔枝图[J].
农业工程学报,2011,27(4) :345 - 349.
[14]Valliammal N,Geethalakshmi S N. Crop leaf segmentation using
nonlinear K means clustering[J]. International Journal of Computer
Science Issues,2012,9(3) :212 - 218.
[15]Pydipati R,Burks T F,Lee W S. Identification of citrus disease
using color texture features and discriminant analysis [J].
Computers and Electronics in Agriculture,2006,52:49 - 59.
[16]贾建楠,吉海彦. 基于病斑形状和神经网络的黄瓜病害识别
[J]. 农业工程学报,2013,29(增刊 1) :115 - 121.
[17]Wang H,Li G,Ma Z,et al. Image recognition of plant diseases
based on principal component analysis and neural networks[C].
Natural Computation (ICNC) ,2012 Eighth International Conference
on IEEE,2012:246 - 251.
—043— 江苏农业科学 2016 年第 44 卷第 9 期