全 文 :基于颜色特征和支持向量机的黄瓜叶部病害识别
李 旺,唐少先,陈 荣
(湖南农业大学 信息科学技术学院,长沙 410128)
摘 要:针对黄瓜常见叶部病斑图像的颜色特点,提出了将支持向量机(Support Vector Machine,SVM)应用于黄瓜
叶部病害识别中。首先,选择 HSI 颜色系统作为图像特征提取的颜色空间,以减少光照强度对获取图像时的影
响;然后,利用支持向量机进行叶部病害的识别。不同核函数的结果比较分析表明:径向基核函数对黄瓜叶部病
害的识别率最高,最适于黄瓜霜霉病、角斑病和白粉病的分类识别;支持向量机识别方法在病害识别时训练样本
少,具有很好的分类性能和泛化能力。
关键词:图像处理;模式识别;支持向量机;黄瓜病害;颜色特征
中图分类号:TP391. 41 文献标识码:A 文章编号:1003 -188X(2014)01 -0073 -03
0 引言
黄瓜病斑颜色是黄瓜病害的重要特征之一,正确
识别黄瓜病斑颜色是正确识别黄瓜病害的基础。利
用数字图像处理和模式识别技术对作物病害进行识
别,是作物病害诊断的基础[1]。当前模式识别主要方
法是采用人工神经网络的方法,但该方法存在一些困
难,如如何确定网络结构的问题、过学习和欠学习的
问题、陷入局部极小点的问题、对新鲜样本泛化能力
差的问题等。这些问题影响了对病害的正确识别。
支持向量机(Support Vector Machine,SVM)是一种新
的模式识别技术,它以结构风险最小化(SRM)为原
则,兼顾训练误差和测试误差,在解决小样本、高维
数、非线性以及局部极小值等模式识别问题中表现出
许多特有的优势,正在成为模式识别技术领域中新的
研究热点[2]。本文的主要工作就是寻找适于黄瓜病
害识别的最优核函数,采用 SVM方法达到较高的识别
率。
1 支持向量机
支持向量机是在统计学习理论的基础上提出的一
种新的模式识别方法,它以结构化风险最小化为原
则,即兼顾训练误差(经验风险)与测试误差(期望风
险)的最小化。支持向量机从线性可分问题中的最优
收稿日期:2013 - 01 - 09
基金项目:湖南省研究性学习和创新性实验计划基金项目(SCX0912)
作者简介:李 旺(1986 - ) ,男,湖南武冈人,硕士研究生,(E - mail)
intonetwork@ 163. com。
通讯作者:唐少先(1963 - ) ,男,湖南衡阳人,教授,博士,(E - mail)
836454150@ qq. com。
分类面发展而来,主要思想可以概括为:寻找能够成
功分开两类样本并具有最大分类间隔的最优分类超
平面。分类问题大致可以分为 3 类:线性可分问题、
近似线性可分问题和线性不可分问题。
1. 1 近似线性可分问题
如果用一个线性函数可以将两类样本完全分开,
就称这些样本为线性可分。如果用一个线性函数可
以将两类样本大体上正确分开,就称这些样本为近似
线性可分。对于近似线性可分的训练样本集(xi,yi) ,
可用一个线性函数(如二维空间中的直线,三维空间
中的平面或更高维空间中的超平面)分开。分类间隔
越大,则推广能力越好。使分类间隔最大的分类(线)
面为最优分类(线)面。应用二次规划方法可得到如
下最优分类函数为
f(x)= sgn(∑
n
i = 1
ai
* yiK(xi·x)+ b
* ) (1)
式中 ai
* —拉格朗日乘数;
b* —分类阈值。
1. 2 线性不可分问题
如果找不到一个线性函数可以将两类样本分开,
就称这些样本为线性不可分。解决线性不可分问题
的基本思想:首先通过非线性变换将低维空间的线性
不可分问题变换到高维空间的线性可分或近似线性
可分问题,然后在这个新变换的空间中求取(广义)最
优分类面;而这种空间变换就是通过不同的核函数实
现的[4]。SVM方法中常用的 4 种核函数:
1)线性核函数(Linear)。有
K(x,y)= x·y
2)多项式核函数(Polynomial)。有
·37·
2014 年 1 月 农 机 化 研 究 第 1 期
DOI:10.13427/j.cnki.njyi.2014.01.018
K(x,y)= [(x·y)+ 1]d
3)径向基核函数(RBF)。有
K(x,y)= exp(- ‖x - y‖
2
σ2
)
4)Sigmoid 核函数。有
K(x,y)= tanh[v(x·y)+ c]
本文的重点工作就是寻找适于黄瓜病害识别的最
优核函数,采用 SVM方法达到较高的识别率。在利用
SVM方法进行分类器的设计时,将通过提取色调 H、
饱和度 S 和亮度 I 3 个特征参数作为特征向量输入。
2 黄瓜病害图像的特征提取
颜色特征提取应选择适当的颜色空间,才能利用
模式识别正确、有效地识别病害图像。常用的颜色空
间有 CIE RGB 颜色空间、HSI 颜色空间、CIE Lab 颜色
空间、HSV颜色空间、CIE XYZ 颜色空间等,RGB 颜色
空间和 HSI 颜色空间以其独特的优势被广泛应用。
HSI 颜色空间与 RGB 颜色空间相比,最大的优势是可
以消除光照强度对图像获取的影响,达到降低颜色特
征维数而又不丢失颜色信息的目的,可极大地简化图
像分析处理的工作量。此外,由于人的视觉对亮度的
敏感程度远强于对颜色浓度的敏感强度,HSI 颜色空
间比 RGB 颜色空间更符合人的视觉特性,亮度和色度
具有可分离特性。因此,本文选用 HSI 颜色空间。
RGB 颜色空间和 HSI 颜色空间只是同一物理量
的不同表示,它们之间存在着转换关系[3],给定一幅
RGB 格式的图像,转换公式如下:
色调 H分量可由下式得到
H = θ, (B≤ G)
360 - θ, (B > G{ ) (2)
θ = arccos
1
2 [(R - G)+ (R - B) ]
[(R - G)2 + (R - G) (G - B) ]
1
2
饱和度 S 分量为
S = 1 - 3R + G + Bmin(R,G,B) (3)
最后,亮度 I 分量为
I = 13 (R + G + B) (4)
R,G,B 分别代表红、绿、蓝 3 种颜色像素。
颜色空间转变后,受光照的影响比较小,可以通
过上面的公式计算 H,S,I 的值,作为颜色特征。
3 材料与方法
霜霉病、角斑病和白粉病是黄瓜病害中 3 种常见
的病害,因此本文选用这 3 种病害作为识别对象。在
湖南农业大学蔬菜基地进行黄瓜病害图像采集,获取
了黄瓜霜霉病、角斑病、白粉病的病害图像 120 幅。
各种病害如图 1 所示。
(a) 霜霉病 (b) 角斑病 (c) 白粉病
图 1 黄瓜病害图像
针对黄瓜的这 3 种病害,从黄瓜的霜霉病、角斑
病、白粉病的每种病斑图像中选取 60 × 60 像素的子
图像 40 幅(共计 120 幅) ,特征向量采用之前获取的
H,S,I 3 个特征参数。分别采用 Linear 核函数、Poly-
nomial核函数、RBF 核函数和 Sigmoid 核函数的 SVM
方法进行分类性能比较实验,来确定哪种核函数的
SVM分类方法最适合于黄瓜这 3 种病害图像的识别。
Matlab 从 7. 0 版本开始支持 SVM,其 SVM工具箱主要
通过 svmtrain( )和 svmclassify( )两个函数实现 SVM 训
练和分类的功能,因此本实验采用 Matlab 7. 0 的 SVM
工具箱进行实验。
4 结果与分析
4. 1 不同核函数的分析比较
从每种病害图像选取其中 20 幅(共 60 幅)作为
训练样本,每种病害图像选取 20 幅作为测试样本,对
以上 4 种不同核函数的 SVM 方法进行分类性能对比
实验,结果如表 1 所示。其中,表 1 中的学习参数为:
错误代价系数 C = 5,松弛变量ξ = 0. 001;多项式核函
数中的 d 取 3;径向基核函数中的 σ2取 3;Sigmoid 核函
数中 v取 1 /2,c取 - 1。
表 1 不同核函数的 SVM性能比较
核函数
支持
向量数
运行时间
/ms
正确识别率
/%
霜霉病 角斑病 白粉病
Linear 37 66 76 70 77
Polyno - mial 31 63 75 68 73
RBF 42 41 80 78 82
Sigmoid 40 34 72 65 68
从表 1 中可以看出,RBF 核函数分类性能最好,
Polynomial核函数和 Linear 核函数次之,Sigmoid 核函
数的分类性能最差。从运行时间上来看,Sigmoid 核函
数的分类速度最快,RBF 核函数次之,Polynomial 核函
数和 Linear核函数最慢,各类核函数的分类速度差不
·47·
2014 年 1 月 农 机 化 研 究 第 1 期
多。综合比较得知:径向基核函数(RBF)对黄瓜叶部
病害的识别率最高,最适于黄瓜霜霉病、角斑病和白粉
病的分类识别。
4. 2 不同样本数的分析比较
随机从每种病害图像选取 3 组作为训练样本,样
本数分别为 100,50,25,每种病害图像选取 20 幅作为
测试样本,对以上 3 组不同样本数采用径向基核函数
的 SVM分类方法分类比较实验,结果如表 2 所示。表
2 中学习参数为:错误代价系数 C = 5,松弛变量 ξ =
0. 001;径向基核函数中的 σ2取 3。
表 2 径向基核函数的 SVM方法下不同样本数比较
样本数
支持
向量数
正确识别率(正确识别数 /测试样本数)
霜霉病 角斑病 白粉病
100 42 18 /20 17 /20 15 /20
50 33 16 /20 18 /20 18 /20
25 18 15 /20 16 /20 15 /20
从表 2 中可以看出,减少训练样本数对识别结果
影响不是很大,表明 SVM 识别方法在样本比较少的情
况下具有较高的分类性能,即分类时训练样本较少,具
有很好的分类性能和对新鲜样本的泛化能力。当训练
样本数在 100,50 的时候,测试样本的识别率基本一
样;当训练样本数减到 25 时,测试样本的识别率稍有
下降。这是因为对测试样本分类错误率的均值有如下
关系[6],即
E[P(error) ]≤ E[支持向量数]
训练样本数 - 1
(5)
对式(5)而言,当训练样本数减少,支持向量数也
相应减少,但支持向量数减少的速度要小于训练样本
数减少的速度,导致了减少样本数会增加分类错误率。
5 结语
本文针对黄瓜病害,提出了利用支持向量机 SVM
分类方法识别 3 种常见病害,提取了病害色调 H、饱和
度 S 和亮度 I 3 个特征参数作为模式识别的基本特征
向量。对比实验数据分析表明:SVM 分类方法在针对
小样本问题中具有很好的分类性能;径向基核函数对
黄瓜叶部病害的识别率最高,优于其它类型核函数的
SVM分类方法,最适于黄瓜病害的分类识别。在此,
本文只是根据黄瓜病叶的颜色特征进行识别,忽略了
叶部纹理、形状以及黄瓜茎、根、果等病症特征,建议
以后研究应将以上多种病征进行综合,以进一步提高
病害识别率[5]。
参考文献:
[1] 田有文,张长水,李成华.基于支持向量机和色度矩的植
物病害识别研究[J]. 农业机械学报,2004,35(3) :95 -
98.
[2] 孙亮,禹晶. 模式识别原理[M]. 北京:北京工业大学出
版社,2009:149 - 163.
[3] 张铮,王艳平. 数字图像处理与机器视觉—VisualC + +
与 Matlab实现[M].北京:人民邮电出版社,2010:241 -
242.
[4] 李红英,钟波.支持向量分类机的修正核函数[J]. 计算
机工程与应用,2009,45(24) :53 - 55.
[5] 李文文.基于数字图像处理技术的葡萄病害识别系统的
研究[D].沈阳:沈阳农业大学,2007.
[6] 边肇祺,张学工.模式识别[M].北京:清华大学出版社,
2000:300 - 302.
Recognition of Cucumber Disease Based on Color Features and
Support Vector Machine
Li Wang,Tang Shaoxian,Chen Rong
(College of Information Science and Technology,Hunan Agricultural University,Changsha 410128,China)
Abstract:According to the color characteristics of cucumber common leaf disease image,it put Support Vector Machine
(SVM)forward for the recognition of cucumber leaf disease in this paper. First,it selected HSI color system as the color
space for the image feature extraction in order to reduce the impact of light intensity for obtaining images;Then,the pa-
per used Support Vector Machine for the recognition of leaf disease. The experimental results show that:the results of
comparative analysis of different kernel function demonstrated RBF kernel function get the highest recognition rate of cu-
cumber leaf disease and is most suitable for the recognition of cucumber three kinds of disease. The classification method
of SVM has good classification performance and generalization ability with a small sample of training in disease recogni-
tion.
Key words:image processing;pattern recognition;support vector machine;cucumber disease;color features
·57·
2014 年 1 月 农 机 化 研 究 第 1 期