全 文 : 第 30 卷 第 19 期 农 业 工 程 学 报 Vol.30 No.19
222 2014 年 10 月 Transactions of the Chinese Society of Agricultural Engineering Oct. 2014
基于最优二叉树支持向量机的蜜柚叶部病害识别
张建华,孔繁涛,李哲敏※,吴建寨,
陈 威,王盛威,朱孟帅
(1. 中国农业科学院农业信息研究所,北京 100081; 2. 农业部农业信息服务技术重点实验室,北京 100081)
摘 要:为了提高蜜柚叶部中晚期病害的识别准确率,确保蜜柚叶部病害对症施药与病害防治的效果,该文提出
了一种基于最优二叉树支持向量机(support vector machine,SVM)的蜜柚叶部病害识别方法,该方法首先
将蜜柚叶部病害图像转换为 B 分量、2G-R-B 分量、(G+R+B)/3 分量以及 YIQ 颜色模型中的 Q 分量的 4 个灰度图
像,再利用 5 尺度 8 方向的 Gabor 小波分别与 4 个分量灰度图像进行卷积运算,获得 5 个尺度下不同方向的幅值
均值作为病害的特征向量,并结合提出的最优二叉树支持向量机病害识别模型,对黄斑病、炭疽病、疮痂病、煤
烟病等 4 种蜜柚叶部病害进行分类识别。通过交叉验证的方法进行分类识别测试,结果表明:黄斑病、炭疽病、
疮痂病、煤烟病识别准确率分别为 90%、96.66%、93.33%、96.66%,平均识别率达到 94.16%,并将该方法与 BP
神经网络、一对一 SVM 与一对多 SVM 进行比较,试验结果表明该方法可有效识别 4 种蜜柚叶部病害,在训练时
间和识别精度上都优于其他 3 种方法。该方法可为蜜柚病害准确识别与防治提供有效的技术支持。
关键词:病害;识别;图像处理;Gabor 小波;最优二叉树;支持向量机;蜜柚叶部
doi:10.3969/j.issn.1002-6819.2014.19.027
中图分类号:S431 文献标志码:A 文章编号:1002-6819(2014)-19-0222-10
张建华,孔繁涛,李哲敏,等. 基于最优二叉树支持向量机的蜜柚叶部病害识别[J]. 农业工程学报,2014,30(19):
222-231.
Zhang Jianhua, Kong Fantao, Li Zhemin, et al. Recognition of honey pomelo leaf diseases based on optimal binary tree
support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),
2014, 30(19): 222-231. (in Chinese with English abstract)
0 引 言
蜜柚是中国重要的水果之一,在其整个种植过
程中,常常发生多种病害,主要包括黄斑病、炭疽
病、疮痂病、煤烟病等,长期危害着蜜柚的叶片、
花、果等,危害柚子叶部时,造成蜜柚叶部局部或
整体畸形、卷曲和溃烂,发病严重时引起大量叶片
掉落,进而影响蜜柚果实的产量与品质[1]。现阶段
蜜柚的病害识别主要是通过人工观察的方法,但
该方法存在准确率低、速度慢、体力消耗大等问
题,影响了蜜柚病害防治的准确性和时效性[2]。
随着图像处理技术的发展,大量研究依据病害
图像的大小、形状、颜色、纹理等参数或几个参数
的组合来进行植物病害图像识别与分类[2-7]。Sena
收稿日期:2014-07-15 修订日期:2014-10-12
基金项目:“十二五”国家科技支撑计划(2012BAH20B04);国家自然
基金项目(41201599);公益性科研院所基本科研业务费专项资金
(2014-J-012,2014-J-011)
作者简介:张建华,男,汉族,重庆人,助理研究员,研究领域为农作
物病虫害识别。北京 中国农业科学院农业信息研究所,100081。
Email:zjhua.2001@163.com
※通信作者:李哲敏,女,汉族,福建安溪人,研究员,研究领域为农
业监测预警研究。北京 中国农业科学院农业信息研究所,100081。
Email:lizhemin@caas.cn
等[8]运用计算机图像处理技术对黄瓜角斑病和斑疹
病的研究发现,与其他参数相比,色调 H 偏度可以
较为明显区分不同病变情况。Camargo 等[9]尝试利
用颜色直方图矩阵对 4种棉花病害进行了识别,获
得了较好的识别效果。Pydipati 等[10]通过颜色矩阵,
对柑桔黑霉病、疤痕和油脂病图像进行了分类识
别。Kuoyi 等[11]通过提取病斑的颜色特征,应用 BP
神经网络成功识别君子兰的软腐病,褐斑病和黑腐
病,平均识别率达到 89.6%。Santanu 等[12]提取病害
的颜色,形状和受感染的部分的位置特征,并利用
粗糙集的方法对特征进行选择,结合分类规则库建
立了水稻病害识别模型,对水稻的叶褐斑病、稻瘟
病、鞘腐病、白叶枯病具有良好的识别效果,平均
识别率在 90%以上。Rumpf 等[13]利用支持向量机对
早期的感染甜菜生尾孢、单孢锈菌蚜或白粉蚜引起
角斑病,甜菜锈病和白粉病等甜菜病害进行识别,
但由于病害的类型和不同阶段病斑的变化,其分类
识别准确度在 65%~90%。张建华等[14]提取棉花颜
色与纹理特征,结合粗糙集的方法对特征进行优
选,建立基于神经网络的棉花病害识别模型,获得
了较好的识别效果。温芝元等[15]提取病斑标记区域
内的傅里叶变换幅度谱图,进行多重分形分析及二
第 19 期 张建华等:基于最优二叉树支持向量机的蜜柚叶部病害识别
223
次拟合,将拟合抛物线段的高度、宽度和质心坐标
作为病虫害特征值,并建立了 BP 神经网络椪柑病
虫害识别模型,平均正确识别率达到 92.67%。
综上所述,大多病害识别研究主要针对图像的
全局信息,忽略了对病害的多尺度多方向的局部特
征提取,且在病害分类模型中对多类支持向量机的
构建多采用“一对一”方法或“一对多”方法,而
对基于最优二叉树支持向量机方法进行病害识别
缺少系统研究。因此,本研究针对蜜柚叶部病害识
别难的问题,从叶部病害图像的局部信息入手,在
多个颜色分量情况下,利用 Gabor 小波变换的幅值
图像具有细微差别表达能力,提取不同颜色分量的
多尺度多方向病害局部特征信息,并通过基于最优
二叉树支持向量机对蜜柚的 4 种病害进行识别,以
期为蜜柚病害准确识别与防治提供技术支撑。
1 材料与方法
1.1 试验材料
2014 年 3-6 月从中国农业大学试验基地,收
集遭受黄斑病、炭疽病、疮痂病、煤烟病危害的蜜
柚叶片。并根据文献[16]和文献[17]的作物病虫害危
害等级等于病斑面积与叶片面积的比值方法,确定
了蜜柚病害等级标准,见表 1 所示。按照确定的蜜
柚病害等级标准,选择危害等级为Ⅲ级、Ⅳ级、Ⅴ
级和Ⅵ级的中晚期病害蜜柚叶片进行采集。为确保
采集的黄斑病、炭疽病、疮痂病、煤烟病等 4 种蜜
柚病害的准确性和叶片病害的唯一性,每张蜜柚病
害叶片都经过植保专家判别,确认所采集的蜜柚病
害准确无误。
表 1 蜜柚病害等级划分标准
Table 1 Honey pomelo leaf diseases hazard classification
standard
病害等级
Disease grade
划分标准
Classification standard
Ⅰ级
Level 1 病斑面积与棉花叶片面积的比值<0.05;
Ⅱ级
Level 2 病斑面积与棉花叶片面积的比值≥0.05~0.10;
Ⅲ级
Level 3 病斑面积与棉花叶片面积的比值≥0.10~0.20;
Ⅳ级
Level 4 病斑面积与棉花叶片面积的比值≥0.20~0.30;
Ⅴ级
Level 5 病斑面积与棉花叶片面积的比值≥0.30~0.40;
Ⅵ级
Level 6 病斑面积与棉花叶片面积的比值≥0.40。
将收集的蜜柚病害叶片通过构建的图像采集
系统进行图像采集,图像采集系统由载物台
(30 cm×20 cm×5 cm)、光照箱(60 cm×50 cm×70 cm)、
光源(4 个 8W 荧光灯)、彩色数码相机(索尼 RX10
型数码相机,1 600 万像素)和计算机(Lenovo 品
牌,处理器为 Intel i5-3470,双核 3.20 GHz,内存
2.0 GB),如图 1 所示。
1.载物台;2.光照箱;3.荧光灯;4.彩色数码相机;5.计算机
1.Stage; 2.Light boxes; 3.Fluorescent lamps; 4. Color digital camera;
5.Computer
图 1 图像采集系统
Fig.1 Image acquisition system
通过图像采集系统共获取了 360 幅蜜柚病害叶
片图像作为试验对象,其中包含了黄斑病、炭疽病、
疮痂病、煤烟病等 4 类蜜柚病害,每类各 90 幅。
将图像进行 256 像素×256 像素大小的标准化处理,
处理后的蜜柚病害类型如图 2 所示。
a.黄斑病 Macular b.炭疽病 Anthrax
c.疮痂病 Scab d.煤烟病 Sooty mold
图 2 蜜柚叶片病害图像
Fig.2 Disease image of pomelo leaf
1.2 特征提取方法
二维 Gabor 小波变换具有较好的空间域和频率
域分辨能力,是图像的多尺度多方向表示和分析的
有力工具,经常被用作小波基函数对图像进行各种
分析[18-19]。因此,本文利用 Gabor 小波提取图像的
纹理特征。
1.2.1 Gabor 小波
Gabor 小波变换是用一组滤波器函数与给定信
号的卷积来表示或逼近一个信号[20-21]。二维 Gabor
小波函数傅里叶变换如式(1)所示:
2
2
2 2
1
1( , ) exp
2 u v
u vG u v τσ σ
⎧ ⎫⎡ ⎤⎛ ⎞⎪ ⎪−⎢ ⎥⎜ ⎟⎨ ⎬⎝ ⎠⎢ ⎥= − +⎪ ⎪⎢ ⎥⎣ ⎦⎩ ⎭
(1)
农业工程学报 2014 年
224
式中,G(u,v)为小波变换后变量;u 为 Gabor 小
波滤波器尺寸, v 为 Gabor 小波滤波器方向;
1 1;
2 2u x v y
σ σ σ σ= ⋅ = ⋅ ,σx、σy 分别为高斯包络在 x
轴和 y 轴方向的常量; 为尺度因子。
图像 I(x,y)上任一点(x,y)的小波变换为:
, 1 1 , 1 1 1 1( , ) ( , ) ( , , , )d dm n m nx y x x y y g x y x yα θ= − − ×∫W I
(2)
其 中 , 1 1( , )x x y y− −I 为 蜜 柚 病 害 图 像 ,
, 1 1( , , , )m n x y α θg 为 Gabor 小波滤波器, , ( , )m n x yW 为在
尺度为 m,方向为 n 时与蜜柚病害图像卷积的结果即
为 Gabor 小波系数;x1为图像 X 轴偏移距离,y1为图
像 Y 轴偏移距离;a 为 Gabor 小波滤波器尺度因子,
θ为 Gabor 小波滤波器方向因子;m 为小波变换频带,
n 为小波变换方向;x 为图像 X 轴像素数,y 为图像 Y
轴像素数[22]。
1.2.2 基于 Gabor 小波的纹理特征提取
Gabor 滤波器系数矩阵 , ( , )m n x yW 中的每一个
元素为一复数值,对每一元素取其能量子带得到矩
阵 , ( , )m n x yW ,并对 , ( , )m n x yW 进行采样率为 ρ 的下
采样,得到矩阵 , ( , )m n x y′W [23]。图 3a 为蜜柚病害图
像,图 3b 为 5 个尺度 8 个方向 Gabor 小波变换后
的幅值图像。对蜜柚病害图像进行 5 级 Gabor 小波
分解,则 5 个尺度的 8 个方向(分别对应图 2b 中
的 8 个方向)共 40 个幅值图像,取不同尺度下 8
个方向的幅值平均值作为病害的纹理特征,则可得
到 5 个图像特征。
a. 蜜柚病害图像
a. Disease image of honey pomelo
b. Gabor 小波变换的幅值图像
b. Amplitude image of gabor wavelet transform
图 3 Gabor 小波变换
Fig.3 Gabor wavelet transform
1.3 病害分类识别方法
1.3.1 支持向量机
支持向量机(support vector machine,SVM)
是一种基于结构风险最小化的分类器,通过解二次
规划问题,寻找将数据分为 2 类的最佳超平面[24-27]。
常有的核函数分别有:Gauss径向基核函数、Sigmoid
核函数与多项式核函数 [28-29]。
1.3.2 基于最优二叉树的多类支持向量机
支持向量机 SVM 是针对二分类问题提出的,
对于多分类问题,以二元分类为基础,通过一定的
组合原则,构造多类分类器,实现多类可分[30]。目
前常用的多分类支持向量机主要有:一对一方法和
一对多方法。其中一对一方法在分类时存在不可分
区域,一对多方法识别性能一般[31]。因此,针对这
2 种方法的不足,提出了基于最优二叉树的多类支
持向量机。
图 4 最优二叉树支持向量机分类器示意图
Fig.4 Schematic diagram of optimal binary support vector
machine classifiers
本文针对蜜柚的黄斑病、炭疽病、疮痂病、煤
烟病等 4 种病害,用类 1 表示黄斑病、类 2 表示炭
疽病、类 3 表示疮痂病、类 4 表示煤烟病,构建了
2 层最优二叉树,如图 4 所示,第 1 层有 1 个支持
向量机分类器即 SVM12V34,主要对 1 类、2 类病害
与 3 类、4 类病害先进行识别分类,第 2 层为 2 个
分类器分别是 SVM1V2 和 SVM3V4,SVM1V2 是对 1
类与 2 类病害进行识别,SVM3V4 是对 3 类、4 类病
害进行识别分类。其中,第 1 层先将最大阈值间隔
的病害来构建决策树的根结点,如黄斑病(类 1)
与煤烟病(类 4),然后用同样的方法建立第二层,
直到所有分类器构建完成,以使每个结点下的分支
间隔最大,能有效降低分类识别的错误,避免误差
向下累积的问题,从而得到分类识别正确率高的最
优二叉树。2 层最优二叉树支持向量机识别病害时
具体算法流程如下:
Step1:提取 4 种病害样本的特征向量,首先从
第 1 层根节点开始,计算分类器 SVM1,2V3,4,根据
输出值判断下一层结点的走向,如果该病害为类 1
或类 2,则转向下 1 层左边叶子节点 SVM1V2,如果
第 19 期 张建华等:基于最优二叉树支持向量机的蜜柚叶部病害识别
225
该病害不属于类 3 或类 4,则转向下 1 层右边叶子
节点 SVM3V4;
Step2:如果为左边叶子节点,则计算分类器
SVM1V2,如果该病害计算结果为正则属于类 1,如
果该病害计算结果为负则属于类 2;
Step3:如果为右边叶子节点,则计算分类器
SVM3V4,如果该病害计算结果为正则属于类 3,如
果该病害计算结果为负则属于类 4。
2 结果与分析
对蜜柚病害识别进行仿真试验,试验平台为
Lenovo 计算机,处理器为 Intel i5-3470,双核
3.20 GHz,内存 2.0GB,操作系统为 Windows7.0,
仿真软件为 Matlab2011a。蜜柚病害识别试验分 2
部分进行,第 1 部分为特征提取与分析试验,提取
出最优的特征向量;第 2 部分为基于最优二叉树的
支持向量机识别试验,获得最优的病害识别方法。
2.1 特征提取与分析试验
由已有病害图像特征提取研究可知,不同类别
病害之间在颜色和纹理方面存在较大差异[32-33]。分
别从 RGB 颜色模型(即红-绿-蓝颜色模型)、超绿
红蓝颜色模型、HSI 颜色模型(即色调-饱和度-亮
度颜色模型)、YIQ 颜色模型(即亮度-橙青色差-
紫黄色差颜色模型),选择 R 分量、G 分量、B 分
量、Y 分量、2G-R-B 分量、2R-G-B 分量、2B-G-R
分量、G-B 分量、R-B 分量、(G+R+B)/3 分量、H
分量、S 分量、Q 分量等 13 个颜色分量,对采集的
黄斑病、炭疽病、疮痂病、煤烟病等 4 种病害图像
360 幅图像进行统计分析,蜜柚叶部病害颜色特征
分量统计结果如图 5 所示。从图 5 可以看出,在 B
分量统计上,黄斑病、炭疽病与疮痂病、以及与煤
烟病之间具有一定差异性;在 2G-R-B 分量统计上,
黄斑病、炭疽病、疮痂病、煤烟病的平均灰度值分
别为:177、146 、100 、46 bit,在 4 种病害之间
具有较大可区分性;在(G+R+B)/3 分量统计上,黄
斑病、炭疽病、疮痂病、煤烟病的平均灰度值分别
为:125、108、156、124 bit,除了黄斑病与煤烟病
之间差异性较小外,其他病害之间有相差较大;在 Q
分量统计上,黄斑病、炭疽病、疮痂病、煤烟病的平
均灰度值分别为:70、75、42、96 bit,除黄斑病与炭
疽病相差不大外,其他病害之间具有可区分性。因此,
经蜜柚叶部病害颜色特征分量统计发现:B 分量、
2G-R-B 分量、(G+R+B)/3 分量以及 YIQ 颜色模型中
的 Q 分量对蜜柚叶片病害区分性较其他颜色分量大。
图 5 蜜柚叶部病害颜色特征分量统计
Fig.5 Pomelo leaf disease color characteristic component statistics
对采集的黄斑病、炭疽病、疮痂病、煤烟病等
4 种病害图像 360 幅图像进行纹理特征统计分析。
提取病害图像的 B 分量、2G-R-B 分量、(G+R+B)/3
分量以及 Q 分量的灰度图像,并用 5 个尺度、8 个
方向的 Gabor 小波滤波器对灰度图像进行卷积变
换,获取 40 个 Gabor 小波幅值,对不同尺度情况
下的 8 个方向幅值取平均值,再除以 255 以使得幅
值归一化至 0~1 之间。4 种病害 Gabor 小波 5 个尺
度幅值统计结果图如图 6 所示。从图中可以看出,
B 分量的尺度 2 的 4 种病害幅值平均值区分最为明
显,4 种病害在 2G-R-B 分量的尺度 1、尺度 2 和尺
度 3 的幅值平均值差异最大,(G+R+B)/3 分量在尺
度 1 至尺度 4 的区分度较高,Q 分量的前 2 个尺
度最为容易区分。因此,将二维 Gabor 小波对 B
农业工程学报 2014 年
226
分量的尺度 2,2G-R-B 分量尺度 1、尺度 2、尺
度 3,(G+R+B)/3 分量的尺度 1 至尺度 4,Q 分量
的尺度 1、尺度 2 的 8 个方向平均幅值作为纹理
特征进行提取。
图 6 Gabor 小波 5 个尺度 8 个方向平均幅值 4 种病害统计结果图
Fig.6 Statistics chart Gabor wavelet five scales eight directions average amplitudes with four kinds of disease
2.2 基于最优二叉树的支持向量机识别试验
试验中,从每类 90 幅蜜柚病害图像中,随机
选取 60 幅图像,共 240 幅病害图像作为训练样本,
4 类病害剩余 30 幅图像,共 120 幅作为测试样本。
在 Windows 7.0 操作系统和 Matlab2011b 软件平台
上进行试验。通过 Matlab 库文件自带的 SVM 分类
器,构建出基于最优二叉树的支持向量机病害多类
识别模型,对黄斑病、炭疽病、疮痂病、煤烟病等
4 类蜜柚病害进行分类识别测试。构成的 3 层决策
分类树,每个分类器内积核函数都采用径向基核函
数
2
2( , ) exp 2
i j
i j
x x
K x x σ
⎛ ⎞−⎜ ⎟= −⎜ ⎟⎝ ⎠,核函数的宽度 σ 和
误差惩罚参数C通过对每个结点处样本集的交叉验
证来调节,得出最优的参数。由于试验所用蜜柚样
本数据量较小,因此采用交叉验证的方法进行分类
识别测试。蜜柚病害识别训练识别流程如图 7 所示,
从图中可知,首先提取蜜柚病害的 B 分量、2G-R-B
分量、(G+R+B)/3 分量、Q 分量图像,再利用 Gabor
小波对提取的 4 个分量图像,提取 B 分量的尺度 2,
2G-R-B 分量尺度 1、尺度 2、尺度 3,(G+R+B)/3
分量的尺度 1 至尺度 4,Q 分量的尺度 1、尺度 2
的 8 个方向平均幅值,组合在一起共 10 维作为试
验的特征变量。
根据蜜柚叶部病害分类识别测试结果(见表
2),在 2 层最优二叉树支持向量机病害识别中,
第 1 层根结点分类器 SVM1,2V3,4 在识别黄斑病、炭
疽病(1,2)和疮痂病、煤烟病(3,4)时,每类
病害图像 30 幅,黄斑病中的 2 幅图像、炭疽病中
的 1 幅图像和 1 幅疮痂病图像识别错误,而煤烟病
错误识别数为 0,准确率分别为 93.33%、96.66%、
96.66%、100%。根据原因分析是因为有 1 幅黄斑病
为病害初期,叶片只有少量病斑,提取的纹理特征
与疮痂病相似,从而执行了错误分类,另一幅黄斑
病颜色与烟煤病相同,识别错误;这 1 幅炭疽病叶
片识别错误是因为叶片没有发生卷曲,与训练中的
炭疽病叶片会发生不同程度卷曲现象提取的纹理
特征信息存在差异;1 幅疮痂病识别错误是因为出
现该病害同时叶片由于脱水发生了自然卷曲,被误
第 19 期 张建华等:基于最优二叉树支持向量机的蜜柚叶部病害识别
227
判为炭疽病。
第 2 层叶结点分类器 SVM1V2 在识别黄斑病与
炭疽病时,炭疽病全部识别正确,而黄斑病中的 1
幅图像因为叶片发生卷曲而被错误识别为炭疽病,
但因第 1 层分类器的累计的错误,因此,黄斑病与
炭疽病准确率分别为 90.00%、96.66%。叶结点分类
器 SVM3V4 在识别疮痂病与煤烟病中,分别出现了
1 幅图像的错误识别,因为都为疮痂病发生的同时
出现了煤烟病,因此,疮痂病与煤烟病准确率分别
为 93.33%、96.66%。
图 7 蜜柚病害识别训练识别流程图
Fig.7 Training and identify flowchart of pomelo disease recognition
由第 2 层 2 个叶结点分类器识别的准确率即为
单项病害识别的准确率,如黄斑病的单项病害识别
率为 90.00 即是分类器 SVM1,2的识别准确率 90.00,
煤烟病单项准确率为 96.66 即为分类器 SVM3,4的识
别准确率 96.66。黄斑病、炭疽病、疮痂病与煤烟病,
4 种病害单项病害识别准确率分别为 90.00%、
96.66%、93.33%、96.66%。4 种病害平均识别准确
率达到 94.16%。因此,表明基于最优二叉树的支持
向量机模型可较好地对4种蜜柚叶部病害进行识别。
表 2 蜜柚叶部病害分类识别测试结果
Table 2 Test results of pomelo leaf diseases classification
蜜柚叶部病害 Pomelo leaf diseases 分类器识别准确率
Classifier recognition
accuracy
黄斑病
Macular
炭疽病
Anthrax
疮痂病
Scab
煤烟病
Sooty mold
分类器 SVM1,2V3,4准确率
Classifier SVM1,2V3,4
recognition accuracy/%
93.33 96.66 96.66 100
分类器 SVM1V2 准确率
Classifier SVM1V2
recognition accuracy/%
90.00 96.66
分类器 SVM3V4 准确率
Classifier SVM3V4
recognition accuracy/%
93.33 96.66
单项病害识别准确率
Single disease recognition
accuracy/%
90.00 96.66 93.33 96.66
平均识别准确率
Average recognition
accuracy/%
94.16
注:SVM 为支持向量机,下同。
Note: SVM is support vector machine, the same below.
2.3 蜜柚叶部病害识别比较试验
为了进一步验证本文方法的可行性,将本文方
法与 BP 神经网络、一对一 SVM 与一对多 SVM 进
行比较。其中 BP 神经网络采用 160-80-4 三层结构,
学习速率为 0.5、惯性系数设定为 0.8、目标误差为
0.01,迭代次数设定为 800;一对一 SVM 和一对多
SVM 都采用径向基核函数,其中一对一 SVM 共有
分类器数为 4 个,一对多 SVM 共有分类器数目 4
个。试验中,训练集与测试集情况与“基于最优二
叉树的支持向量机识别试验”相同,即训练集为 240
幅病害图像,测试集为 120 幅病害图像,在不同特
征变量情况下,分别从训练时间和识别精度 2 个方
面,对蜜柚病害识别进行对比分析。特征变量分为
B 分量特征、2G-R-B 分量特征、(G+R+B)/3 分量特
征、Q 分量特征、综合特征等 5 个类型。其中,B
分量特征为B颜色分量下提取的尺度 2的Gabor 小
波 8 个方向的平均幅值,共 1 个特征变量;2G-R-B
分量特征为 2G-R-B 分量下的尺度 1、尺度 2、尺
度 3 的 Gabor 小波 8 个方向的平均幅值;(G+R+B)/3
分量特征为(G+R+B)/3 分量下的 4 个尺度 Gabor 小
波 8 个方向的平均幅值;Q 分量特征为 Q 分量下的
尺度 1 与尺度 2 的 Gabor 小波 8 个方向的平均幅
值;综合特征即为“B 分量特征”+“2G-R-B 分量
农业工程学报 2014 年
228
特征”+“(G+R+B)/3 分量特征”+“Q 分量特征”,
共 10 个特征变量。
4 种识别方法不同特征变量训练时间结果见表
3,从表中可以看出,在不同特征变量方面,由于
综合特征的维数是 10 维多于其他分量特征维数,
训练时间较 B 分量特征、2G-R-B 分量特征、
(G+R+B)/3 分量特征、Q 分量特征训练时间长。在
不同训练方法方面,BP 神经网络方法在单项分量
特征情况为平均训练时间为 600 ms,综合特征训练
时间为 740 ms,耗时远远多于支持向量机方法;一
对一 SVM、一对多 SVM 和本文方法的单分量特征
训练时间分别为 350、370、300 ms,在综合特征训
练时间,一对一 SVM、一对多 SVM 和本文方法分
别为 420、450、370 ms,本文方法较一对一 SVM 和
一对多 SVM 的训练时间少。因此,从训练时间角度
看,本文方法较 BP 神经网络、一对一 SVM 和一对
多 SVM 的训练时间短。是因为本文方法从支持向量
机分类器结构上采用了最优二叉树的方法,减少了
需要训练的分类器个数,从而缩短了训练的时间。
在不同特征变量情况下,4 种方法识别病害结
果见表 3,从中可以看出,随着特征变量的变化,4
种方法的识别准确率都不同程度的影响,综合特征
的识别率明显高于单分量特征,在单分量特征中,
2G-R-B 分量特征和(G+R+B)/3 分量特征识别率要
好于 B 分量和 Q 分量。从不同识别方法上看, BP
神经网络、一对一 SVM、一对多 SVM 和本文方法
在综合特征的识别率分别为:86.00%、91.50%、
90.00%、94.16%。因此,从病害识别结果可以得出,
本文方法较 BP 神经网络、一对一 SVM 和一对多
SVM 的识别效果优越。
表 3 4 种识别方法不同特征变量训练时间和病害识别结果
Table 3 Training time and classification disease results of four methods with different characteristic
BP 神经网络
BP neural network
一对一 SVM
One to one SVM
一对多 SVM
One to many SVM
本文方法
Proposed method 特征变量
Characteristic variables 训练时间
Training
time/ms
识别率
Recognition
rate/%
训练时间
Training
time/ms
识别率
Recognition
rate/%
训练时间
Training
time/ms
识别率
Recognition
rate/%
训练时间
Training
time/ms
识别率
Recognition
rate/%
B 分量
B component 600 41.00 350 47.00 370 47.00 300 47.00
2G-R-B 分量
2G-R-B component 600 60.50 350 66.00 370 66.00 300 70.00
(G+R+B)/3 分量
(G+R+B)/3 component 600 62.16 350 68.50 370 65.60 300 70.00
Q 分量
Q component 600 39.96 350 44.04 370 42.18 300 45.01
综合特征
Comprehensive features 740 86.00 420 91.50 450 90.00 370 94.16
3 结 论
1)利用二维 Gabor 小波与 B 分量、2G-R-B 分
量、(G+R+B)/3 分量以及 YIQ 颜色模型中的 Q 分量
的灰度图像进行卷积计算,获得的纹理特征向量,
具有多尺度多方向的特性,同时又充分反映了不同
病害之间细微的差别,使得提取的特征具有较高区
分性。
2)构建的基于最优二叉树支持向量机蜜柚叶
部病害识别模型,经过最优二叉树,3 个支持向量
机(support vector machine, SVM)分类器的计算,
最终确定病害的种类;通过交叉验证的方法进行分
类识别测试,得出:黄斑病、炭疽病、疮痂病、煤
烟病识别准确率分别为 90%、96.66%、93.33%、
96.66%,平均识别率达到 94.16%,表明本文方法可
有效识别蜜柚叶部的 4 种病害。同时,该研究构建
的蜜柚叶部病害识别模型试验结果是针对中晚期
病害得出的结果,而对于早期病害的检测与识别在
今后还需进一步测试。
3)通过将本文方法与 BP 神经网络、一对一
SVM 与一对多 SVM 进行比较,试验结果得出:在
综合特征训练时间上,BP 神经网络、一对一 SVM、
一对多 SVM 和本文方法分别为 740、420、450、
370 ms;在病害识别精度上,BP 神经网络、一对一
SVM、一对多 SVM 和本文方法在综合特征的识别
率分别为:86.00%、91.50%、90.00%、94.16%。因
此,本文方法在训练时间和蜜柚病害识别精度上都优
于其他 3 种方法。但本文方法只针对叶片感染单一病
害的识别,而对于同一叶片感染多种病害,以及病害
与虫害同时危害的情况,需要进一步研究与探索。
[参 考 文 献]
[1] 潘锦山. 基于 3G 混合网络和 GPS 技术的果树移动专
家系统(FMES)的构建[D]. 福建:福建农林大学,
2010.
Pan Jinshan. Study on Mobile Expert System of Fruit
Trees (FMES) on the Basis of 3G Hybrid Network and
GPS Technology[D]. Fujian: Fujian Agriculture and
Forestry University, 2010. (in Chinese with English abstract)
第 19 期 张建华等:基于最优二叉树支持向量机的蜜柚叶部病害识别
229
[2] 李小龙,王库,马占鸿,等. 基于热红外成像技术的
小麦病害早期检测[J]. 农业工程学报,2014,30(18):
183-189.
Li Xiaolong, Wang Ku, Ma Zhanhong, et al. Early
detection of wheat disease based on thermal infrared
imaging[J]. Transactions of the Chinese Society of
Agricultural Engineering (Transactions of the CSAE),
2014, 30(18): 183-189. (in Chinese with English abstract)
[3] 梅慧兰,邓小玲,洪添胜,等.柑橘黄龙病高光谱早期鉴
别及病情分级[J]. 农业工程学报,2014,30(9):140-147.
Mei Huilan, Deng Xiaoling, Hong Tiansheng, et al. Early
detection and grading of citrus huanglongbing using
hyperspectral imaging technique[J]. Transactions of the
Chinese Society of Agricultural Engineering (Transactions
of the CSAE), 2014, 30(9): 140-147. (in Chinese with
English abstract)
[4] Alchanatis V,Ridel L,Hetzroni A,et al. Weed detection
in multi-spectral images of cotton fields[J]. Computers
and Electronics in Agriculture, 2005, 47(3): 243-260.
[5] 冀荣华,祁力钧,傅泽田. 自动对靶施药系统中植物
病害识别技术的研究[J]. 农业机械学报,2007,38(6):
190-192.
Ji Ronghua, Qi Lijun, Fu Zetian. Automatic target
pesticide research on plant disease identification system
technology[J]. Transactions of the Chinese Society for
Agricultural Machinery, 2007, 38(6): 190- 192. (in
Chinese with English abstract)
[6] 管泽鑫,唐健,杨保军,等. 基于图像的水稻病害识
别方法研究[J]. 中国水稻科学,2010,24(5):497-502.
Guan Zexin, Tang Jian, Yang Baojun, et al. Study on
recognition method of rice disease based on image[J].
China Rice Sci, 2010, 24(5): 497-502. (in Chinese with
English abstract)
[7] 陈兵旗,郭学梅,李晓华. 基于图像处理的小麦病害
诊断算法[J]. 农业机械学报,2009,40(12):190-195.
Chen Bingqi, Guo Xuemei, Li Xiaohua. Image diagnosis
algorithm of diseased whea[J]. Transactions of the
CSAM, 2009, 40(12): 190 - 195. (in Chinese with
English abstract)
[8] Sena D G, Pinto F A C, Queiroz D M, et al. Fall
armyworm damaged maize plant identification using
digital images[J]. Biosystems Engineering, 2003, 85(4):
449-454.
[9] Camargoa A, Smith J S. An image-processing based
algorithm to automatically identify plant disease visual
symptoms[J]. Biosystems Engineering, 2009, 102(1): 9-
21.
[10] Pydipati R, Burks T F, Lee W S. Identification of citrus
disease using color texture features and discriminant
analysis[J]. Computers and Electronics in Agriculture,
2006, 52(9): 49-59.
[11] Huang Kuoyi. Application of artificial neural network for
detecting Phalaenopsis seedling diseases using color and
texture features[J]. Computers and Electronics in
Agriculture, 2007, 57(2): 3-11.
[12] Santanu Phadikar, Jaya Sil, Asit Kumar Das. Rice
diseases classification using feature selection and rule
generation techniques[J]. Computers and Electronics in
Agriculture, 2013, 90(6): 76-85.
[13] Rumpf T, Mahlein A K, Steiner U. Early detection and
classification of plant diseases with Support Vector
Machines based on hyperspectral reflectance[J]. Computers
and Electronics in Agriculture. 2010, 74(4): 91-99.
[14] 张建华,祁力钧,冀荣华,等. 基于粗糙集和 BP 神经
网络的棉花病害识别[J]. 农业工程学报,2012,28(7):
161-167.
Zhang Jianhua, Qi Lijun, Ji Ronghua, et a1. Cotton
diseases identification based on rough sets and BP neural
network[J]. Transactions of the Chinese Society of
Agricultural Engineering (Transactions of the CSAE),
2012, 28(7): 161-167. (in Chinese with English abstract)
[15] 温芝元,曹乐平. 椪柑果实病虫害的傅里叶频谱重分
形图像识别[J]. 农业工程学报,2013,29(23):159-
165.
Wen Zhiyuan, Cao Leping. Citrus fruits diseases and
insect pest recognition based on multifractal analysis of
Fourier transform spectra[J]. Transactions of the Chinese
Society of Agricultural Engineering (Transactions of the
CSAE), 2013, 29(23): 159 - 165. (in Chinese with
English abstract)
[16] GBT-23222-2008 烟草病虫害分级调查方法[S].
[17] 谢成君,刘普明. 马铃薯病虫害发生程度综合指标的
确定[J]. 中国马铃薯,2010,24(3):165-169.
Xie Chengjun, Liu Puming. Determination of comprehensive
indexes in occurrence degree of potato insects and
diseases[J]. Chinese Potato Journal, 2010, 24(3): 165-
169. (in Chinese with English abstract)
[18] 徐小龙,蒋焕煜,杭月兰. 热红外成像用于番茄花叶
病早期检测的研究[J]. 农业工程学报,2012,28(5):
145-149.
Xu Xiaolong, Jiang Huanyu, Hang Yuelan. Study on
detection of tomato mosaic disease at early stage based
on infrared thermal imaging[J]. Transactions of the
Chinese Society of Agricultural Engineering (Transactions
of the CSAE), 2012, 28(5): 145-149. (in Chinese with
English abstract)
[19] Glaucia M B, Vilma A O, Estevam R H, et al. Using
Bayesian networks with rule extraction to infer the risk of
weed infestation in a corn-crop[J]. Engineering Applications
of Artificial Intelligence, 2009, 22(4): 579-592.
农业工程学报 2014 年
230
[20] Asnor J I, Aini H, Mohd M M, et al. Weed image
classification using Gabor wavelet and gradient field
distribution[J]. Computers and Electronics in Agriculture,
2009, 66(1): 53-61.
[21] 朱峰,王海丰,任洪娥. 基于 Gabor 变换的纹理图像
分割算法及应用[J]. 森林工程,2013,29(5):60-63.
Zhu Feng, Wang Haifeng, Ren Honge. Research on
texture image segmentation algorithm and its application
based on gabor wavelet transform[J]. Forest Engineering,
2013, 29(5): 60-63. (in Chinese with English abstract)
[22] 吴延海,梁文莉. 基于 Gabor 小波变换的 ICA 人脸识
别算法研究[J]. 微电子学与计算机,2013,30(7):
141-144.
Wu Yanhai, Liang Wenli. Research on ICA face
recognition algorithm based on gabor wavelet
transform[J]. Microelectronics & Computer, 2013, 30(7):
141-144. (in Chinese with English abstract)
[23] 冯鑫,王晓明,党建武. 基于 Curvelet-散射特征的图像纹
理分类[J]. 农业机械学报,2012,43(10):184-189.
Feng Xin, Wang Xiaoming, Dang Jianwu. Image texture
classification based on curvelet-scattering features[J].
Transactions of the Chinese Society for Agricultural
Machinery, 2012, 43(10): 184-189. (in Chinese with
English abstract)
[24] Zhang D, Lu G. Content-based Image Retrieval Using
Gabor Texture Features[C]∥Proc. of First IEEE Pacific-
Rim Conference on Multimedia (PCM00), Sydney,
Australia, 2000.
[25] 李志星,陈书贞,周建华,等. 基于 Gabor 小波能量
子带分块的稀疏表示人脸识别[J]. 燕山大学学报,
2013,37(1):68-74.
Li Zhixing, Chen Shuzhen, Zhou Jianhua, et al. Sparse
representation for face recognition based on partitioning
energy sub-band of Gabor wavelet[J]. Journal of Yanshan
University, 2013, 37(1): 68 - 74. (in Chinese with
English abstract)
[26] 王湘平,张星明. 基于 Gabor 小波的眼睛和嘴巴检测
算法[J]. 计算机工程,2005,31(22):169-171.
Wang Xiangping, Zhang Xingming. GABOR Wavelet-based
eyes and mouth detection algorithm[J]. Computer
Engineering, 2005, 31(22): 169-171. (in Chinese with
English abstract)
[27] 王津京,赵德安,姬伟. 采摘机器人基于支持向量机苹
果识别方法[J]. 农业机械学报,2009,40(1):148-151.
Wang Jinjing, Zhao Dean, Ji Wei. Apple fruit recognition
based on support vector machine using in harvesting
robote[J]. Transactions of the Chinese Society for
Agricultural Machinery, 2009, 40(1): 148- 151. (in
Chinese with English abstract)
[28] 宋怡焕,饶秀勤,应义斌. 基于 DT-CWT 和 LS-SVM
的苹果果梗/花萼和缺陷识别[J]. 农业工程学报,2012,
28(9):114-118.
Song Yihuan, Rao Xiuqin, Ying Yibin. Apple stem/calyx
and defect discrimination using DT-CWT and
LS-SVM[J]. Transactions of the Chinese Society of
Agricultural Engineering (Transactions of the CSAE),
2012, 28(9): 114-118. (in Chinese with English abstract)
[29] 焦有权,赵礼曦,邓欧,等. 基于支持向量机优化粒
子群算法的活立木材积测算[J]. 农业工程学报,2013,
29(20):160-167.
Jiao Youquan, Zhao Lixi, Deng Ou, et al. Calculation of
live tree timber volume based on particle swarm
optimization and support vector regression[J].
Transactions of the Chinese Society of Agricultural
Engineering (Transactions of the CSAE), 2013, 29(20):
160-167. (in Chinese with English abstract)
[30] 李小昱,陶海龙,高海龙,等. 基于多源信息融合技
术的马铃薯痂疮病无损检测方法[J]. 农业工程学报,
2013,29(19):277-284.
Li Xiaoyu, Tao Hailong, Gao Hailong, et al.
Nondestructive detection method of potato scab based on
multi-sensor information fusion technology[J].
Transactions of the Chinese Society of Agricultural
Engineering (Transactions of the CSAE), 2013, 29(19):
277-284. (in Chinese with English abstract)
[31] 翟治芬,严昌荣,张建华,等. 基于蚁群算法和支持
向量机的节水灌溉技术优选[J]. 吉林大学学报:工学
版,2013,43(4):997-1003.
Zhai Zhifen, Yan Changrong, Zhang Jianhua, et al.
Optimization of water-saving irrigation technology based
on ant colony algorithm and supporting vector
machine[J]. Journal of Jilin University: Engineering and
Technology Edition, 2013, 43(4): 997 - 1003. (in
Chinese with English abstract)
[32] 韩瑞珍,何勇. 基于计算机视觉的大田害虫远程自动
识别系统[J]. 农业工程学报,2013,29(3):156-162.
Han Ruizhen, He Yong. Remote automatic identification
system of field pests based on computer vision[J].
Transactions of the Chinese Society of Agricultural
Engineering (Transactions of the CSAE), 2013, 29(3):
156-162. (in Chinese with English abstract)
[33] 邓继忠,李 敏,袁之报,等. 基于图像识别的小麦腥
黑穗病害特征提取与分类[J]. 农业工程学报,2012,
28(3):172-176.
Deng Jizhong, Li Min, Yuan Zhibao, et al. Feature
extraction and classification of Tilletia diseases based on
image recognition[J]. Transactions of the Chinese Society
of Agricultural Engineering (Transactions of the CSAE),
2012, 28(3): 172-176. (in Chinese with English abstract)
第 19 期 张建华等:基于最优二叉树支持向量机的蜜柚叶部病害识别
231
Recognition of honey pomelo leaf diseases based on optimal binary
tree support vector machine
Zhang Jianhua, Kong Fantao, Li Zhemin※, Wu Jianzhai,
Chen Wei, Wang Shengwei, Zhu Mengshuai
(1. Agricultural Information Institute of Chinese Academy of Agricultural Sciences, Beijing 100081 China;
2. Key Laboratory of Agri-information Services Technology, Ministry of Agriculture, Beijing 100081 China)
Abstract: Honey pomelo, one of the most important fruits in China, always suffers a variety of diseases during
the whole process of planting, such as maculopathy, anthracnose, scab and dark mildew, which seriously affects
the fruit quality and yield. The accurate recognition of honey pomelo leaf diseases is the premise of the treatment
of honey pomelo diseases, and the precision directly affects the efficiency in controlling diseases. However, most
of the current researches on disease recognition aimed at the global information of the study objects, but ignored
the disease’s local feature extraction in multi-scale and multi-direction; in addition, the present researches
generally used the method of “one to one” or “one to many” when building many types of support vector machine
(SVM) in the disease classification model, few researches used the method about SVM based on directed acyclic
decision tree. So, leaf diseases recognition of honey pomelo based on SVM of directed acyclic decision tree was
put forward in this paper. At first, statistical analysis on components of color characteristics of collected honey
pomelo leaf diseases was carried on, and the conclusion was drawn according to the statistics of component B,
component 2G-R-B, component (G+R+B)/3 and component Q in YIQ color model, which were easily
distinguished among the 4 diseases, and so the 4 color components were used as disease color features. Secondly,
honey pomelo leaf disease images were converted into 4 grayscale images of component B, component 2G-R-B,
component (G+R+B)/3 and component Q in YIQ color model. Gabor wavelet with 5 dimensions and 8 directions
was used for convolution calculation with 4 grayscale component images, and 16-dimension energy sub-band was
got, the mean value of which was used as eigenvector. Disease recognition model of three-level directed acyclic
decision tree SVM was constructed by 6 SVM classifiers, in order to recognize 4 honey pomelo diseases, i.e.
maculopathy, anthracnose, scab and dark mildew. According to the test results of cross validation method, the
recognition accuracies of maculopathy, anthracnose, scab and dark mildew respectively reached 90%, 96.66%,
93.33% and 96.66%, and the average recognition rate of the 4 diseases was 94.16%, showing that the method
could effectively recognize the 4 honey pomelo leaf diseases. Optimal binary tree SVM proposed in this paper
was compared with BP neural network, one-to-one SVM and one-to-many SVM in different characteristic
dimensions, and the results showed that the training time of the proposed method in this paper and other 3
methods was respectively 740 ms, 420 ms, 450 ms and 370 ms, and the disease recognition accuracy of the 4
methods was respectively 86%, 91.5%, 90% and 94.16%. The method proposed in this paper is superior to the
other 3 algorithms in training time and recognition precision. So the proposed method can provide technical
support for the accurate recognition of honey pomelo leaf diseases, in favor of the prevention and treatment of
pomelo diseases, and also provide references for the prevention and cure of other plant’s leaf diseases.
Key words: diseases; identification; image processing; Gabor wavelet; optimal binary tree; support vector
machines; pomelo leaf