免费文献传递   相关文献

Plant Recognition Based on Compound Leaf Features

基于复合叶片特征的计算机植物识别方法



全 文 :植物学报 Chinese Bulletin of Botany 2014, 49 (4): 450–461, www.chinbullbotany.com
doi: 10.3724/SP.J.1259.2014.00450
——————————————————
收稿日期: 2013-07-17; 接受日期: 2014-01-10
* 通讯作者。E-mail: gaoxiang12@mails.tsinghua.edu.cn
基于复合叶片特征的计算机植物识别方法
高翔*, 王正, 丁见亚, 杨倩
清华大学自动化系, 北京 100084
摘要 该文探讨如何根据植物的叶片特征, 利用图像处理和机器学习的方法对植物进行分类。鉴于现有的叶片分类系统多
采用单一的特征, 如几何和纹理等, 仅能在小规模数据库上得到较好的结果。然而, 随着样本种类的增多, 单一特征在不同
种类叶片之间的相似性非常明显, 致使分类正确率降低。该研究使用多种复合特征, 并提出了原创的预处理方法以及宽度、
叶缘频率特征, 较传统的几何特征更为详尽。研究结果显示, 复合特征可以有效避免算法过拟合问题, 使之适用于更大的数
据库。通过提取21类植物的叶片宽度、颜色、叶缘和纹理共292维特征, 对1 915张数字图像进行了分类, 正确率达到93%,
并分析了各类特征对分类结果的影响。研究结果表明, 在不影响分类正确率前提下, 可将特征减少到约100维。
关键词 机器学习, 模式识别, 植物分类, 图像处理, 叶片特征
高翔, 王正, 丁见亚, 杨倩 (2014). 基于复合叶片特征的计算机植物识别方法. 植物学报 49, 450–461.
植物分类是研究和保护植物的基础。据统计, 地
球上共约有300 000种植物。其中被植物学家所记录
的有250 000多种(黄志开, 2006)。因此, 植物分类研
究对保护植物多样性具有重要意义。传统的植物识别
与分类往往依靠人的经验。先要人工采集植物样本,
测量它们的各种器官, 并获取特征数据, 再进行数据
的分析与比对, 来确定植物的种类。这些方法尽管具
有较好的灵活性, 但效率明显偏低(魏蕾, 2012)。相比
之下, 计算机技术, 特别是使用图像处理和模式识别
等技术手段进行植物分类, 则效率较高。该技术正逐
渐成为植物分类的另一种途径。一方面, 它可以避免
人工对大量植物进行观察和测量的繁琐过程, 具有客
观和精确的优点; 且在植物的各种器官中, 叶片最便
于用计算机进行处理。另一方面, 植物的叶片在一年
的大部分时间均可观察到, 且其在植物学中具有明显
的分类意义。花、果实和种子则观察时期很短, 观察
根和茎又容易对植物造成损伤。在植物学中, 叶片是
重要的分类依据, 甚至有“以叶为主, 其它为辅”的
说法(顾振华, 2008)。因此, 本文主要研究如何使用计
算机根据叶片特征来判断植物的种类。
近20年来, 随着计算机视觉与机器学习的发展,
人们对机器植物识别展开了大量研究(傅弘等, 2004;
朱静等, 2005; Lee and Chen, 2006; Du et al., 2007;
Wang et al., 2008; 侯铜等, 2009; 邵新庆等, 2010;
Chaki and Parekh, 2011; Valliammal and Geetha-
lakshmi, 2012; 郑小东等, 2012)。这些分类系统的基
本流程相似。首先提取叶片特征, 之后以此特征为基
础训练分类器, 最后用该分类器对数据库进行分类。
作为模式识别方法在植物分类领域的一个重要应用,
基于叶片特征的分类系统, 其最关键和最本质的问题
在于特征的选取。选取了有重要分类意义的特征, 就
能极大地提高识别的正确率。
常见的叶片图像特征可分为3种, 即形状、叶缘
和纹理, 多数研究只把单一的特征作为分类依据。然
而, 在实际应用中, 存在以下几方面的不足: (1) 世
界上的植物种类非常多, 很难依靠有限的特征对所有
植物进行分类。而仅凭小规模数据库的分类正确率来
衡量特征的好坏不具普遍意义。要构建有实用价值的
分类系统, 必须考虑多种特征的复合。(2) 图像特征
的选择多根据经验所得的结论。例如, 一些形状特征
(周长、面积和长宽比)比较粗糙和笼统。如要区分形
状相近的叶片, 则需更加精细的特征。(3) 图像能够
提供的特征只占叶片特征的一小部分。许多现实中的
叶片特征(如表面质地)并不能在图像上反映出来。也
有一些特征(如叶尖的形状等)虽能反映, 但难以用数
学符号表述。还有一些特征(如叶片的面积随着相机
·技术方法·
高翔等: 基于复合叶片特征的计算机植物识别方法 451
与叶片距离不同而变化)则需要依赖参照物。因此, 在
使用面积特征时, 需要保证相机参数不变, 或在叶片
边上放置参照物。然而在实际场合中, 很难保证这些
参照物不变。
针对上述问题, 我们考虑使用复合特征来对植物
叶片进行分类。本研究共使用了200多维的特征, 涵
盖了叶片的颜色、形状、纹理和叶缘特征, 并且这些
特征不依赖于固定参照物。在前人工作的基础上, 我
们提出了比传统形状特征更为详细的宽度特征曲线
及叶缘频率。我们的工作主要有4方面贡献。(1) 基于
复合特征的分类方法不容易引起过学习, 并可适用于
更大型的数据库。(2) 提取的特征(如预处理方法, 宽
度和叶柄处理方法)具原创性。预处理方法比较鲁棒,
宽度信息比以往的周长和面积信息更详细、可靠。叶
柄处理方法可有效地去除叶柄对图像的影响。(3) 对
这些特征的分类性能作了比较并进行了验证。结果表
明, 叶片的颜色信息及两端的宽度信息均具有较高的
分类性能。(4) 提取特征的算法不依赖于叶片尺度,
即不需要参照物。
1 相关工作
到目前为止, 研究者们提取的叶片特征主要分为形
状、叶缘和纹理3种, 提取方法各有不同。下面分别
阐述此方面的相关工作。
1.1 形状特征
形状特征指叶片的几何特征, 一般包括长宽比、面积、
圆度、偏心率、凸包面积、周长和边缘光滑度等轮廓
信息及区域信息。这些特征通常比较稳定且区别性好,
提取过程也相对容易, 故应用范围很广。
Du等(2007)提取了颜色、长宽比和凸包面积比等
15维形状信息, 提出了名为MMC(move median cen-
ters hyper sphere classifier)的分类方法。利用此方法
对20类共400张叶子照片进行分类, 达到了约90%的
分类正确率。台湾元智大学的Lee和Chen (2006)使用
周长、紧密度和质心特征, 并加以不同的权重进行
分类, 准确率约为82.3%。Wu等(2007)用12个形状特
征对32类1 800张叶子照片进行分类, 准确率达到
90%以上。Chaki和Parekh(2011)使用形状特征对3

类共180张图片进行分类, 准确率为90%–100%。朱
静等(2005)基于叶片形状和叶缘特征识别系统, 对14
种植物337份叶片样本测试准确率达到93.2%。
1.2 叶裂特征
叶裂指叶缘具有较大缺刻的边缘形态。常见的叶裂有
掌状和羽状2种。郑小东等(2012)曾针对叶裂提取展
开了研究。他们构造了叶片的凸包距离函数, 通过分
析该函数, 判断是否存在叶裂, 然后进一步判断叶裂
类型、数量和深度。Mokhtarian和Abbasi(2004)研究
了具叶裂叶片的自交问题, 并设计方法使自交叶片能
被展平。
1.3 纹理特征
纹理是指存在于图像中某一范围内的形状很小、半周
期性或有规律排列的图案。在图像判读中使用纹理表
示图像的均匀、细致和粗糙程度。香港理工大学的Fu
和Chi(2003)利用一种两级提取纹理信息方法, 提取
出精确的叶片脉络形态。重庆大学的Li等(2005)结合
Snakes技术和细胞神经网络, 提出了一种有效提取
树叶纹理的方法, 并利用先验信息, 从隐含模型和参
数模型中提取相似点, 增加了分离叶片的精确性和鲁
棒性。
1.4 分形特征
除了应用叶子表面的特征外, 还有学者使用分形特征
进行分类。Backes等(2009)应用叶子表面纹理的分形
维数进行了植物识别。杨辉军和陈立伟(2010)作了类
似工作。
纵观上述研究可以看出, 多数只针对叶子的某一
种特征信息进行判别, 然后验证该特征的有效性。但
是, 应该注意到, 对于十几类叶片构成的数据库, 使
得数据库中的样本在某个特定的特征上有明显区别
是很容易的。例如, 研究叶片形状的工作, 基本会选
取形状差异较大的叶片作为数据库的样本。这种做法
会导致分类问题产生明显的过拟合, 一旦数据库中出
现形状相似的叶片, 分类工作将难以进行。
因此, 本研究考虑使用多种特征的复合来对叶片
进行分类。遵循普遍的分类问题工作结构, 即特征提
取→选择→识别(3步), 对21类共1 915张植物叶片的

452 植物学报 49(4) 2014
照片进行分类。按照本研究提取的特征, 使用径向基
函数(radial basis function, RBF)核的支持向量机, 分
类正确率可达93%(50次取平均值)。
2 分类方法
2.1 预处理: 目标物体提取
目标物体提取是在一幅图像中定位所需目标并将其
完整地与非目标区域区分开。对于任意一幅叶片图像,
必然同时存在着叶片主体与背景, 因此, 若要对叶片
进行特征提取, 首先需从背景中区分出叶片。针对此
问题 , 我们提出了Otsu阈值法 (Otsu, 1975)与 k-
means颜色聚类法相结合的目标物体提取方法。该方
法融合了Otsu阈值法与k-means颜色聚类法的优点,
在目标定位的准确性及目标提取的完整性上均明显
优于单独使用某一方法。

2.1.1 Otsu阈值法
Otsu阈值法的基本假设是: 图片的灰度信息呈双峰
分布, 即目标物体与背景各呈一峰, 因此可以将其灰
度信息聚为两类。
首先, 估计两类的先验概率:

其中, P(i)表示灰度值为i的像素点的比例。之后, 再计
算两类各自的类内均值:

由此, 即可计算两类的类内方差:

由以上结果可最终计算加权后的类内方差:

对于灰度图而言, 只需将t从1到256取值, 选择σw2(t)
最小的t为分类阈值点:

Otsu阈值法的缺陷在于过度依赖灰度信息, 忽
略了颜色信息等其它重要信息, 因此对于很多图像的
提取效果并不理想(图1)。



图1 图像的预处理
从左至右分别是Otsu算法、基于颜色信息的聚类算法和混合算法。

Figure 1 Preprocessing of images with simple background
From left to right is Otsu, color-based k-means and hybrid algorithm.
高翔等: 基于复合叶片特征的计算机植物识别方法 453
2.1.2 k-means颜色聚类法
L*a*b*颜色空间由国际照明委员会(International Com-
mission on Illumination, CIE)于1976年制定。用L*、
a*和b* 3个互相垂直的坐标轴来表示一个色彩空间,
L*轴表示明度, 黑在底端, 白在顶端。+a*表示品红
色, –a*表示绿色, +b*表示黄色, –b*表示蓝色, a*轴是
红-绿色轴, b*轴是黄-蓝色轴。任何颜色的色相和特征
都可以用a*和b*数值来表示, 用L*、a*和b*3个数值可
以描述自然界中的任何色彩。
对于1张彩色图像, 将其转化到L*a*b*颜色空间
后, 则a*和b*两维的信息即表征了每一个像素点的颜
色信息。对于一般图像叶片的颜色与背景色有很大的
区别, 因而可采用k-means聚类方法将这些颜色聚为
两类, 从而达到提取的目的。
k-means颜色聚类法利用了重要的颜色信息, 在
大多数图像中其提取效果优于Otsu阈值法。然而,
k-means颜色聚类法存在2个明显的缺陷。(1) 尽管颜
色信息非常重要, 但仅使用颜色信息也会带来问题,
当背景颜色与主体颜色区分度并不强烈时, 其效果明
显下降; (2) k-means方法本身存在不确定性, 对于同
一张图像, 使用k-means方法每一次聚类的结果并不
一定相同, 有时会出现叶片提取不完全现象(图1)。

2.1.3 颜色灰度混合法
大量的实验结果表明, 使用k-means颜色聚类法时,
叶子的信息或完整地被提取出来, 或缺少了一部分。
而缺少的那部分往往是受到光照较弱的影响, 其颜色
较深。对于这部分, 由于其颜色较深, 与叶子其余部
分形成差异, 因此在颜色聚类时会被聚到背景一类。
考虑到颜色较深的部分的灰度值往往偏小, 在灰度层
面上与背景的区分度很大, 这部分叶子的信息往往会
在Otsu阈值化中被完整地保留下来。故我们对这两种
方法的结果取并集, 使得两种方法的结果互补, 从而
得到完整叶子的信息。具体算法如下。
叶片提取方法(颜色灰度混合法)可分为7个步骤:
(1) 将图片按照比例缩放到固定的长宽比, 并将其转
化到L*a*b*颜色空间; (2) 对转化到L*a*b*颜色空间
中的图片基于颜色信息做k-means聚类, 根据聚类结
果, 生成二值化图片1; (3) 将L*a*b*颜色空间的图片
转化为灰度图; (4) 对灰度图采用修正后的Otsu阈值
化法, 基于阈值信息, 生成二值化图片2; (5) 对两张
二值化图片进行去噪和填洞处理; (6) 从两张完成上
述处理的二值化图片中, 各自选取最大的一片联通区
域作为叶片轮廓1和叶片轮廓2; (7) 将叶片轮廓1与
叶片轮廓2进行“或操作”, 得到最终提取结果。
以上步骤的前6步与叶片提取方法——Otsu阈值
法和k-means颜色聚类法相似, 其目的是分别得到基
于灰度和颜色两种方法的叶片轮廓。值得注意的是,
不论是Otsu阈值法, 还是基于颜色信息的聚类法, 都
有一定几率得到不完整的叶片信息。尽管如此, 这两
种方法所得到的不完整部分有相当强的互补性。因此,
在步骤7中, 将此两种方法的轮廓进行“或操作”后,
能更好地提取叶子主体。
如图1所示, 混合方法的效果明显优于传统的单
一方法。下文所有特征的提取工作均建立在此方法提
取的叶片主体之上。
2.2 颜色信息
叶片经过2.1节的预处理, 即可进行特征提取。首先提
取叶片的颜色特征, 本研究使用的颜色特征为整体叶
片的平均R、G和B值, 具体计算方法如下。
设原图由n个像素点组成, 记它们组成的集合为
S。另记组成叶片的像素集合为Starget, 记Starget中元素
的个数为K, 很显然有Starget S, K≤n。每1个像素点
pi对应1个颜色信息ci=(ri, gi, bi)T。则叶片上的平均颜
色信息可以如下表示:

其中, I{·}为示性函数, 定义如下:

最终颜色信息由1个三维向量 构成。
2.3 叶缘信息
叶缘即叶子的边缘, 叶缘信息包括叶裂信息和锯齿信
息, 二者都是辨别叶子种类的重要依据。叶裂指叶子
454 植物学报 49(4) 2014
边缘的凹陷, 根据凹陷类型的不同可分为掌状叶裂和
羽状叶裂; 根据凹陷程度的不同可分为不裂、浅裂、
深裂和全裂。锯齿严格来说也可算作叶裂的一种, 因
为也是叶缘处的凹陷, 但由于它排列整齐有规律, 与
上述的大叶裂有明显的不同, 是区分很多不裂叶子的
重要依据, 因此植物学上通常将锯齿独立出来作为
特征。
叶缘信息可以用叶子边界到叶子凸包之间的距
离来衡量(郑小东等, 2012)。通过计算叶子边界点到
凸包(图2A)之间的距离, 可以得到距离-边界点编号
图(以下简称距离图)(图2B)。对于有大叶裂的叶子,
如枫叶, 距离图中会出现低频大尖峰; 对于有锯齿的
叶子, 如牡丹叶, 距离图中会出现高频小尖峰; 对于
叶缘光滑的叶子, 如柳叶, 距离图中则不会出现上述
2种情况。因此, 可以通过距离图的频率和幅度信息
对不同叶缘的叶子进行区分。本研究提取了81维频率
特征和3维幅度特征作为叶缘特征。叶缘特征提取算
法如下: (1) 去除叶柄; (2) 提取边界; (3) 计算凸包;
(4) 跟踪边界; (5) 计算距离; (6) 提取特征。
其中, 步骤(2)–(5)与郑小东等(2012)所述方法类
似。对于步骤(1)和(6), 我们提出了自己的方法。

2.3.1 叶柄去除算法
叶缘特征提取算法中进行的第1步是去除叶柄。有两
方面原因, 一是叶柄本身并没有适合分类的特征, 不
同种类叶子的叶柄相差不多, 况且有一些叶子照片
中还没有叶柄。二是叶柄对于叶缘特征的提取影响很
大, 对于同样一幅叶子图像, 有柄和无柄的叶缘特
征相差很大, 对于无裂叶子的影响尤为显著(图3)。因
此, 我们在提取叶缘特征时需首先去掉叶柄。
叶柄去除的关键在于定位叶柄的位置, 本研究提
出了在轮廓图中定位叶片与叶柄交接的两个点位置
方法。
在轮廓图中, 叶片与叶柄交接的两个点有以下3
个特征: (1) 到某一凸包线距离最远的点; (2) 两点间
直线距离最近, 边界距离远; (3) 两点间叶柄部分矩
形特征明显。
这里定义的边界距离是指从一点出发, 沿边界直
到另一点, 中间所经过的点数。由于叶子轮廓是一个
封闭曲线, 因此有顺时针和逆时针两种走法, 取顺时


图2 图像的凸包(A)和凸包间距(B)

Figure 2 Image’s convex hull (A) and distance to the con-
vex hull (B)

针走法及逆时针走法中距离小的一个作为边界距离
(因为几乎所有情况下柄都会比叶子小)。矩形特征是
指叶柄从根部到尖部粗细相差不多, 这个特征主要用
于区分叶柄和较细的叶尖(如樱花(Prunus serrulata)
的叶尖)。实现方法是将两点同时向叶柄方向移动, 直
到相遇。如果是叶柄, 则移动期间两点间的直线距离
变化不大, 即方差较小; 如果是叶尖则方差会明显变
大。
基于以上分析, 我们提出了叶柄提取(图4)算法,
即: (1) 初始化: 候选点集candidate置为空; (2) 循环;
(3) 选取到凸包线距离最远的点加入candidate; (4) 如
果candidate中只有1个点, 继续; (5) 依次判断candi-
date中原有点与新加入点作为一对是否符合叶柄点的
要求, 判断准则为: (边界距离/直线距离>a) || (直线距
c && 方差要求则输出点对, 否则继续循环; (7) 循环终止。
其中, 判断准则中的各常数依据样本集的统计信
息得到, 优先判断边界距离/直线距离>a的原因是,
高翔等: 基于复合叶片特征的计算机植物识别方法 455

图3 叶柄对叶缘信息的影响
(A), (B) 有叶柄的图像及该图像对应的轮廓曲线; (C), (D) 无叶柄的图像及该图像对应的轮廓曲线

Figure 3 Petiole’s influence on edge features
(A), (B) Leaf image and its contour curve with petiole; (C), (D) Leaf image and its contour curve without petiole



图4 叶柄提取的示例

Figure 4 Example of petiole extraction

如果叶柄足够长则这个比值会很大, 很明显是叶柄,
因此常数设置时应有a>c。

2.3.2 叶缘信息提取
在2.3.1节介绍了去除叶柄的算法。对于步骤6(特征提
取), 可以通过距离图中的频率和幅度信息对不同叶
子进行区分。我们对距离图使用快速傅立叶变换, 将
其转换到频域, 提取出81维频率特征。对于大叶裂的
叶子, 由于低频分量较多, 因此频率特征的中低段较
为突出; 对于锯齿叶子, 高频分量较多, 因此频率特
征的中高段较为突出; 对于平滑叶子, 频率特征较为
平滑。此外, 我们还计算了3个量, 即平均距离/凸包
面积、叶片面积/凸包面积和尖峰个数作为幅度特征。
平均距离/凸包面积和叶片面积/凸包面积两个量共同
反映了叶裂深度; 尖峰个数可用于区分裂深相近而裂
数不同的叶子。
综合2.3节, 本文提取了81维频率和3维幅度特
征作为叶缘特征。
2.4 宽度信息
宽度信息是较周长和面积等形状特征更为详尽的特
征。因为不同种类叶子的宽度很不相同。例如, 柳树
(Salix babylonica)的叶子很窄, 玉兰(Magnolia de-
nudata)的叶子很宽 , 丁香 (Syringa oblata)和紫荆
(Cercis chinensis)的叶子则呈心形。传统的几何特征
(如周长和长宽比等)均体现的是叶子的总体形状, 不
456 植物学报 49(4) 2014
能反映上述细节。因此, 如能提取出叶子的外轮廓特
征, 将对分类大有裨益。宽度信息提取包括2个步骤:
(1) 寻找主轴; (2) 测量宽度信息。

2.4.1 寻找主轴
提取宽度信息的第1步是主轴的提取, 具体流程如图
5所示。
图5显示了主轴算法的运行过程, 其中有几点需
要加以说明。首先, 叶柄的方位能够决定主轴, 且是
最稳定、可靠的方法。几乎所有叶子的主轴都在质心
与叶柄的连线上, 因此应首先考虑寻找叶柄。叶柄的
寻找方法已在2.3.1节中详细阐明。
其次, 不能保证所有叶子的图像中都有明显的叶
柄, 主轴实际上是叶片的对称轴之一, 寻找主轴也就
是寻找对称轴。图像对称轴的寻找与对称性的评估,
是图像处理领域中一个非常困难的问题, 近年来仍有
不少学者在努力探索这一问题。选择全图对称轴时往



图5 提取宽度信息的流程
PCA: 主成分分析

Figure 5 Schedule of extracting width information
PCA: Principal component analysis
往需要先设计1个对称性指标, 之后利用复杂的优化
方法对该指标进行优化。然而, 叶子图像往往有2个
对称轴, 很难通过指标分辨哪一个对称轴是我们需要
的主轴(图6A)。
图6A显示的是一片樱花的叶子, 其横向对称轴
是主轴, 但在实际计算对称性时, 会发现将该图沿垂
直方向对折后, 也具有很高的对称性。因此, 难以区
分哪一个轴是真正的主轴。
为了解决上述问题, 我们把叶子分成近圆形和椭
圆形2种。在没有叶柄信息时, 首先使用主成分分析
(principal component analysis, PCA)法寻找叶子的
主成分方向。即
X={xi}, xi=[xi1 T, xi2T] T (8)
为二值图中白色像素点的位置(去均值后), 对XXT进
行特征分解,
X X T= PΛP–1 (9)
即可得到该图的主成分方向。其主特征值与副特征值
的比值表明了该图的椭圆程度:





图6 寻找叶片对称轴(A)与对称性指标(B)的示例
PCA: 主成分分析

Figure 6 Example of finding symmetric axis (A) and sym-
metric indicator (B)
PCA: Principal component analysis
高翔等: 基于复合叶片特征的计算机植物识别方法 457
e=|λ1/λ2| (10)
现设定一个阈值ε(实验中为ε=2), 当e>ε时, 把
PCA得到的主成分分量作为叶子的主轴。
当椭圆特征不明显时, 通过不停地旋转图像来计
算最大对称性指标的位置(图6B)。
在叶子中心处作一水平线, 将上面部分镜像翻转
至下面, 与下面部分比较, 计算不重叠部分的面积
(S), 作为对称性指标。S值越小表明图像的水平对称
性越好。
在本实验中, 我们对图像进行了1–359°旋转, 并
计算了每次旋转后的对称性指标, 然后取最小值。此
种方法属于遍历法, 虽比寻优算法慢, 但符合本实验
要求。

2.4.2 测量宽度
找到主轴后, 宽度测量就变得很简单。只要遍历每一
列, 查看该列像素中白色区域的最大值与最小值, 二
者相减, 即可得到叶子在此处的宽度信息。图7A中,
两条实线是最大值与最小值, 虚线是叶子的半宽度线。
最大值减最小值得到的曲线如图7B所示。
将图7B中的曲线进行归一化处理(除以叶子的长
度), 就可得到叶子的相对宽度信息。该信息具有缩放
不变性, 且对同一种植物具有明显的相似性。对该曲
线进行重采样, 即可得到任意维数的宽度信息。维数
越高, 则曲线越精确, 所需的存储空间也越大。选择
的维数太低则会导致采样精度不够(丢失了有用信
息)。在实际测试中, 我们取d=200维的宽度信息。
2.5 纹理信息
纹理信息反映了对象的重要特征, 是模式识别的关键
信息, 各种树叶的纹理如图8所示。纹理特征的提取
大致分为4个步骤: (1) 对叶片图像进行预处理; (2)
利用边缘检测获取图像的中心区域; (3) 利用小波对
中心区域进行分解; (4) 采用广义高斯模型在高频子
带对高频系数建模, 将模型的参数作为特征向量。
利用小波变换将图像分解为不同的子带。这些子
带能反映不同方向的奇异信息, 并且高频子带可满足
广义高斯分布。因此可以利用广义高斯分布模型参数
均值和方差来表示纹理。将图像分为4个不同的子带
图像, 即低频分量、水平方向高频、垂直方向高频和



图7 测量叶片图像的宽度信息(A)及其宽度曲线(B)

Figure 7 Measuring image’s width (A) and its width curve
(B)


对角线方向高频, 然后分别用这4个分布的方差与均
值作为特征, 这样纹理特征一共为8维。
3 识别结果
3.1 实验数据库
由于本研究对于叶片图像有一定的要求, 因此不能适
用于任意的数据库。大体来说, 有3点要求。(1) 采集
的叶片需放到白纸上, 用相机进行拍摄。尽量把叶子
铺平, 保证对焦准确, 并且叶子要在图像的中央。可
任意选取朝向。适当选择一些样本, 使其背面朝上。
(2) 叶片需完整。不能使用有缺陷或破损的叶片进行
分类。(3) 取成熟叶片。由于刚生长的叶片与成熟叶
片有明显的差别, 导致同一类植物内部的样本不够集
中, 因此重点使用成熟叶片作为分类依据。
本研究使用的所有叶子样本均采自清华大学校
园内。在分类中, 我们对叶片作2个假设。表1是数据

458 植物学报 49(4) 2014
表1 数据库中各类植物的物种与数量
Table 1 Species and quantity of each class in database


库的植物种类与数量的列表。图8显示了各类叶片。
3.2 分类方法
本研究提出了支持向量机配合叶缘特征优先判断的
分类方法。使用叶缘特征优先判断的原因上文已提
到。由于本研究提取的特征包含宽度特征, 而深裂的
叶子难以定义宽度, 因此对于深裂的叶子, 本研究提
出利用叶缘信息进行优先判断, 将所有深裂叶子归在
一起进行训练和分类, 其余叶子归在一起进行训练和
分类。
本研究所使用的数据集, 其具体操作流程如下。
训练时, 作为深裂的第12和第18类叶片(分别对应鸡
爪槭(Acer palmatum)和元宝枫(Ptrocarya stenop-
tera)), 不使用宽度特征, 用RBF核支持向量机进行
训练, 得到model 2。其中, 支持向量机的惩罚参数
C=1, 核函数参数g=0.1; 其它叶子使用全部信息, 用
RBF核支持向量机进行训练, 得到model 1。其中, 支
持向量机的惩罚参数C=10, 核函数参数g=0.1。测试
时, 对于每片待测试叶子, 首先进行叶缘特征判断,
若判断结果为深裂, 则使用model 2进行分类; 若判
断结果为不裂或浅裂, 则使用model 1进行分类。
3.3 分类结果
随机抽取全部样本中的80%作为训练样本, 20%作为
测试样本, 训练和测试50次, 取平均, 总体分类正确
率达93%。其中, 每一类叶子的平均训练样本数、平
均测试样本数、平均正确分类的测试样本数和平均分
类正确率如表2所示。
从分类结果可以看出, 本研究提出的复合特征分
类方法具有很高的正确率。此外, 本研究使用的数据
库规模较大, 类别较多, 因此90%以上的分类正确率
具有普遍意义。具体到每一类叶子, 分类正确率最高
(高于97%)的4类是第1、2、6和15类, 对应的植物分
别为碧桃(Prunus persica)、垂柳(Salix babylonica)、
三球悬铃木(Platanus orientalis)和樱花。分类正确率



图8 每类叶片的照片

Figure 8 Photograph of each leaf class
ID Species Quantity
1 Prunus persica var. duplex 98
2 Salix babylonica 90
3 Buxus megistophylla 95
4 Syzygium aromaticum 100
5 Liriodendron chinesis 98
6 Platanus occidentalis 92
7 Juglans regia 63
8 Forsythia suspensa 92
9 Sophora japonica 150
10 Paeonia suffruticosa 82
11 Parthenocissus tricuspidata 63
12 Acer palmatum 92
13 Buxus harlandii 54
14 Ginkgo biloba 67
15 Prunus serrulata 101
16 Amygdalus triloba 105
17 Magnolia denudata 73
18 Acer truncatum 68
19 Rosa chinensis 88
20 Cercis chinensis 97
21 Prunus ceraifera cv. ‘Pissardii’ 92
高翔等: 基于复合叶片特征的计算机植物识别方法 459
表2 每类植物的分类正确率
Table 2 Classification accuracy of each plant species in the
database
Class ID Average
training
samples
Average
test
samples
Average
correct test
samples
Average
accuracy
1 157.60 38.40 37.46 0.976
2 144.42 35.58 35.38 0.995
3 151.48 38.52 30.00 0.781
4 160.88 39.12 36.38 0.931
5 157.34 38.66 35.92 0.930
6 147.70 36.30 35.24 0.971
7 99.54 26.46 22.16 0.838
8 145.70 38.30 35.90 0.938
9 242.12 57.88 55.14 0.952
10 131.96 32.04 29.00 0.907
11 102.30 23.70 22.58 0.955
12 73.84 18.16 17.06 0.938
13 85.88 22.12 18.56 0.841
14 106.60 27.40 26.38 0.963
15 163.02 38.98 37.86 0.971
16 167.62 42.38 40.08 0.946
17 115.72 30.28 27.86 0.922
18 54.16 13.84 12.18 0.883
19 139.96 36.04 33.00 0.916
20 153.82 40.18 38.02 0.946
21 146.34 37.66 34.36 0.913


最低(低于90%)的4类是第3、7、13和18类, 对应的
植物分别为大叶黄杨(Buxus megistophylla)、胡桃
(Juglans regia)、小叶黄杨(Buxus microphylla)和元
宝枫。其中大叶黄杨与小叶黄杨的叶子非常相近, 人
眼分辨主要依靠尺寸信息。一般来说, 较大的是大叶
黄杨, 较小的是小叶黄杨。而在照片中, 尺寸信息很
难利用, 因为尺寸受拍摄距离的影响很大。在本研究
的数据库中, 拍摄的叶子并没有诸如硬币一类的参照
物, 因此难以利用尺寸信息, 分类正确率较低。
3.4 特征选择
本研究共提取了宽度特征200维、叶缘特征84维(其中
有3维进行优先判断, 不进入学习机器)、纹理特征8
维和颜色特征3维, 共计292维。由于综合采用多种特
征, 故本研究称为复合特征分类。本研究所得分类结
果是基于全部特征获得的。为了考察全部特征中哪些
特征的贡献更为明显, 研究时进行了特征选择, 使用
的方法为特征评价的经典算法——RELIEF算法。
RELIEF算法的基本思想是对特征进行评分, 评分的
依据是特征对类别的区分度。如果在不同类样本间,
某一特征值相差较多则说明该特征的区分度很好, 评
分较高。相反, 如果在同类样本间某一特征值相差较
多, 则说明该特征区分度较差, 评分较低。图9A显示了
采用1 000次迭代的RELIEF算法得到的各特征评分。
从图9A可以看出, 得分最高的3个特征为3维颜
色特征, 其次是叶缘特征的最高频和低频部分及1维
纹理特征, 再其次是位于两端的宽度特征。然而, 出
乎意外, 特征选择的结果是3维颜色特征, 人们惯有
的观念是叶片大部分为绿色且差别不大, 然而从结果
看颜色特征对于学习机器的作用却非常明显。叶缘频
率特征与形状特征的两端得分较高, 这是因为叶缘频



图9 RELIEF特征选择结果(A)及特征数量对分类正确率的影
响(B)

Figure 9 Result of RELIEF on all features (A) and effect of
feature quantity on classification accuracy (B)
460 植物学报 49(4) 2014
率特征代表了叶裂和锯齿的情况, 是区分叶子的重要
特征; 而宽度特征的两端代表了叶子靠近尖部和柄部
的形状, 也是区分叶子的重要特征, 均与人们的直觉
相符。因此, 叶缘频率特征与宽度特征的高评分印证
了本研究方法的合理性与有效性; 颜色特征的高评则
表明了人们认为并不重要的颜色信息对于学习机器
非常重要。
为了进一步验证评分较高特征的作用, 本研究
选取了评分最高的前k个特征, 仅利用这些特征进行
分类, 舍弃其余特征, 考察分类正确率。图9B显示了
分类正确率随着特征个数的变化情况。
从图9B可以看出, 在特征个数较少时, 分类正
确率随着特征个数的增加急剧增长; 而随着特征个数
的逐渐增加, 分类正确率趋于稳定。特征个数达到
100时, 平均分类正确率达到92.8%, 与使用全部特
征的正确率非常接近。因此, 本研究认为通过RELIEF
特征选择, 将特征维数降至100, 在减小计算代价的
同时, 不会对分类正确率产生本质影响, 100维是较
好的特征维数。
综合特征提取的分析, 本研究提出使用RELIEF
算法, 将292维复合特征降至100维, 降维后的特征
主要包括颜色特征、叶缘频率低频和最高频特征、位
于两端的宽度特征和少量的纹理特征。
4 结论
本研究探讨了如何提取叶片图像的复合特征, 并用机
器学习的方法对叶片进行分类。我们共对21类样本进
行了分类, 准确率为93%, 达到国际先进水准。此外,
利用复合特征不容易出现过拟合。当数据库进一步扩
大时, 本研究方法也会得到较好的分类准确率。目前,
本实验室正在进一步扩大叶片的数据库。
另外, 本研究对叶片图像的预处理方法, 以及对
宽度、叶缘和叶柄的提取方法较前人有所改进。与以
往仅靠单类特征进行分类的工作相比, 本研究对叶片
特征的探讨更为深入和全面, 且效果良好。我们还对
特征进行了评价, 认为使用100维特征即可达到较好
的分类效果。
参考文献
傅弘, 池哲儒, 常杰, 傅承新 (2004). 基于人工神经网络的叶
脉信息提取——植物活体机器识别研究I. 植物学通报 21,
429–436.
顾振华 (2008). 园林植物识别的策略与方法. 现代农业科学
15(8), 28–29.
侯铜, 姚立红, 阚江明 (2009). 基于叶片外形特征的植物识
别研究. 湖南农业科学 (4), 123–125, 129.
黄志开 (2006). 彩色图像特征提取与植物分类研究. 博士论
文. 北京: 中国科学技术大学.
邵新庆, 冯全, 邵世禄, 王敬轩, 王宇通 (2010). 基于叶片图
像的植物鉴别技术研究进展. 甘肃农业大学学报 45, 156–
160.
魏蕾 (2012). 基于图像处理和SVM的植物叶片分类研究. 硕
士论文. 咸阳: 西北农林科技大学.
杨辉军, 陈立伟 (2010). 基于分形特征的植物识别. 计算机工
程与设计 31, 5321–5323, 5327.
郑小东, 张晓煜, 薄树奎 (2012). 植物叶裂特征自动提取研
究. 中国农学通报 28(27), 152–156.
朱静, 田兴军, 陈彬, 吕劲紫 (2005). 植物叶形的计算机识别
系统. 植物学通报 22, 599–604.
Backes AR, Casanova D, Bruno OM (2009). Plant leaf
identification based on volumetric fractal dimension. Int J
Pattern Recogn 23, 1145–1160.
Chaki J, Parekh R (2011). Plant leaf recognition using
shape based features and neural network classifiers. Int J
Adv Comput Sci Appl 2, 41–47.
Du J, Wang X, Zhang G (2007). Leaf shape based plant
species recognition. Appl Math Comput 185, 883–893.
Fu H, Chi Z (2003). A two-stage approach for leaf vein ex-
traction. In: Proceedings of the 2003 International Con-
ference on Neural Networks and Signal Processing, Vol 1.
Nanjing: IEEE. pp. 208–211.
Lee CL, Chen SY (2006). Classification of leaf images. Int J
Imag Syst Tech 16, 15–23.
Li Y, Zhu QS, Cao YK, Wang CL (2005). A leaf vein extrac-
tion method based on snakes technique. In: IEEE Inter-
national Conference on Neural Networks and Brain, Vol 2.
Beijing: IEEE. pp. 885–888.
Mokhtarian F, Abbasi S (2004). Matching shapes with
self-intersections: application to leaf classification. IEEE
Trans Image Process 13, 653–661.
Otsu N (1979). A threshold selection method from gray-level
histograms. IEEE Trans Syst Man Cyber 9, 62–66.
Valliammal N, Geethalakshmi SN (2012). Plant leaf seg-
mentation using non linear k-means clustering. Int J Comp
Sci 9, 212–218.
高翔等: 基于复合叶片特征的计算机植物识别方法 461
Wang XF, Huang DS, Du JX, Xu H, Heutte L (2008). Classi-
fication of plant leaf images with complicated background.
Appl Math Comp 205, 916–926.
Wu SG, Bao FS, Xu EY, Wang YX, Chang YF, Xiang QL
(2007). A leaf recognition algorithm for plant classification
using probabilistic neural network. In: IEEE International
Symposium on Signal Processing and Information Tech-
nology. Giza: IEEE. pp. 11–16.

Plant Recognition Based on Compound Leaf Features
Xiang Gao*, Zheng Wang, Jianya Ding, Qian Yang
Department of Automation, Tsinghua University, Beijing 100084, China
Abstract This study investigated how to classify plant species with compound leaf features using machine-learning
approaches. Many traditional classification systems used a single feature, such as geometry or texture. Although such
systems can achieve good results in small databases, with increasing records, the similarity in single features between
different species will be remarkable, thus reducing the accuracy in large databases. This study examined how to extract
compound features and proposes a novel preprocessing method and new ways to extract width and edge information,
which are more detailed than with most of the state-of-the-art approaches. The compound features can reduce the influ-
ence of the over-fitting problem, so the algorithm can be used for larger databases. We examined up to 21 kinds of plants
(extracting width, color, edge and texture data) and 1 915 digital images and achieved an accuracy of 93%. Finally, we
analyzed the effect of each feature on classification results. We could reduce the feature’s dimension to about 100 without
losing much classification accuracy.
Key words machine learning, pattern recognition, plant classification, image process, leaf features
Gao X, Wang Z, Ding JY, Yang Q (2014). Plant recognition based on compound leaf features. Chin Bull Bot 49, 450–
461.
———————————————
* Author for correspondence. E-mail: gaoxiang12@mails.tsinghua.edu.cn
(责任编辑: 孙冬花)