免费文献传递   相关文献

Plant Recognition Based on Leaf Image and Supervised Orthogonal Maximum Variance Unfolding

基于叶片图像和监督正交最大差异伸展的植物识别方法


Due to the large difference between the same-class leaf images, many classical recognition methods do not satisfy the actual requirements of the plant leaf image recognition system. Based on maximum variance unfolding(MVU)and maximum variance projection(MVP), a supervised orthogonal MVU algorithm was presented and was applied to plant leaf image recognition. By the algorithm, the high-dimensionality data were mapped to an optimal low-dimensionality subspace where the different-class samples were located further away, while the same-class samples were located closer. The local geometry structure of the low dimension manifold of the original high dimensionality data was preserved. The experimental results on real plant leaf databases showed that the proposed method was effective and feasible for plant leaf recognition.


全 文 :第 49 卷 第 6 期
2 0 1 3 年 6 月
林 业 科 学
SCIENTIA SILVAE SINICAE
Vol. 49,No. 6
Jun.,2 0 1 3
doi:10.11707 / j.1001-7488.20130627
收稿日期: 2012 - 07 - 30; 修回日期: 2012 - 11 - 18。
基金项目: 国家自然科学基金项目(61272333)。
* 张传雷为通讯作者。
基于叶片图像和监督正交最大差异伸展的植物识别方法*
张善文1,2 张传雷2 王旭启1 周争光1 张雅丽3
(1. 西京学院工程技术系 西安 710123; 2. Ryerson 大学电子与计算机工程系 M5B 2K3,加拿大; 3. 西北农林科技大学 杨凌 712100)
关键词: 流形学习; 植物叶片识别; 最大差异伸展; 监督正交最大差异伸展
中图分类号: TP391 文献标识码: A 文章编号: 1001 - 7488(2013)06 - 0184 - 05
Plant Recognition Based on Leaf Image and Supervised
Orthogonal Maximum Variance Unfolding
Zhang Shanwen1,2 Zhang Chuanlei2 Wang Xuqi1 Zhou Zhengguang1 Zhang Yali3
(1. Department of Engineering and Technology,Xijing University Xian 710123; 2. Department of Electrical and Computer Engineering,
Ryerson University M5B 2K3,Canada; 3. Northwest A & F University Yangling 712100)
Abstract: Due to the large difference between the same-class leaf images,many classical recognition methods do not
satisfy the actual requirements of the plant leaf image recognition system. Based on maximum variance unfolding(MVU)
and maximum variance projection(MVP),a supervised orthogonal MVU algorithm was presented and was applied to plant
leaf image recognition. By the algorithm,the high-dimensionality data were mapped to an optimal low-dimensionality
subspace where the different-class samples were located further away,while the same-class samples were located closer.
The local geometry structure of the low dimension manifold of the original high dimensionality data was preserved. The
experimental results on real plant leaf databases showed that the proposed method was effective and feasible for plant leaf
recognition.
Key words: manifold learning; plant leaf recognition; maximum variance unfolding(MVU); supervised
orthogonal MVU
无论对于农业信息化还是对于生态保护,研究
植物识别都是非常必要的。基于植物叶片的植物识
别方法一直是植物学中的一个重要研究方向。植物
叶片的颜色、形状、纹理等特征都可以用来作为识别
依据(杜吉祥,2005; 纪寿文等,2002; 王晓峰等,
2006; 张宁等,2011; 徐贵力等,2002; Wang et al.,
2008)。叶片的形状特征主要表现在它的大小和外
形上,不同植物的叶片各有特点,叶片在形态上的多
变性是植物识别的重要依据。叶片的纹理特征指其
叶脉中所蕴涵的特征信息,对于同一种植物,其叶片
的脉络结构是比较稳定的; 而对于不同种植物,叶
片的脉络结构差异较大。目前已有许多基于叶片图
像的植物识别方法和技术。Wang 等(2000; 2003)
首次引入叶片图像检索技术,提出了一种基于归一
化的中心轮廓距离曲线的两步检索方法,随后增加
了角度编码直方图作为排序条件,并通过不同特征
的模糊集成实现了植物图像的检索,利用 140 种植
物 1 400 片叶片图像验证了该方法的可行性。
Mokhtarian 等(2004)研究了叶片有部分遮掩时的检
索方法,对 12 种不同菊花 120 片叶片的测试结果表
明,当返回结果是最接近的 3 类和 5 张菊花图像时,
正确率达到了 97. 6%。Du 等(2010)使用改进动态
规划算法实现了植物叶片形状匹配。这些方法和技
术基本上都是利用图像处理技术对叶片图像进行维
数约简和特征提取。
目前植物叶片识别研究中植物叶片一般来源于
人工野外采集、农业自动监测系统采集或活体植物
标本采集等。通常情况下,室外采集到的植物叶片
图像不可避免地具有较复杂的背景,比如植物叶片
交叠、花叶交叠等,且植物叶片自身在形态结构上较
为复杂,边缘的拓扑结构变化较大,室内外环境下的
光照条件也不尽相同,这些因素都限制了传统的分
第 6 期 张善文等: 基于叶片图像和监督正交最大差异伸展的植物识别方法
割与识别方法对复杂背景下植物叶片图像的处理效
果。因此,传统的线性维数约简和特征提取方法不
能有效地研究存在于非线性叶片图像数据中的内在
规律。流形学习是近年来发展起来的一类较新的非
线性维数约简方法,在机器学习和模式识别领域得
到了广泛应用 ( Roweis et al.,2000; Tenenbaum et
al.,2000; He et al.,2005; 张善文等,2010; 李波,
2008; Weinberger et al.,2006)。流形学习比传统的
线性维数约简和特征提取方法更能得到数据的本质
结构,更有利于对实际观察数据的理解和进一步处
理,能更好地解决一些非线性结构数据的识别问题。
最大差异伸展(maximum variance unfolding,MVU)
是一种有效的高维数据可视化流形学习算法 (李
波,2008; Zhang et al.,2007)。MVU 将分布在高维
空间的样本点通过一种非线性变换映射到低维子空
间,并严格保持数据流形中近邻样本点之间的距离
不变。在 MVU 算法中,最邻接点之间保持固定的
距离和角度,并且在映射前后样本点之间的欧氏距
离保持不变; 但该方法没有利用数据的类别信息。
研究表明,数据的类别信息有助于提高算法的识别
效果。Zhang 等(2007)提出了一种监督的最大差异
映射(maximum variance projection,MVP)方法,该方
法利用数据点的类别信息来构造不同类样本点之间
的差异,并引进原始 LLE(Roweis et al.,2000)。算
法中的线性近似目标函数作为约束条件来保存数据
点之间的局部结构信息,以最大化差异为目标函数,
求得一个最优线性投影子空间。由于该方法引进了
LLE 算法对目标函数进行线性近似,而 LLE 对噪声
又非常敏感,所以 MVP 算法的鲁棒性比较差。本文
在 MVU 和 MVP 的基础上,提出一种监督正交最大
差异投影 ( supervised orthogonal maximum variance
mapping,SOMVM)流形学习算法。该算法不仅能
够将高维空间的复杂数据投影到一个低维空间,而
且能够在保留数据点之间局部结构不变的前提下将
不同子流形上的数据点投影得更远。因此,该算法
适合于数据分类识别。本文将该方法应用于基于叶
片图像的植物识别。
1 监督正交最大差异投影算法
监督正交最大差异投影( SOMVM)算法的准则
是: 在保证子流形局域不变的前提下,将不同类数
据投影得更分散,即在不破坏投影后子流形的拓扑
结构的前提下,能够从中提取最适合数据识别的识
别特征。为此,构造 2 个目标函数: 局部散度和类
间散度。
设 n 个有标签样本向量(若观察样本不是向量
表示,要转换成向量)X = [X1,X2,…,Xn],Ci 为 Xi
的类别标签值,Xi 的投影为 Yi,Yi = A
TXi,A 为映射
矩阵。在实际应用中,欧氏距离或高斯函数能够反映
数据的局部关系,即输入数据点之间的局部结构可
用处于最近邻关系的数据点对之间的欧氏距离或高
斯函数来表示。由此定义局部散度为:
JL = Σ
n
i,j
W ij Yi - Yj
2。 (1)
式中: Wij为权值,定义为:
Wij =
exp -
Xi - Xj
2
β( )2 ,若 Xi ∈ N(Xj)
或 Xj ∈ N(Xi);
0, 其他






(2)
式中: N(Xi) 为 Xi 的 k - 最近邻集; β为调节参数,
可由交叉验证法取得。
当 2 个样本点之间的欧氏距离较大时,就认为
这 2 个样本可能是不同类别的; 相反,当 2 个样本
点之间的欧氏距离较小时,就认为这 2 个样本可能
属于同一类别。因此,可利用投影后不同类样本点
之间距离平方和作为衡量投影后数据类别间差异的
指标。为此定义类间散度为:
JD = Σ
n
i,j
H ij Yi - Yj
2。 (3)
式中: Hij为权值,定义为:
Hij =
1, 若 Ci ≠ Cj;
0, 其他{ 。 (4)
式(1)和(3)可以分别化简为:
1
2
JL(A) =
1
2 Σ
n
i = 1
Σ
n
j = 1
Hij (Yi - Yj)
2 =
1
2 Σ
n
i = 1
Σ
n
j = 1
Hij (A
TXi - A
TXj)
2 =
tr[ATX(L - H)XTA]; (5)
1
2
JD(A) =
1
2 Σ
n
i = 1
Σ
n
j = 1
Wij (Yi - Yj)
2 =
1
2 Σ
n
i = 1
Σ
n
j = 1
Wij (A
TXi - A
TXj)
2 =
tr[ATX(D - W)XTA]。 (6)
式中: H = {Hij},W = {Wij},L和 D为 2个对角化矩
阵,且 Lii = Σ jH ij,Dii = Σ jW ij。
最大化式(3),即 max{ JD(A)} 可以使得投影
后的不同类数据点之间更分散。为了保证投影前后
数据的局域不变,即使得 tr[X(L - H)XT] =
tr[ATX(L - H)XTA]。
为了同时实现上述 2 个目标,构造如下目标
581
林 业 科 学 49 卷
函数:
max( JD) = tr[A
TX(D - H)XTA];
s. t. tr[ATX(L - W)XTA] = tr[X(L - W)XT{ ]。
(7)
通过拉普拉斯数乘法来求解式(7),得
max{ JD - λtr[A
TX(L - W)XTA -
X(L - W)XT]}。 (8)
对式(8)求导,并令其等于零,得
X(D - H)XTA = λX(L - W)XTA。 (9)
假设数据的约简维数为 d,则映射矩阵 A 由式
(9) 的 d 个最大特征值对应的特征向量组成,即由
广义特征对{X(D - H)XT,X(L - W)XT}的 d个最大
广义特征向量所组成 a1,a2,…,ad。
正交化 A 可以减少投影后数据的自由度,降低
噪声。利用 Gram-Schmidt正交化过程对 a1,a2,…,ad
进行正交化。令 p1 = a1,假设前 k - 1 个正交基向量
p1,p2,…,pk -1 已得到,则由下式得第 k 个 pk:
pk = ak - Σ
k -1
i = 1
pTi ak
pTi p i
p i。 (10)
从而可以得到正交线性投影矩阵 P = [p1,
p2,…,pd]。
这样,任一数据点 X new对应的低维投影可以通
过线性变换得到
Ynew = P
TX new。 (11)
式中: P∈ Rn×d,X new ∈ R
D,Ynew ∈ R
d,d D,D为原
始数据的维数,d 为约简维数。
根据上面的分析,下面给出基于监督正交 MVU
算法的叶片图像识别的步骤:
1) 按照最近邻准则,构建最近邻图。连接任意
点 Xi 与其所有的 k - 最近邻点,得到一个包含所有
样本点的最近邻图 G。
2) 建立优化问题。由式(5)和式(6)计算局部
散度和类间散度矩阵,构造式(7)的目标函数。
3) 求解式(7)的目标函数,得 d 个最大广义特
征向量所组成 a1,a2,…,ad。
4) 利用 Gram-Schmidt 方法对 a1,a2,…,ad 进
行正交化,得正交线性映射矩阵。
5) 通过线性变换式 ( 11 ) 求得数据的低维
映射。
6) 利用合适的分类器进行叶片图像识别。
2 植物叶片图像预处理
在进行植物叶片图像识别之前,需要对叶片图
像进行一系列预处理(杜吉祥,2005; 纪寿文等,
2002; 王晓峰等,2006; Wang et al.,2008)。一般而
言,叶片图像的预处理包括去除叶柄,图像矫正以及
灰度化。由于叶柄对叶片识别率的贡献不大且很难
放在同一位置,所以去除。叶片图像经过膨胀和腐
蚀的开运算和闭运算后,得到无叶柄且比较完整的
叶片图像。
一般植物叶片图像具有很好的对称性,利用其
对称性特点,计算叶片图像模板的惯性主轴,获取叶
柄根部和叶片的交点,并以交点为中心对图像进行
旋转变化,就可摆正叶片图像的位置,实现叶片图像
的准确定位。假设叶片图像上共有 m 个像素点,则
惯性矩定义为:
m = Σ
m
i = 1
Σ
m
j = 1
( xi sin - yjcos)
2。 (12)
使惯性矩最小,就可得旋转轴角度(图 1):
0 = -
π
2
- 1
2
arctg

m
i = 1
Σ
m
j = 1
xi y j
Σ
m
i = 1
x2i - Σ
m
i = 1
y2i
。 (13)
图 1 叶片的惯性主轴
Fig. 1 Principal axis of inertia of leaf image
得到叶片图像的惯性主轴与 x 轴正向的夹角
后,对叶片图像进行旋转就可获得摆正后的叶片图
像。图 2 为 夹 竹 桃 科 络 石 ( Trachelospermum
jasminoides)植物的 10 幅叶片图像的分割、矫正及灰
度化后的结果。
图 2 10 幅络石叶片图像的预处理结果
Fig. 2 Ten preprocessed leaves of deytree plant
3 试验结果
利用 2 个植物叶片图像数据库进行试验,来验
证基于叶片图像和监督正交 MVU( SOMVU)算法的
植物识别方法的有效性。试验所用计算机的配置
为: Intel Core 2 Duo 2. 2 GHz 中央处理器,2G 内存,
Windows XP 操作系统; 程序运行环境 Matlab 7. 0;
所采用的 k -最近邻分类器为 Matlab 7. 0 中的函数
knnclassify。
1) 利用瑞典植物叶片数据库 ( Swedish Leaf
Database)(Sderkvist,2001) 的 15 类叶片图像 (每
类 75 幅)进行识别试验。将预处理后的每幅图像
681
第 6 期 张善文等: 基于叶片图像和监督正交最大差异伸展的植物识别方法
归一化为 64 × 64 像素大小的灰度图,背景白色,然
后将每幅二维图像转换成 4 096 维向量表示。
在试验中,从预处理后每类植物叶片中任意选
择 30 张叶片图像组成训练集,剩余的组成测试集。
同时与较新的植物叶片识别方法邻域粗糙集
(neighborhood rough set,NRS) ( Liu,2012)和支持
向量机( support vector machine,SVM)(Arun Priya et
al.,2012)以及流形学习算法 LPP(He et al.,2005)、
MVP( Zhang et al.,2007 )、MVU (Weinberger et al.,
2006)进行比较。在应用 LPP,MVP,MVU 和本文
提出的算法 SOMVU 时,第一步都需要建立最近邻
图,采用最近邻标准来确定最近邻点,并建立 k -最
近邻关系,这里假设最近邻数 k 被设置为( l - 1),其
中 l 是训练样本的类别数。参数 β 由试验结果的最
大值决定。当样本数较少时,算法 LPP,MVP,MVU
和改进 MVU 在进行广义特征值分解时可能出现小
样本问题。为了避免这个问题,采用主分量分析
(PCA)对数据进行预降维,保留 98%的能量; 然后
分别采用 LPP,MVP,MVU 和 SOMVU 进行维数约
简和提取相应的低维识别特征,最后采用 1 - 最近
邻分类器进行 50 次识别试验,记录每次试验的正确
识别率的最大值,得到 50 次重复试验的最大平均识
别率(表 1)。
表 1 采用 NRS,SVM,LPP,MVP,MVU
和 SOMVU 的识别结果
Tab. 1 The classification results of plant leaf images
by NRS,SVM,LPP,MVP,MVU and SOMVU %
方法 Method NRS SVM LPP MVP MVU SOMVU
识别率 Recognition rate 85. 63 86. 35 83. 28 91. 48 90. 15 95. 74
2 ) 从作者实验室采集的植物叶片数据库
(http:∥www. intelengine. cn / source. htm)中选择 20
类叶片图像(每类 15 幅)进行识别试验(图 3)。图
像大小为 128 × 128 像素。叶片的预处理过程和识
别过程与上面的试验过程相同。
图 3 20 类植物叶片
Fig. 3 20 kinds of plants
采用 5 折交叉验证法进行识别试验,结果见
表 2。
表 2 采用 NRS,SVM,LPP,MVP,MVU
和 SOMVU 的识别结果
Tab. 3 The classification results of plant leaf images
by NRS,SVM,LPP,MVP,MVU and SOMVU %
方法 Method NRS SVM LPP MVP MVU SOMVU
识别率 Recognition rate 87. 46 89. 20 90. 14 93. 69 91. 37 98. 73
从表 1 和表 2 可看出,本文所提出的 SOMVU
算法的识别率最大,其原因是该算法利用了叶片图
像的先验知识,即类别信息和流形假设,同时保持了
样本集的局部结构。由此说明保持样本的局部结构
和数据的类别信息对识别算法性能的提升有着重要
的作用。
对 64 × 64 和 128 × 128 像素大小的灰度叶片图
像的识别时间分别为 16 s 和 19 s,像素越大,所用识
别时间越长,不过在实际应用中是可以接受的。
4 结论与建议
研究植物识别是非常必要的。但由于叶片图像
的复杂性,使得很多已有的植物识别方法和技术不
能满足当前植物物种自动识别系统的需要。本文基
于 MVU 和 MVP 提出了一种监督正交的 MVU 算法,
并应用于植物叶片识别中。利用该方法能够将异类
样本映射得更分散,同时保持同类样本的原始低维
流形结构不变。在瑞典植物叶片图像数据库和作者
实验室采集到的数据库上分别进行了识别试验,结
果表明该方法是有效可行的。
有 2 个问题值得以后继续研究:
1) 在本文基于流形学习的叶片图像识别试验
中,对 SOMVU 以及 LPP,MVP 和 MVU 算法都采用
PCA 对原始叶片图像进行预降维处理,虽然消除了
降维过程中的小样本问题,但预降维可能失去一些
有用信息。所以,研究有效的直接维数约简算法是
下一步的工作。
2) 由于实际得到的图像大小是多样的,所以还
需要利用像素大小不等的图像进行识别试验。而本
文提出的方法要求图像大小相同,采用最简单的补
零法将每幅图像转化为大小一致的图像,但得到的
识别效果很差。如何对原始图像大小进行更有效预
处理是进一步研究的工作。
参 考 文 献
杜吉祥 . 2005. 植物物种机器识别技术的研究 . 合肥: 中国科学技
术大学博士学位论文 .
纪寿文,王荣本,陈佳娟,等 . 2002. 应用计算机图像处理技术识别
玉米苗期田间杂草的研究 .农业工程学报,18(4) : 150 - 154.
李 波 . 2008. 基于流形学习的特征提取方法及其应用研究 . 合肥:
781
林 业 科 学 49 卷
中国科学技术大学博士学位论文 .
王晓峰,黄德双,杜吉祥,等 . 2006. 叶片图像特征提取与识别技术
的研究 .计算机工程与应用,42(3) : 190 - 193.
徐贵力,毛罕平,李萍萍 . 2002. 缺素叶片彩色图像颜色特征提取的
研究 .农业工程学报,4(3) : 150 - 153.
张 宁,刘文萍 . 2011. 基于图像分析的植物叶片识别技术综述 . 计
算机应用研究,28(11) : 68 - 71.
张善文,巨春芬 . 2010. 正交全局 - 局部判别映射应用于植物叶片
分类 .农业工程学报,26(10) : 162 - 165.
Arun Priya C,Balasaravanan T. 2012. An efficient leaf recognition
algorithm for plant classification using support vector machine.
Proceedings of the International Conference on Pattern Recognition,
Informatics and Medical Engineering,428 - 432.
Du J X,Zhai C M. 2010. Plant species recognition based on radial basis
probabilistic neural networks ensemble classifier. Lecture Notes in
Artificial Intelligence,6216: 677 - 681.
He X,Yan S,Hu Y,et al. 2005. Face recognition using laplacianfaces.
IEEE Transations on Pattern Analysis and Machine Intellegence,27
(3) : 328 - 340.
Liu J M. 2012. A new plant leaf classification method based on
neighborhood rough set. Advances in information Sciences and
Service Sciences(AISS),4(1) : 116 - 124.
Mokhtarian F,Abbasi S. 2004. Matching shapes with self-intersection:
application to leaf classification. IEEE Transactions on Image
Processing,13(5) : 653 - 661.
Roweis S T,Saul L K. 2000. Nonlinear dimensionality reduction by
locally linear embedding. Science,290(5500) : 2323 - 2326.
Sderkvist O. 2001. Computer vision classification of leaves from Swedish
trees. Masters Thesis,Linkoping University.
Tenenbaum J B,De Silva V,Langford J C. 2000. A global geometric
framework for nonlinear dimensionality reduction. Science, 290
(5500) : 2319 - 2323.
Wang X F,Huang D S,Du J X,et al. 2008. Classification of plant leaf
images with complicated background. Applied Mathematics and
Computation,205(2) : 916 - 926.
Wang Z,Chi Z,Feng D,et al. 2000. Leaf image retrieval with shape
features. Lecture Notes in Computer Science,1929: 477 - 487.
Wang Z,Chi Z,Feng D. 2003. Shape based Leaf Image Retrieval. IEEE
Transactions on Image Signal Process,150(1) : 34 - 43.
Weinberger K Q, Saul L K. 2006. An introduction to nonlinear
dimensionality reduction by maximum variance unfolding. American
Association for Artificial Intelligence,1683 - 1686.
Zhang T,Yang J,Wang H,et al. 2007. Maximum variance projections
for face recognition. Optical Engineering,46(6) : 1 - 4.
(责任编辑 石红青)
881