全 文 :收稿日期: 2009-07-08
基金项目:福建省自然科学基金资助项目(2006J0299);福建省教育厅资助项目(2007F5009,JA07077)
作者简介:林大辉(1972-),男,福建尤溪人,讲师,硕士;宁正元(1957-),男,陕西武功人,教授。
树种识别与分类是林学研究和林业生产经营
中的重要基础工作。 传统的树种识别和分类方法
一般是由专家通过观察测量采集的标本以获得树
种局部的外部特征数据, 然后依据树种分类检索
表对欲鉴定的树种依序逐条检索, 得到树种所属
的科、属、种。 随着图像处理和计算机视觉技术的
迅速发展,近年来,模式识别技术已经开始应用到
林业领域。 在国内,一些学者对植物的识别和分类
方面做了一些初步研究, 祁亨年等以植物叶片为
例,提取了叶片大小、叶形、圆形度参数以及叶缘
等特征,并探讨了建立植物识别模型的研究[1-2];王
晓峰等利用轮廓计算方法得到叶片的矩形度、圆
形度、 偏心率等 8 项几何特征值和图像的 7 个不
变矩, 并在文中提出了一种新的移动中心超球分
类器,利用其对得到的形状特征进行了分类 [3];黄
志开博士研究彩色图像的特征提取与分类问题,
并通过对树皮纹理图像特征进行分析,利用 SVM
与 RBPNN 分类器对植物树皮纹理图像进行了分
类研究,达到对植物进行自动分类的目的 [4];朱宁
提出了基于图像纹理分析的计算机辅助植物识别
与分类[5]。利用图像处理分析技术对植物外观进行
特征提取,进而进行植物分类,虽然取得了一定进
第 16 卷 第 5 期 莆 田 学 院 学 报 Vol.16 No.5
2009 年 10 月 Journal of Put ian University Oct. 2009
文章编号:1672-4143(2009)05-0039-04 中图分类号:S792.17 文献标识码:A
基于支持向量机的栗属树种分类研究
林大辉, 陈秋妹, 宁正元
(福建农林大学 计算机与信息学院,福建 福州 350002)
摘 要:形状特征是物体识别的重要依据。同时,分类算法的选择也将对识别的性能造成很大影响。围绕上述
两个问题,以栗属树种的果实图像为例,在准确分割出目标图像的基础上,分别应用不变矩和边界矩提取其形状
特征值,并使用支持向量机算法对栗属树种果实图像进行分类。实验结果表明:基于支持向量机的栗属树种果实
图像分类识别准确率可达到 87.5%,识别的结果较为理想。
关键词:支持向量机;不变矩;边界矩;树种分类
Study on Support VectorMachine Based Chestnut Species Classification
LIN Da-hui, CHEN Qiu-mei, NING Zheng-yuan
(College ofComputer and InformationScience, FujianAgriculture andForestryUniversity, FuzhouFujian 350002,China)
Abstract: Shape is important for object recognition. At the same time, the alternative of classification
algorithms will have a great impact on accuracy of the object identification. As a result, taking chestnut fruit
image as an example, this papers, on the basis of accurate segmentation of the target image, applies invariant
moments and boundary moments to extract features of the shape respectively, then according to the extracted
shape features, it applies support vector machine to classify the images of the chestnut fruit. The experimental
results show that: based on support vector machine, classification accuracy of chestnut fruit image can reach
87.5%, and the performance of classification is good.
Key words:support vector machine;invariant moments;boundary moments;species classification
莆 田 学 院 学 报 2009 年 10 月
展, 但利用计算机视觉理论探讨植物分类仍处于
一个初级研究阶段。
1 形状特征提取算法
图像视觉特征大致可以分为 3 类:形状特征、
颜色特征、纹理特征。 通过观察不同栗属树种果实
图像发现,它们在纹理、颜色方面差别很小,而其
形状则存在较大差异。 且形状是图像的重要视觉
内容之一。 I.Biederman 等研究者认为颜色和纹理
等物体表面特征仅起次要作用, 只有形状描述提
供了表示形状的有效手段[6]。一般图像是三维现实
世界中的物体在二维平面上的投影, 通常是一个
连续的区域。 形状通常被认为是一条封闭的轮廓
曲线所包围的区域, 因此图像中物体的形状有两
种表达方式:轮廓曲线描述和区域描述。 目前基于
形状特征的图像检索围绕着这两个方面的特征建
立索引。 本文以栗属树种果实图像为例,依据形状
特征对栗属树种进行识别和分类。
本次实验以 20 幅板栗和 20 幅锥栗图像为数
据源,应用交互式快速水平集算法分割出目标图像,
并做预处理,即把目标填充为黑色,背景填充为白
色,得到栗属果实图像的数据集。 出于篇幅的考虑,
在此分别给出板栗和锥栗目标图像各 4幅, 如图 1
所示。 然后对分割后的栗属果实图像数据集应用形
状特征算法即不变矩和边界矩提取其形状特征。
(a) 板栗
(b) 锥栗
图 1 应用交互式快速水平集方法分割出的目标区域
1.1 不变矩
矩特征主要表征了图像区域的几何特征,又
称为几何矩,由于其具有旋转、平移、缩放等特性
的不变特征,所以又称其为不变矩[7-9]。在图像处理
中, 几何不变矩可以作为一个重要的特征来表示
物体,可以据此特征来对图像进行分类等操作。
设图像 I x,η ηy 是区域二值图像,其 p+η ηq 阶
矩定义
mpq=
x
Σ
y
ΣxpyqI x,η ηy (1)
μpq=
x
Σ
y
Σ x-xη ηp y-yη ηqI x,η ηy (2)
其中:x= m10m00
, y= m01m00
。
p+η ηq 归一化中心矩记作 ηpq,定义为:
ηpq=μpq μ
r
00 (3)
其中:r= p+q+η η2 /2。
利用各阶中心矩定义的 7个不变矩:
准1=η20+η02 (4)
准2= η20-η02η η2+4η112 (5)
准3= η30-3η12η η2+ 3η21+η03η η2 (6)
准4= η30+η12η η2+ η21+η03η η2 (7)
准5= η30-3η12η ηη30-η12η η
× η30+η12η η2-3 η21+η03η ηΣ Σ2
+ 3η21-η03η ηη21+η03η η
× 3 η30+η12η η2- η21+η03η ηΣ Σ2 (8)
准6= η20-η02η η η30+η12η η2- η21+η03η ηΣ Σ2
+4η11 η30+η12η ηη21+η03η η (9)
准7= 3η12-η30η ηη30+η12η η
× η30+η12η η2-3 η21+η03η ηΣ Σ2
+ 3η21-η03η ηη21+η03η η
× 3 η30+η12η η2- η12+η03η ηΣ Σ2 (10)
1.2 边界矩
边界矩算法是利用目标物体的边界进行识别
的, 它不仅计算速度快而且在离散状态下也具有
平移、旋转和比例因子不变性。
设 区 域 重 心 为 x, yη η, 边 界 点 集 合 为
xηηi ,yηηiη ηi=1,2,… ,NΣ Σ, 重心到边界上各点
的欧氏距离为:
zηηi = xηηi -xη η2 + yηηi -yη ηΣ Σ2 1/2,
i=1,2,… ,N (11)
p 阶矩定义为:
mp= 1N
N
i=1
Σ zηηiΣ Σp (12)
p 阶中心矩定义为:
Mp= 1N
N
i=1
Σ zηηi -m1Σ Σp (13)
40
第 5期 林大辉,等:基于支持向量机的栗属树种分类研究
相应的归一化矩定义为:
mp= mpM2i ip/2
=
1
N
N
i=1
Σ ziiiΣ Σp
1
N
N
i=1
Σ ziii -m1Σ ΣΣ Σ2
p/2 (14)
Mp = MpM2i ip/2
=
1
N
N
i=1
Σ ziii -m1Σ Σp
1
N
N
i=1
Σ ziii -m1Σ ΣΣ Σ2
p/2 (15)
由于受到环境的影响, 栗属图像获取过程中
往往存在噪声,上述高阶矩对噪声很敏感,在本文
中采用如下的低阶矩:
F1= M2
i i1/2
m1
=
1
N
N
i=1
Σ ziii -m1Σ ΣΣ Σ2
1/2
1
N
N
i=1
Σziii
(16)
F2= M4
i i1/4
m1
=
1
N
N
i=1
Σ ziii -m1Σ ΣΣ Σ4
1/4
1
N
N
i=1
Σziii
(17)
2 基于支持向量机的栗属树种分类算法
支持矢量机(Support Vectors Machine,SVM)
方法是在线性可分情况下的最优超平面(Optimal
Hyperplane)中提出的[8]。所谓的最优超平面是指要
求分类线不仅能把两类样本无错误的分开, 而且
要使两类之间距离达到最大。
设训练样本为 xi ,yii i, i =1, 2,… , n, xi∈Rd,
yi∈ +1,-Σ Σ1 是类别标签,一般线性分类器为
giix =w·xi+b (18)
分类的目的是寻找一个 w ,i ib 使类 1 和类 2
达到最佳分离。 并将判别函数归一化,使得这两类
所有样本都能满足 giix 叟1,也就是说,使离分
类面最近的样本的 giix =1。 这样分类间隔就等
于 2/襓w襓。 在此约束下,为了使得分类面对所有
样本都能正确分类,则必须满足
yi w·xii i+Σ Σb 叟1, i=1,2,… ,n (19)
满足条件式(19)且使襓w襓2最小的分类面就
是最优分类面。 最优分类面问题可表示成如下约
束优化问题:
min 12 襓w襓
2
s.t. yi w·xii i+Σ Σb 叟1, i=1,2,… ,n (20)
为此,定义如下的 Lagrange函数:
L w,b,i iα
= 12 襓w襓
2-
n
i=1
Σαi yi w·xii i+Σ Σb -Σ Σ1
s.t. αi>0 (21)
同时令式(21)两端对 w 和 b 的偏导等于 0,
并且根据 Kuhu-Tucker 条件, 这个最优化问题必
须满足:
αi yi w·xi+i ib -i i1 =0, i=1,2,… ,n (22)
解中只有较少一部分的 Lagrange 乘子 αi 不为 0,
对应样本 xi即是支持矢量。最大化的目标函数为:
Qiiα =
n
i=1
Σαi- 12
n
i, j=1
Σαiαjyiyj xi·xji i (23)
若 αi*为最优解,则
w*=
SV
Σαi*yixi (24)
对上述问题求解后所得到的最优分类函数为:
fiix =sign w*·i ix +bΣ Σ* (25)
其中:signii为符号函数,b*=yi-w*·xi。
在线性不可分的情况下,可以在条件(19)中
引入一个正的松弛项:
ξi叟0 (26)
yi w·xii i+Σ Σb 叟1-ξi , i=1,2,… ,n (27)
这样, 线性不可分的分类问题变成了在条件
(26)和(27)约束下求下列函数的极小值:
准 w ,i iξ = 12 w·
i iw +C
n
i=1
Σξii i (28)
其中,C为惩罚因子。
利用求解最优分类面同样的算法来求解这一
优化问题,此时,0燮αi燮C , i=1,2,… ,n。
在 SVM 算法中, 只要定义了不同的内积函
数,就能实现多项式逼近、贝叶斯分类器、径向基
函数以及神经网络等多种学习算法。 目前常用的
内积函数主要有 3 种, 并同已有的方法有着对应
关系。 经过实验,本文选用高斯内积函数。
K x ,i iy =exp -襓x-y襓
2
σ2i i (29)
得到的支持向量机是一个径向基函数分类器。
41
莆 田 学 院 学 报 2009 年 10 月
编号
7个不变矩 2个边界矩
准1 准2 准3 准4 准5 准6 准7 F1 F2
1 0.0737 0.7342 0.0205 0.0397 0.6967 0.4190 0.9208 0.3668 0.4133
2 0.9219 0.9354 0.0173 0.0450 0.6991 0.4692 0.9189 0.4247 0.4867
3 0.2043 0.7718 0.0027 0.0067 0.6978 0.4440 0.9198 0.3715 0.4142
4 0.2311 0.7808 0.0020 0.0048 0.6978 0.4430 0.9198 0.3260 0.3634
5 0.4512 0.8249 0.0112 0.0211 0.6973 0.4237 0.9200 0.4227 0.4988
6 0.3449 0.8050 0.0083 0.0154 0.6976 0.4299 0.9199 0.4721 0.5419
7 0.2102 0.7630 0.0033 0.0091 0.6978 0.4450 0.9198 0.3603 0.4024
8 0.1901 0.7840 0.0016 0.0037 0.6978 0.4429 0.9199 0.4465 0.5065
9 0.3150 0.7984 0.0090 0.0309 0.6986 0.4708 0.9200 0.4560 0.5305
10 0.2742 0.7902 0.0182 0.0485 0.6988 0.4586 0.9185 0.3258 0.3676
11 0.1095 0.7475 0.0142 0.0499 0.6998 0.4866 0.9196 0.2512 0.2801
12 0.3098 0.7046 0.1548 0.6959 1.0000 1.0000 0.8044 0.2181 0.2399
13 0.0831 0.7645 0.0528 0.1153 0.6992 0.4479 0.9292 0.2767 0.3255
14 0.0188 0.6516 0.0027 0.0067 0.6978 0.4423 0.9198 0.3715 0.4242
15 0.4410 0.8380 0.0894 0.2404 0.7254 0.5455 0.8885 0.3578 0.4043
16 0.3110 0.7967 0.0002 0.0008 0.6978 0.4440 0.9199 0.3614 0.4111
17 0.0000 0.0000 0.0002 0.0029 0.6978 0.4445 0.9199 0.4361 0.4956
18 0.1845 0.7680 0.0136 0.0269 0.6973 0.4267 0.9194 0.4234 0.4809
19 0.3864 0.8073 0.0133 0.0401 0.6988 0.4666 0.9192 0.3527 0.3950
20 0.2011 0.7491 0.0424 0.1406 0.7110 0.5398 0.9267 0.1916 0.2120
编号
7个不变矩 2个边界矩
准1 准2 准3 准4 准5 准6 准7 F1 F2
1 0.1600 0.7585 0.0665 0.2215 0.7264 0.5822 0.9398 0.3665 0.4220
2 0.2463 0.7655 0.0000 0.0000 0.6978 0.4432 0.9199 0.3483 0.3936
3 0.2127 0.7776 0.0055 0.0131 0.6978 0.4404 0.9200 0.4620 0.5317
4 0.1699 0.7680 0.0092 0.0341 0.6987 0.4740 0.9199 0.4616 0.5325
5 0.5606 0.8439 0.0114 0.0224 0.6973 0.4246 0.9201 0.3172 0.3553
6 0.3396 0.8192 0.0223 0.0427 0.6963 0.4111 0.9190 0.4455 0.5170
7 0.3501 0.8110 0.0512 0.1006 0.6930 0.3957 0.9266 0.2361 0.2718
8 0.5634 0.8118 0.0170 0.0609 0.7007 0.4964 0.9204 0.4900 0.5739
9 0.3396 0.8192 0.0223 0.0427 0.6963 0.4111 0.9190 0.4455 0.5170
10 0.9125 0.9149 0.0051 0.0110 0.6978 0.4382 0.9198 0.4436 0.5070
11 0.5689 0.8423 0.0035 0.0070 0.6978 0.4365 0.9198 0.4267 0.4870
12 0.8111 0.8595 0.0186 0.0520 0.6988 0.4562 0.9183 0.4267 0.4854
13 1.0000 0.9070 0.0123 0.0414 0.6991 0.4792 0.9195 0.4080 0.4633
14 0.6773 0.8381 0.0397 0.1408 0.7129 0.5646 0.9235 0.4248 0.4907
15 0.3369 0.7742 0.0292 0.1015 0.7053 0.5217 0.9172 0.2979 0.3317
16 0.3688 0.7823 0.0126 0.0454 0.6994 0.4834 0.9201 0.4780 0.5587
17 0.6676 1.0000 1.0000 1.0000 0.0000 0.0000 0.0000 0.2918 0.3339
18 0.8243 0.8636 0.1444 0.5661 0.9412 0.9732 0.9411 0.2722 0.3051
19 0.6227 0.8688 0.2750 0.3881 0.5453 0.1490 1.0000 0.2226 0.2482
20 0.6496 0.8803 0.0965 0.2263 0.7008 0.4355 0.8852 0.4453 0.5138
3 实验与结果分析
本次实验分别对 20 幅分割后的板栗和 20 幅
分割后的锥栗图像提取其不变矩和边界矩, 并将
提取出的 7 个不变矩和 2 个边界矩构成特征矩
阵,如表 1和表 2。 将该特征矩阵作为支持向量机
的数据输入。 对板栗和锥栗图像分别取 16幅的特
征数据作为训练集, 将余下的 4 幅图像作为测试
集。 支持向量机的核函数采用径向基函数 (σ =
0.1—1.0)。 实验结果表明:板栗的分类结果是完全
正确的,锥栗则有 1 幅图像误分,总的识别正确率
为 87.5%。 造成误差的主要原因是在获取锥栗图
像时,因获取图像的角度不同,其形状特征也不一
样,有的形状特征接近板栗,如图 1(b)的第一幅图
像形状接近图 1(a)的第一幅图像。
4 小结
由于形状特征是图像的核心特征之一, 也是
物体的稳定特征,它不随图像颜色的变化而变化,
(下转第 46页)
表 1 20 个板栗图像 7 个不变矩归一化后的特征值和 2 个边界矩
表 2 20 个锥栗图像 7 个不变矩归一化后的特征值和 2 个边界矩
42
莆 田 学 院 学 报 2009 年 10 月
[5] Navarro G , Raffinot M . Flexible pattern matching in
strings : practical on-line search algorithms for texts
and biological sequences [M]. Combridge:Combridge
University Press, 2002.
[6] Glushkov V . The abstract theory of atuomata[J].
Russian Math Surveys, 1961, 16:1-53.
[7] McNaughton R , Yamada H . Regular expressions and
state graphs for automata[J]. IEEE Trans on Electronic
Computers, 1960, 9:39-47.
[8] Ilie L , Yu S . Constructing NFAs by optimal use of
positions in regular expressions [M]// A Apostolico M
Takeda. Proc of the 13th CPM, Lecture Notes in
Comput Sci . Berlin:Springer, 2002.
[9] Hagenah C , Muscholl A . Computing ε-free NFA from
regular expressions in O(n log2(N )) time[J].
Mathematical Foundations of Computer Science, 1998,
1450:277-285.
[10] Berry G , Sethi R . From regular expressions to
deterministic automata[J]. Theoret Comput Sci , 1986,
48:117-126.
[11] Ilie L , Yu S . Follow automata [J]. Information and
Computation, 2003, 186:140-162.
[责任编辑 林 锋 ]
(上接第 42页)
因此用形状特征区别物体更加直观。 通过观察发
现:不同栗属树种果实图像间在纹理、颜色方面差
别很小,而栗属树种果实的形状则存在较大差异。
为此, 本文选择形状特征作为栗属树种分类识别
的依据, 并使用支持向量机对预处理后的图像的
形状特征值进行了分类。 实验表明,基于支持向量
机的栗属图像分类能够获得较好的识别分类结
果,对栗属图像识别准确率可以达到 87.5%,识别
效果较为理想。 因受光源条件影响原始图像中存
在一些阴影, 对图像的预处理此次实验是采用交
互式快速水平集分割算法, 而且实验数据量比较
少。 因此,如何自动定位目标区域实现图像分割并
在大量数据中作出准确的识别与分类, 将有待于
进一步探讨和研究。
参考文献:
[1]祁亨年,金水虎.基于叶片特征的计算机辅助植物识别
模型[J].浙江林学院学报,2003,20(3):281-284.
[2]祁亨年.植物外观特征自动获取及计算机辅助植物分类
与识别[J].浙江林学院学报,2004,21(2):222-227.
[3]王晓峰,黄德双,杜吉祥,等.叶片图像特征提取与识别
技术的研究[J].计算机工程与应用,2006(3):190-193.
[4]黄志开.彩色图像特征提取与植物分类研究[D]. 合肥:
中国科学技术大学,2006.
[5]朱宁.基于图像纹理分析的计算机辅助植物分类与识别
[J].农业网络信息,2008(3):17-19.
[6] I Biederman. Human image understanding : recent
research and a theory[J]. Computer Vision, Graph and
Image Process, 1985, 32(1):29-73.
[7] Hsia T C . A note on invariant moments in image
processing [J]. IEEE Trans on SMC, 1981, 11(12):
831-834.
[8]边肇祺,张学工. 模式识别[M]. 2版. 北京:清华大学出
版社,2000.
[9]李小林,林大辉,李威,等.基于图像的昆虫远程自动识
别[J]. 福建农林大学学报:自然科学版,2008,37(5):
456-459.
[责任编辑 林 锋 ]
-------------------
46