免费文献传递   相关文献

Computer Recognition System of Plant Leaf-shape

植物叶形的计算机识别系统



全 文 :植物学通报 2005, 22 (5): 599~604
Chinese Bulletin of Botany
①通讯作者。Author for correspondence. E-mail: tianxj@nju.edu.cn
收稿日期: 2004-09-20 接受日期: 2005-04-15 责任编辑: 于昕
技术与方法
植物叶形的计算机识别系统
1朱 静 1田兴军① 1陈 彬 2吕劲紫
1(南京大学生物系 南京 210093) 2(南京大学教务处 南京 210093)
摘要 植物叶形是识别植物的重要和常用形态特征, 建立计算机自动识别系统对于认识和正确识别
植物十分重要。本文论述了植物叶形图像识别系统设计中的图像处理、特征提取及分类识别等问题。
本系统采用Visual Basic.Net编程工具设计, 在Windows 2000/XP平台上通过叶片图像的输入、变换、
平滑和分割等识别过程,实现了叶片图像的形状和叶缘特征的结果输出。实验结果表明, 该系统能够很
好地识别植物的叶形, 对14种植物337份叶片样本的叶形测试准确率达93.2%。为植物识别的进一步研
究奠定了基础。
关键词 植物叶形, 图像处理, 特征提取, 图像识别, 叶形分类
Computer Recognition System of Plant Leaf-shape
1ZHU Jing 1TIAN Xing-Jun① 1CHEN Bin 2LÜ Jin-Zi
1(Department of Biology, Nanjing University, Nanjing 210093)
2(Department of Biology, Nanjing University, Nanjing 210093)
Abstract Leaf-shape is a significant feature for plant recognition. Establishing computer
recognition system is an essential topic for identifying plants. Image processing, feature ab-
straction and classification of plant leaf shape with computer recognition system were discussed
in this paper. The system has been developed with Microsoft Visual Basic.Net under Windows
2000/XP system. It can accomplish leaf image input, transform, smoothness, segmentation and
finding leaf margin, etc. The performance of the system to recognize leaf shape has been demon-
strated with 93.8% precision rate through testing 337 samples which belong to 14 species of
plants. This work is very essential for further studies.
Key words Leaf shape, Image processing, Feature abstraction, Image recognition, Leaf-
shape classification
图像识别是20世纪60年代美英等西方国
家提出来的, 设想建立自动识别实验室让导弹
能够通过图像识别来自动寻找飞机、舰船和
坦克等目标(胡红俊等, 2001)。20世纪 80年
代以后, 图像识别在许多领域得到了广泛的应
用, 取得了一些可喜的成果, 例如, 人脸识别(张
翠平和苏光大, 2000)、掌纹识别(黎明等,
2000)以及指纹识别(胡红俊等, 2001)等。近年
来,图像识别以其客观性、智能性在生物学领
域得到广泛发展, 如肝脏B超图像的纹理识别
600 22(5)
(吴泽晖和汪柄权, 1999), 肿瘤细胞显微图像的
处理与识别(王昕, 1996)等的研究, 都已经取得
了很好的成果。随着计算机技术发展, 计算
机视觉技术逐渐渗入到生物学的其他领域, 如
花粉识别(赵先贵等, 1999), 果形识别(赵静和何
东健, 2001), 基于人工神经网络的叶脉信息提
取(傅弘等, 2004)等等。
植物的叶形是传统识别植物的重要和常
用形态特征(Mario, 2004)。植物的叶部形态
是多样的, 每一种植物都有其相对稳定的特征,
这些就是认识和识别植物的基础和出发点
(Tracy, 2000)。植物的各种器官都有分类价
值, 相对而言繁殖器官的特征更能反映植物之
间的差异和进化关系, 但这些器官往往在整个
植物生活周期中所占时间短、比例小且多数
要在解剖镜下才能看见, 常常不作为植物快速
识别的主要依据。和繁殖器官比较, 叶片具
有诸多优点, 常作为识别特征和人们认识植物
的主要参照器官。植物叶形是一个二维的平
面系统, 相对而言, 更容易进行图像的处理和
加工。但植物叶片更容易受到环境影响, 也
更容易对环境变化产生响应。研究物种的形
态变异和分化具有许多提示意义, 叶形是一个
非常好的指标(Lynn and Waldren, 2001), 因此,
建立计算机叶形自动识别系统对于认识和正
确识别植物十分重要, 同时对研究植物对环境
的响应, 植物弹性机制等都具有现实意义。
本文旨在通过叶形计算机自动识别系统建
设的说明和应用, 来展示植物叶形识别的初步工
作, 为今后植物的完全自动化识别打下基础。
1 原理与方法
1.1 系统原理和结构概述
植物叶形特征的计算机识别是应用模式
识别和图形处理的理论与技术, 对扫描得到的
叶片图像进行计算与分析, 用关系结构匹配的
方法进行识别, 以达到分类和识别的目的。
植物叶形的识别是植物分类学的一个部
分。目前,植物叶形的分类主要是依靠鉴定者
的经验进行人为的判断。这种传统的判别方
法要求操作者具有丰富的分类学知识和长期
的实践经验,才能开展工作。由于植物种类非
常丰富,叶片形态看似接近, 实则千差万别,加之
目前还没有一个便于操作的叶形检索系统,因
此叶形的识别工作一直存在很大的困难。随
着计算机在各学科中的广泛应用, 探讨用计算
机快速而准确地识别植物叶形,无疑是解决这
一问题的一个切实可行的新途径。本文介绍
的植物叶形的计算机识别系统系采用微软公
司Visual Basic.net 编程工具在Windows 2000/
XP平台上创建完成。系统由样本输入、图
像处理、特征提取、分类设计及结果输出等
功能模块构成(图 1)。
1.2 图像采集
本实验采用的叶片样本来自野外采集的
植物叶片及标本馆库存植物标本。对采集得
到的叶片, 用扫描仪进行扫描, 得到数字化的
彩色图片; 标本馆的库存植物, 采用数码相机拍
摄的方法得到数字化图片。本实验的标本均
取自南京大学和江苏植物研究所植物标本室。
1.3 图像处理
由于植物标本的颜色多样, 特别是标本室
内的标本多数已经失去了原来的色泽, 为了去
除颜色的干扰, 首先我们对图像进行二值化处
理。通过叶片和背景的色泽反差, 先将标本
图像转化成灰度图像, 然后利用灰度图像直方
图阈值差异实现图像的二值化。
通过阈值化运算是否可以有效地进行图
图 1 系统框图
Fig. 1 Block structure diagram of the recognizing
system
6012005 朱静等: 植物叶形的计算机识别系统
像分割, 取决于物体和背景之间是否有足够的
对比度。设一幅灰度图像I[i, j]中物体的灰度
分布在区间[T1, T2]内, 经过阈值运算后的图像
为二值图像B[i, j],即
B[i, j]=1的部分表示图像, B[i, j]=0的部分
表示背景(Gonzalez and Woods, 2003)。
就植物的计算机识别系统而言, 需要确定
一个阈值T以区分叶片和背景。I[i, j]≥T时,
B[i, j]=1; I[i, j]像的阈值是在多次实验的基础上确定算法, 操
作时由计算机自动计算获得的。
在二值化后, 先对叶面内部的一些细小空
洞进行填补, 然后去除噪音。由于叶片周围
会有小杂物形成噪音, 所以用高通滤波(李兰友
等, 2002)进行大幅度滤波, 去掉噪音。高通滤
波是对图像的低频分量进行拟制从而让图像
的高频分量无损耗或低损耗地通过滤波器, 从
而使得到的轮廓更规则。
高通滤波之后用四邻域法抽出图像的边
界。对目标像素和它的四邻域进行探测, 若
值相等, 对目标像素给以标记, 然后清除, 得到
图像的边界。然后用 3× 3的模板清除图像
边界上的毛刺, 使边界更为清晰, 减小边界编
码时的出错率。之后需要对边界进行标记,
以得到有序的边界链码。
标记边界链码首先要对叶柄与叶面的结
合点的位置进行标定。该位置的标定根据叶
片有无叶柄分两种情况。有柄叶片, 取边界
上、叶柄两侧最接近结合点位置的两点分别
作为边界链码的起始点和结束点并以这两点
连线的中点作为结合点; 无柄叶片, 则直接标
定边界上最接近结合点位置的一点为结合点,
同时也作为起始点, 开始标记边界链码。
预处理后得到两组有用的数据: 一组是边
界链码, 另一组是叶面部分的像素集。
1.4 特征提取
众所周知,植物叶片变化很大, 不同植物之
间形态各不相同, 这是叶形识别的出发点。
但很多不同植物的叶形会大体相似, 同一种植
物的不同叶片, 形态却会有一定程度的分化, 这
使得叶形的识别成为模式分析中的一个难
题。如何从叶片图像上提取稳定有效的特征,
是解决叶形分类的一个关键问题。特征提取
的第一步是对一些有用的参数进行计算。
1.4.1 长宽比 长宽比是叶形分类中应用很
广泛的一个参数, 能够描述叶片是接近圆形还
是扁长的。计算叶片的长宽比, 首先要计算
其重心。重心计算公式如下:
其中N是被识别的图像中叶面部分的像
素点总数, (xi, yi):i=1, 2, ⋯, N是这些像素点的
坐标(Gonzalez and Woods, 2003)。
叶片样本主轴的确定依赖于重心与结合
点的位置。可将重心与结合点的连线定为纵
图 2 叶片图像的预处理过程
Fig. 2 Leaf image processing
602 22(5)
轴; 过重心, 与纵轴垂直的直线定为横轴。纵
轴将叶面分为两个部分, 分别计算两个部分边
界上的点到纵轴的距离, 两部分离纵轴最远的
点(k1和k2)到纵轴的距离(W1和W2)之和即为
叶面的宽。同时, 横轴也将叶面分为两个部
分, 每个部分边界上有到横轴最远的点, 这两
点到横轴的距离之和为叶面的长(L1)。另外,
由横轴分成的两部分叶面中, 远离结合点的那
部分边界上距横轴最远的点即是叶尖。
长宽的计算还有其他方法, 比如, 长可定为
从叶柄与叶面的结合点出发与叶缘所有点间
距离的最大值。可是考虑到叶基部形状的不
同, 有些叶如心形叶, 其叶柄与叶面的结合点
是向内凹陷的, 这就使得叶长的计算会有偏
差。在多个样本的研究基础上, 考虑各种计
算的优缺点, 最终我们提出以上的计算方法。
由此确定长宽比计算公式:
长宽比=(W1+W2)/ L1
1.4.2 最宽处位置 横轴分成的两部分叶面
中, 在有结合点那部分确定离横轴最远的一点,
过该点作平行于横轴的直线(BL)。定义最宽
处位置为k1, k2到该直线距离的平均值(L2)与
叶长(L1)的比值。
最宽处位置指数=L2/L1
1.4.3 叶基部凹陷程度 设结合点到直线
BL的距离为L3, 则叶基部凹陷程度可由下式
表示:
叶基部凹陷程度指数=L3/ L1
1.4.4 叶缘及叶裂特征 边界线段的局部形
状(用以识别叶缘及叶裂)可以用锯齿数、叶裂
数进行定量描述。要了解如何实现这一点, 可
以参考图3(A)和图3(B), 前者显示了边界的线
段, 后者显示了以任意变量r的一维函数g(r)描
述的线段。这个函数通过连接线段的两个端
点并将线段旋转至水平方向得到。点的坐标
也旋转相同的角度(Gonzalez and Woods,
2003)。
对于叶片样本, 分别以起始点和叶尖、
叶尖和中点为端点, 进行变换, 得到两组一维
函数, 用函数的局部的走势可判断该局部是否
有锯齿或分裂。
1.5 分类依据
叶形在植物系统分类中占有重要位置
(Mario, 2004)。传统植物学把植物的叶形分
为阔卵形、卵形、披针形、圆形、阔椭圆
形、椭圆形、长椭圆形、倒阔卵形、倒卵
形、倒披针形、线形、剑线形、掌状、心
形、扇形等(杨世杰, 2000)。本识别系统也
主要根据传统分类学中有关叶形的定义, 以长
宽比作为主要分类特征, 结合叶部的其他形态
特征如叶最宽处所处位置、叶基部特征等进
行分类。
2 系统测试和结果及分析
本实验用14种共337张叶片样本对识别
系统进行了测试。样本叶形确定是通过查找
书籍的记载和有经验的老师的判断来实现的,
该种判断作为正确判断, 计算机识别作为实验
判断。后者与前者的比率作为正确识别率。
本文的实验结果显示全体样本的正确识别率
达 93.2%(表 1)。该 14种植物包括具有心形、
圆形、椭圆形、卵形、倒卵形、阔卵形、
披针形等叶形的判断。
测试的结果显示虽然正确率很高, 但还没
有达到 100%的准确。主要原因可能是由一
图 3 叶缘特征提取示意图
A. 边界线段; B. 函数表示
Fig. 3 Sketch of leaf margin characteristics ab-
stracting
A. Verge path; B. Function expressing
6032005 朱静等: 植物叶形的计算机识别系统
些叶形相似而产生的混淆所致, 如心形叶被
误识为相近的阔卵形等。又如椭圆形与卵
形之间的相互误识。也可能是由于叶片样
本本身的不甚规则产生了计算偏差, 另一方
面由于选取的特征还不够精确全面, 有待进
一步改进。
3 讨论
本文对叶片的预处理、特征提取和识别
方法做了一些探讨。植物叶形的计算机识别,
将计算机视觉识别技术运用于植物分类学中,
综合了计算机科学、数学及植物分类学等多
学科的知识, 是一个综合性很强的、跨学科
的研究课题。国内外已有研究者做了一些相
关的工作, 如美国的俄勒冈州立大学曾于2002
年尝试用计算机手段建立基于叶形特征的植
物识别系统, 其研究的相关内容未以论文形式
发表。祁亨年等(2003)提出叶形识别概念, 并
对其前景做了讨论与展望, 但未进行系统的
开发。至于其他工作者的相关研究成果 ,
由于无法获取具体的资料, 因而没有办法进
行系统比较。
一般而言, 图像可以采用匹配技术进行分
类,匹配通常采用的方法有模板(或样本)匹配
和关系结构匹配两种方法; 前者是原图像与模
板之间点到点或区域到区域的相关度测量; 后
者则是利用图论方法进行匹配。考虑到同类
叶片内部样本间的变形, 用关系结构匹配的方
法似乎更加合适。这就需要建立大量有效可
靠的分类规则。在建立分类规则时, 植物分
类学的知识非常重要, 直接决定了识别结果的
可信度。
由实验结果可知, 现阶段叶形的计算机识
别系统对常见的叶形类型能够进行较好识别,
正确率达95.3%, 为下一阶段的工作奠定了良
好的基础。根据分类学上的描述, 叶尖可以
分为渐尖、锐尖、尾尖、钝尖、尖凹、倒
心形等, 叶基可分为心形、箭形、楔形、戟
形、圆形等, 目前的识别系统尚不能对叶尖
等进行精确识别。另外, 叶缘特征的分类还
比较粗略, 有待细化, 正确率仍需提高, 这些问
题都有待在今后的工作中予以解决。指纹、
人脸、掌纹等识别系统的开发和完善为植物
识别系统的研制和开发提供了有益参考和今
表 1 叶形(337叶片)测试
Table 1 Testing of leaf shapes with 337 leaves
Species Number of samples Correctly classified samples Accuracy (%)
Cercis chinensis 24 22 91.7
Nerium indicum 26 24 92.3
Osmanthus fragrans 20 18 90.0
Ligustrum lucidum 26 23 88.5
Cinnamomum camphora 23 20 87.0
Actinidia chinensis 22 21 95.5
Quercus glandulifera var. brevipetiolata 20 19 95.0
Acer amplum 27 25 92.6
Acer buergerianum 25 24 96.0
Acer oliverianum 26 25 96.2
Acer oblongum 21 19 90.5
Acer sinense 26 26 1 0 0
Acer palmatum 28 28 10
Cyclobalanopsis glauca 23 21 91.3
Total 3 3 7 3 1 4 93.2
604 22(5)
参 考 文 献
傅弘, 池哲儒, 常杰, 傅承新 (2004) 基于人工神经网
络的叶脉信息提取——植物活体机器识别研究 I. 植
物学通报, 21: 429-436
胡红俊, 赵丽如, 贺贵明 (2001) 自动指纹识别系统设
计. 计算机应用, 21(11): 52-53
李兰友, 李玮, 白克壮编 (2002) Visual Basic. Net 图
形图像编程与实例详解. 电子工业出版社, 北京, pp.
247-266
黎明, 严超华, 刘高航 (2000) 基于掌纹图像分析的身
份识别系统. 中国图像图形学报, 5: 134-137
祁亨年 (2003) 基于叶片特征的计算机辅助植物识别
模型. 浙江林学院学报, 20: 281-284
王昕 (1996) 一种肿瘤细胞显微图像处理与识别系统.
数据采集与处理, 12: 292-295
吴泽晖, 汪柄权 (1999) 基于数学形态学的肝脏 B超
图像的纹理识别. 中国图像图形学报, 4: 730-733
杨世杰主编 (2000) 植物生物学. 科学出版社, 北京,
pp. 121-122
张翠平, 苏光大 (2000) 人脸识别技术综述. 中国图像
后努力的方向。也为本系统的进一步开发提
供了许多技术上的借鉴。相信通过植物学家
和计算机专家的共同努力, 植物的自动识别一
定能够取得进步, 获得成功。
图形学报, 5: 885-894
赵静, 何东健 (2001) 果实形状的计算机识别方法研
究. 农业工程学报, 17: 165-167
赵先贵, 肖玲, 王勋银 (1999) 植物花粉图像识别系统
研究——图像处理及特征提取. 西北林学院学报, 14
(4): 31-34
Gonzalez C, Woods E (2003) Digital Image Processing.
电子工业出版社, 北京, pp. 156-163
Lynn DE, Waldren S (2001) Morphological variation
in populations of Ranunculus repens from the tem-
porary limestone lakes (Turloughs) in the west of
Ireland. Annals of Botany, 87: 9-17
Mario MS (2004) Graphic approach for morphomet-
ric analysis of Archaeopteris leaves. Annales de
Paléontologie , 90: 161-173
Tracy M (2000) Geographic variation and plasticity
of leaf shape and size in Begonia dregei and B.
homonyma (Begoniaceae). Botanical Journal of the
Linnean Society, 132: 79-95