全 文 :2015 年 5 月
第 30 卷第 5 期
中国粮油学报
Journal of the Chinese Cereals and Oils Association
Vol. 30,No. 5
May 2015
基于图像处理的苦荞品种判别
张 强
(山西师范大学生命科学学院,临汾 041004)
摘 要 为了建立不同品种苦荞种子的正确分类方法,以 11 个不同品种的苦荞种子为研究材料,使用扫
描仪获取种子彩色图像,通过图像处理软件提取每个种子的特征变量 28 个,建立了一个包含 11 个品种 440 个
苦荞种子,12 320 个数据的矩阵。通过逐步法筛选有效特征变量,并利用有效变量构建判别模型。结果表明,
筛选出的 18 个变量中,颜色变量为苦荞品种判别的主要变量。颜色变量和形态变量相结合,构建的贝叶斯判
别模型,回判正确率达到了 96. 8%,交互验证正确率达到了 94. 7%。利用计算机图像处理技术和现代统计方
法,能有效地对苦荞种子的颜色与形态特征进行精确量化和快速分析,可作为不同品种苦荞种子分类鉴别的
一种客观,准确、有效的方法。
关键词 图像处理 苦荞 品种 判别分析
中图分类号:TS211. 7 文献标识码:A 文章编号:1003 - 0174(2015)05 - 0128 - 05
基金项目:山西师范大学校基金(ZR1222)
收稿日期:2014 - 01 - 03
作者简介:张强,男,1968 年出生,讲师,植物资源开发利用
苦荞亦称鞑靼苦荞(F. tartaricum) ,为蓼科
(Polygonaceae)苦荞属(Fagopyrum Gaerth)药食兼
用的作物。随着苦荞营养和功能成分研究的深
入[1],苦荞的开发利用也得到了迅速的发展,目前
中国已是苦荞生产大国,种植面积及产量均居世
界第一。
种子的真实性和品种纯度鉴定在种子质量管
理、种子生产与营销实践中有重要意义[2]。基于种子
数字图像处理的机器视觉检测方法具有无损、高效、
快捷和低成本的特点。近年来,国内外学者在小
麦[3 - 7]、玉米[2,8]、花生[9]等大宗作物、经济作物的品
种、等级和产地判别中进行了探索和应用。不同农
作物的种子特征在识别中作用会有所不同,传统的
苦荞种子品种分类鉴别还依赖于肉眼观察为主,而
对苦荞种子品种进行图像识别的相关研究还未见报
道。为了解决品种混杂、充伪等问题,探寻新的苦荞
品种判别方法,对于苦荞品种鉴别、产品质量控制、
健全质量管理、保证苦荞产业的持续健康发展具有
重要意义。
本试验基于图像处理的研究方法对不同品种的
苦荞种子(果实,下同)进行形态特征方面的分类比
较,首先使用图像扫描仪获得不同品种苦荞种子的
彩色图像,再采用图像处理软件从图像中提取颜色
和形态特征的基础数据,然后利用统计软件对这些
基础数据进行分析,筛选判别变量,建立有效的判别
模型,并对模型进行验证,为苦荞品种分类提供有效
鉴定依据。
1 材料与方法
1. 1 材料
采用全国 8 个省区的 11 个品种苦荞种子作为试
验材料,分别为:1 威宁苦荞、2 九江苦荞、3 晋荞 2 号
苦荞、4 固原苦荞、5 海原苦荞、6 通化苦荞、7 苦刺
荞、8 黑丰 1 号苦荞、9 湖南 7 - 2 苦荞、10 云南苦荞、
11 黔黑苦荞,均由山西省农科院农产品加工研究所
提供。种子过筛去杂,每个品种随机选取 40 粒种
子,共 440 粒种子。
1. 2 方法
1. 2. 1 种子图像的采集及信息提取
采用 EPSON Perfection V700 扫描仪获取苦荞种
子的数字图像,扫描仪的分辨率设置为 600 dpi,背景
设置为白色。图像处理与分析在台式电脑(Lenovo,
Pentium 4,2. 8 GHz)上进行,操作系统为 Windows
XP SP3。以图像处理软件 Adobe Photoshop CS4 作为
样本特征参数提取的主要工具。
1. 2. 2 图像分析方法
通过 USB接线将样本的原始图像转入计算机进
行处理。为了进一步消减图像在扫描及传输过程中
的噪声干扰,利用 Adobe Photoshop CS4 软件中的调
整边缘工具,将调整半径设置为 1. 00 像素,平滑力
第 30 卷第 5 期 张 强 基于图像处理的苦荞品种判别
度设置为 3 以去除图像边缘的锯齿状干扰,并且利
用羽化工具以 1. 00 像素单位平均模糊柔化选取边
缘[10],获取更精细的结果。通过边缘的调整,干扰及
图像噪声得到消减,较好地保持了图像的边缘。利
用快速选择工具,设置选定直径为 10 px,间距为
25%,对单个种子进行选定,提取单个种子的特征数
据。
1. 2. 3 颜色特征提取
对于颜色识别通常采用红绿蓝(RGB)和 HSI 颜
色分析,使用 RGB颜色模式时,自然的色彩与显示器
上的色彩是以完全相同的方法创建的,有利于对图
像进行客观、准确地分析和研究,因苦荞籽粒主色调
为灰白及黑色,并且考虑到 Adobe Photoshop CS4 软
件中颜色数据提取的方便性,采用 RGB 颜色作为苦
荞种子颜色特征的提取通道。利用快速选择工具将
籽粒选定后,在直方图里会显示选定区域的 RGB 各
颜色特征均值。
1. 2. 4 形态特征的提取
利用快速选定工具对每个种子进行选定提取,
并记录测量。形态特征如下:
面积 =以单个苦荞种子图像所包含的所有像素
总数计算。
周长 =苦荞种子图像边界像素总和。
长度 =苦荞种子纵向图像上距离最长的 2 个端
点之间的像素距离。
宽度 =苦荞种子横向图像上垂直于纵轴的最大
2 个端点之间的像素距离。
长宽比 =长度 /宽度。圆形度 = (周长)2 /(4π ×
面积)。矩形度 =面积 /外接矩形面积。
1. 2. 5 其他特征变量的提取
根据苦荞种子的性状特点,将一些较明显的籽
粒外观特征也进行了提取,比如腹沟及棱翅的有无。
经观察发现,11 个样本的苦荞品种均具有腹沟,除苦
刺荞具有明显的棱翅分布之外,其他品种均没有明
显的棱翅特征。
1. 2. 6 判别模型的构建与验证
采用 SPSS 17. 0 统计软件进行方差分析和判别
分析。方差分析的多重比较采用 Duncan 法;判别分
析,采用 Wilks,λ 法和逐步法,构建贝叶斯(Bayes)
判别函数。聚类分析采用 DPS14. 10 软件进行因子
聚类。验证方法采用回判验证和交互验证法。交互
验证是近年来逐渐发展起来的一种非常重要的判别
效果验证技术,是在建立判别准则时逐一去掉一例,
再用建立的判别准则对该例进行判别,交互验证与
回判验证相比错分率可能会增加,但结果更真实、客
观,是评价判别准则效能的可靠指标[11 - 12]。
2 结果
2. 1 特征变量筛选结果
提取的苦荞种子特征参数为 28 个。其中 9 个形
态特征包括面积、周长、长度、宽度、矩形度、长宽比、
圆度、棱翅和腹沟;颜色特征包括 RGB、R、G、B和明度
的平均值、标准差、中间值以及灰度的最小值、最大值、
平均值、中间值等 19个特征指标。方差分析结果显示
不同品种间的全部指标均存在显著差异(P <0. 05) ,
图 1显示的是部分形态特征的多重比较结果,图 2 显
示的是部分颜色特征的多重比较结果(不同字母表示
在 0. 05水平,差异存在统计学意义)。
图 1 不同品种苦荞种子的长度、宽度及长宽比
921
中国粮油学报 2015 年第 5 期
图 2 不同品种苦荞种子的 R、G、B中间值
11 个品种之间 28 个特征变量均存在显著差异
(P < 0. 05) ,于是将全部变量纳入进行逐步筛选,根
据规则标准 F > 3. 84 的纳入,F < 2. 71 的筛除,从中
筛选出特征变量,剔除影响不显著变量的干扰。经
20 步的筛选,获得 18 个有效特征变量列于表 1。
表 1 筛选出的特征变量
序号 X 特征变量 序号 X 特征变量 序号 X 特征变量
1 X1 灰度值(平均值) 7 X7 矩形度 13 X13 G中间值
2 X2 G平均值 8 X8 面积 14 X14 灰度值(最大值)
3 X3 RGB标准差 9 X9 R标准差 15 X15 明度标准差
4 X4 宽度 10 X10 B标准差 16 X16 长宽比
5 X5 B中间值 11 X11 长度 17 X17 明度中间值
6 X6 R中间值 12 X12 G标准差 18 X18 灰度值(最小值)
将这 18 个变量采用标准化处理,进行因子聚类
分析,结果如图 3 所示,在距离为 1 处可分为 2 类,一
类为颜色特征变量共 13 个,另一类为形态特征变量
共 5 个。分别使用筛选出的形态因子和颜色因子进
行品种判别分析,5 个形态因子的判别正确率为
55. 7%,交互验证正确率为 53. 6%;13 个颜色因子的
判别正确率为 76. 4%,交互验证正确率为 73. 4%。
图 3 判别变量的聚类结果
苦荞种子的颜色是苦荞的重要特征,基于颜色
特征因子的判别正确率为 76. 4%,亦显示颜色特征
是重要的分类特征。颜色特征中的灰度(平均值)为
最重要的判别变量,这与 Manickavasagan 等[13]利用
图像处理对加拿大 8 个小麦品种进行判别时的首要
变量有相似之处。颜色特征也较为稳健,对于物体
的大小和方向均不敏感,有较强的的鲁棒性。通过
人眼得到颜色知觉,这是一种复杂的主观过程,不可
避免地受到诸如人的视觉、疲劳程度、个人倾向性、
光源等因素的干扰[14]。利用计算机图像分析技术对
不同苦荞品种种子的颜色特征和形状特征进行采
集、提取,通过图象处理技术与现代统计技术相结合
进行分析建模判别,相比传统肉眼识别而言,精确量
化、客观准确有效。
基于形态特征因子的判别正确率为 55. 7%,表
明长度、宽度、长宽比、矩形度和垂直投影的面积 5
个形态特征在品种分类中亦发挥着比较重要的作
用。虽然研究显示不同品种形态特征上存在较明显
的可区分差异,但这种形态特征差异的显著性仅通
过肉眼判别是比较困难的,通过数字图像处理和统
计学分析有效克服了这个困难,可以利用这些特征
对种子的形状进行较为精确的区分判断。在有效特
征的筛选中,腹沟及棱翅 2 个变量未被加入有效特
征中,但这 2 个特征对于其他品种的区分可能仍具
有一定意义。
颜色和形状为多基因遗传特征,受环境因素影
031
第 30 卷第 5 期 张 强 基于图像处理的苦荞品种判别
响较小,可视为品种的属性特征[15]。颜色特征与形
态特征结合使用,能有效提高判别的正确率。本研
究方法对品种的判别正确率达到了 96. 8%,交互验
证的正确率达到了 94. 7%。判别效果一般用误判率
来衡量,并要求误判率小于 10%或 20%才有应用价
值[16]。因此根据苦荞的数字图像特点建立的 Bayes
模型,具有一定的应用价值。另外,研究采用的图像
处理软件和统计分析软件普及性高,易于掌握和使
用。
2. 2 判别结果
使用筛选出的 18 个形态因子和颜色因子一起
进行 Bayes判别分析,得到判别函数为:
y1 = - 34 805. 89 + 18. 36X1 - 1. 70X2 + 11. 73X3 +
…… - 27. 86X17 - 2. 72X18
y2 = -37 782.08 -202.53X1 +191.82X2 +120.33X3 +
…… - 14.65X17 - 3.77X18
y11 = - 37 534. 69 - 192. 20X1 + 181. 59X2 +
124. 65X3 + …… - 12. 38X17 - 4. 52X18
式中:y1,y2,…,y11,为对应的品种 1,2,…,11
的 Bayes 判别函数,将未知品种特征变量分别代
入函数式,哪个函数值大,则应归入相应的品种类
别。
表 2 判别分析结果
判别
分析
预测类别
1 2 3 4 5 6 7 8 9 10 11
正确率
/%
初始 1 40 0 0 0 0 0 0 0 0 0 0 100
判别 2 0 37 3 0 0 0 0 0 0 0 0 92. 5
3 0 0 38 0 2 0 0 0 0 0 0 95. 0
4 0 0 0 39 0 1 0 0 0 0 0 97. 5
5 0 0 1 0 39 0 0 0 0 0 0 97. 5
6 1 0 0 0 0 39 0 0 0 0 0 97. 5
7 0 0 0 0 0 0 40 0 0 0 0 100
8 0 0 0 0 0 0 0 39 0 1 0 97. 5
9 0 0 0 0 0 0 0 1 35 0 4 87. 5
10 0 0 0 0 0 0 0 0 0 40 0 100
11 0 0 0 0 0 0 0 0 1 0 39 97. 5
交互 1 38 0 0 0 0 2 0 0 0 0 0 95. 0
验证 2 0 37 3 0 0 0 0 0 0 0 0 92. 5
3 0 0 37 0 3 0 0 0 0 0 0 92. 5
4 0 0 0 38 0 2 0 0 0 0 0 95. 0
5 0 0 1 0 39 0 0 0 0 0 0 97. 5
6 1 0 0 1 0 38 0 0 0 0 0 95. 0
7 0 0 0 0 1 0 39 0 0 0 0 97. 5
8 0 0 0 0 0 0 0 38 1 1 0 95. 0
9 0 0 0 0 0 0 0 1 35 0 4 87. 5
10 0 0 0 0 0 0 0 0 0 40 0 100
11 0 0 0 0 0 0 0 0 2 0 38 95. 0
表 2 结果表明,对 11 个品种的回判验证(根据
判别准则将原样本逐一代入,评价判别效果) ,正确
率为 96. 8%。其中威宁苦荞、苦刺荞、云南苦荞的回
判正确率都达到了 100%,固原、海原、通化、黑丰 1
号及黔黑苦荞的回判正确率达到了97. 5%,晋荞 2
号、九江苦荞的回判正确率分别为 95%和92. 5%,仅
湖南 7 - 2 苦荞回判正确率较低,为87. 5%。对 11 个
品种的交互验证(即在建立判别准则时逐一去掉一
例,再用建立的判别准则对该例进行判别) ,正确率
为 94. 7%。
影响苦荞品种判别的因素可能与品种内种子的
一致性差有关。苦荞是总状花序,花期长,成熟时间
极不一致,因为苦荞的最适宜的收获时间为全株 2 /3
籽粒成熟,过早收获,大部分籽粒尚未成熟,过迟收
获,籽粒将大量脱落,影响产量[17]。另外,品种数目
越多,在籽粒形态诸特征上的交叠现象就越严重,可
区分性变差,也影响到识别效果[8]。今后选择成熟
度尽可能一致的籽粒,探索适宜种子样品数量规模、
尝试引入新的特征因子,如纹理特征等,优化分类方
法和模型,可能有助于提高判别的正确率。本研究
使用了 11 个苦荞品种,而通常某一区域的主要栽培
品种不会很多,建立针对某一地域几个主要品种的,
基于数字图像处理的判别模型,将使得应用数字图
像技术进行苦荞品种判别具有更广泛的应用价值。
3 结论
对来自 8 个省区的 11 个品种苦荞种子,通过扫
描仪获取其彩色数字图像,并从中提取了颜色和形
态 2 类共 28 个变量进行统计分析,发现苦荞种子不
同品种间的颜色特征和形状特征存在着显著差异。
通过逐步法筛选从中获得 18 个变量,作为苦荞种子
品种识别的重要指标,经 R型聚类分析可聚成 2 类:
13 个颜色变量聚为一类;5 个形态变量聚为一类。13
个颜色类变量的判别正确率为 74. 6%,5 个形态类
变量的判别正确率为 53. 6%,颜色类变量在苦荞品
种预测中发挥着主要作用。
将颜色类变量和形态类变量相结合,获得的
Bayes判别模型回判正确率为 96. 8%,交互验证判别
正确率为 94. 7%。表明利用图像分析系统和现代统
计方法,能有效地对苦荞种子的颜色与形态特征进
行精确量化提取和快速分析,比肉眼识别更具优势,
可为苦荞品种分类鉴别和质量控制提供一种客观
性,准确性、有效性的方法。
131
中国粮油学报 2015 年第 5 期
参考文献
[1]周小理,李宗杰,周一鸣. 荞麦治疗糖尿病化学成分的研
究进展[J]. 中国粮油学报,2011,26(5) :119 - 121
[2]杨锦忠,郝建平,杜天庆,等. 基于种子图像处理的大
数目玉米品种形态识别[J]. 作物学报. 2008,34(6) :
1069 - 1073
[3]Shouche S P,Rastogi R,Bhagwat S G,et al. Shape analysis
of grains of Indian wheat varieties[J]. Computers and Elec-
tronics in Agriculture,2001,33(1) :55 - 76
[4]何胜美,李仲来,何中虎 . 基于图像识别的小麦品种
分类研究[J]. 中国农业科学 . 2005,38(9) :1869 -
1875
[5]Zapotoczny P. Discrimination of wheat grain varieties using
image analysis and neural networks. Part I. Single kernel
texture[J]. Journal of Cereal Science,2011,54:60 - 68
[6]Pourreza A,Pourreza H,Abbaspour - Fard M H,et al. I-
dentification of nine Iranian wheat seed varieties by textural
analysis with image processing[J]. Computers and Electron-
ics in Agriculture,2012,83:102 - 108
[7]Delwiche S R,Yang I C,Graybosch R A. Multiple view im-
age analysis of freefalling U. S. wheat grains for damage as-
sessment[J]. Computers and Electronics in Agriculture,
2013,98:62 - 73
[8]郝建平,杨锦忠,杜天庆,等. 基于图像处理的玉米品种
的种子形态分析及其分类研究[J]. 中国农业科学,2008,
41(4) :994 - 1002
[9]韩仲志,赵友刚. 基于外观特征识别的花生品质与品种
检测方法[J]. 中国粮油学报,2009,24(5) :123 - 126
[10]程轶波. Photoshop 图像处理技巧[J]. 中国科技信息,
2009,(1) :328 - 354
[11]黄晓韵,曹波,杨跃. 基于 SAS 的多元统计方法实现芯
片数据挖掘[J]. 生物信息学,2010,8(2) :147 - 149
[12]刘娟,崔树起,吕曼,等. 基于非参数交互证实判别分
析法建社区脑膜炎诊断模型[J]. 数理医药学杂志,
2010:23(1) :8 - 10
[13]Manickavasagan A,Sathya G,Jayas D S,et al. Wheat
class identification using monochrome images[J]. Journal of
Cereal Science,2008,47 (3) :518 - 527
[14]刘光蓉,管庶安,周红. 基于图象处理技术的大米色泽检
测[J]. 粮食和饲料,2006(1) :8 - 9
[15]Wiwart M,Suchowilska E,Lajszner W,et al. Identification
of hybrids of spelt and wheat and their parental forms using
shape and color descriptors[J]. Computers and Electronics
in Agriculture,2012,83:68 - 76
[16]孙振球. 医学统计学(第三版) [M]. 北京:人民卫生出
版社,2010
[17]赵钢,陕方. 中国苦荞[M]. 北京:科学出版社,2009.
The Cultivar Discrimination of Tartary
Buckwheat Based on Image Processing
Zhang Qiang
(College of Life Sciences,Shanxi Normal University,Linfen 041004)
Abstract The objective of this study is to establish a correct discriminant method for tartary buckwheat seeds
of different varieties. The experiment used 11 different varieties of tartary buckwheat seeds as research materials,
used a scanner to obtain seed color images,extracted 28 characteristic variables of each seed through image process-
ing software,and then established a matrix which contains 12 320 data of 11 varieties,440 tartary buckwheat seeds.
The discriminant model was constructed by using the effective characteristics variables which has been screened
through the stepwish method. The results showed that the color is the main variable in 18 variables selected for tartary
buckwheat varieties identifying. The Bayes discriminant model was established with the combination of color and
shape variables. Its accuracy of back substitution is 96. 8%,and the accuracy of cross validation is 94. 7% . By u-
sing computer image processing technology and modern statistical methods can extract and analyse buckwheat seed
color and shape effectively. It is an objective,accurate and effective method for tartary buckwheat seeds classifica-
tion.
Key words image processing,tartary buckwheat,varieties,discriminant analysis
231