免费文献传递   相关文献

红毛丹色泽品质的计算机视觉分级技术研究



全 文 :第 21卷 第 11期
2005年 11月
农 业 工 程 学 报
T ransactions o f the CS AE
Vo l. 21  No. 11
Nov .  2005
红毛丹色泽品质的计算机视觉分级技术研究
章程辉 1, 3 , 刘木华2 , 王 群3
( 1.中国热带农业科学院分析测试中心 ,海口 571101;  2.江西农业大学工学院 ,
南昌 330045;  3.中国农业大学食品科学与营养工程学院 ,北京 100083)
摘 要: 应用计算机视觉研究了红毛丹外观色泽品质的分级检测技术。通过 CCD采集红毛丹可见光图像 ,经 OS TU分割算
法来分割图像背景后 ,采用面积标记算法得到去除长穗梗区域的红毛丹图像 ;然后提取基于色度的红毛丹图像的彩色纹理
特征 ,并用多分类支持向量机的模式识别方法来识别红毛丹色泽等级。结果表明 ,该模型对 4个色泽等级的红毛丹的正确分
类率分别是 94% 、 88% 、 89%和 95% ,且具有较好的稳定性。与人工神经网络方法预测结果比较 ,该方法具有速度快、识别能
力强的特点。
关键词: 红毛丹 ; 图像处理 ; 色泽 ; 支持向量机
中图分类号: T P391; TP183    文献标识码: A    文章编号: 1002-6819( 2005) 11-0108-04
章程辉 ,刘木华 ,王 群 .红毛丹色泽品质的计算机视觉分级技术研究 [ J].农业工程学报 , 2005, 21( 11): 108- 111.
Zhang Chenghui, Liu Muhua , Wang Qun. Determination of co lo r quality of rambutan based on com puter v ision [ J ].
T ransac tions of th e CSAE, 2005, 21( 11): 108- 111. (in Chinese w ith Eng lish abstr act)
收稿日期: 2004-12-31 修订日期: 2005-06-19
基金项目: 科技部 2004年度科研院所社会公益研究专项资金项目
( 2004DIB5 J172)
作者简介:章程辉 ,男 ,副研究员 ,博士生 ,主要研究方向为热带水果
无损检测 ,海口 中国热带农业科学院分析测试中心 , 571101。
Emai l: zch lm@ 163. com
0 引 言
红毛丹又名毛荔枝 ,学名 Nephelium lap paceum
L. ,无患子科 ( Sapindaceae )韶子属 (Nephelium )植
物。红毛丹果实根据果皮颜色分为红果、黄果和粉红果
3个类型 ,在海南岛 ,果实 6~ 8月成熟。红毛丹是著名的
热带水果 ,其外观美 ,营养丰富 ,味甜或酸甜 ,带荔枝或
葡萄风味 ,可口怡人 ,品质优 ,是热带特色水果之一。 红
毛丹的外观品质包括果形、颜色、穗梗、病虫害及缺陷等
几个方面。由于病虫害及缺陷均可表现为颜色上的变
化 ,如虫害和碰伤缺陷都表现为颜色偏黑 ,所以红毛丹
的颜色、病虫害及缺陷指标可用色泽特征来检测。
目前 ,计算机视觉技术在农业中得到广泛的应用 ,
其中研究比较多的是农产品的品质检验。 付峰等
( 2004) [1 ]通过分析柑橘在 6个位置采集的 3种不同尺
寸、 19种不同表面颜色的标准试验球体的图像 ,研究了
球体的大小、表面颜色和图像采集位置等因素对球体图
像灰度失真的影响 ,并分别建立了位于摄像视区中心的
球体图像的灰度校正模型和偏离摄像视区中心的球体
图像的灰度校正模型 ,模型的相关系数 R2分别为 0. 796
和 0. 842。应义斌等 ( 2004) [2 ]利用协方差矩阵和样本属
于黄色和绿色的概率来判断柑橘成熟度 ,其判别准确率
达到 91. 67%。应义斌等 ( 1999) [3 ]对黄花梨进行了机器
视觉技术检测外形尺寸与表现状况的试验研究 ,通过确
定图像处理窗口、利用 Sobel算子和 Hilditch细化边缘 ,
确定形心点找出代表果径 ,其预测果径值与实际尺寸的
相关系数达 0. 96。对检测果面缺陷 ,提出利用红 ( R)、绿
( G)、色彩分量在坏损与非坏损交界出的突变 ,求出可
疑点 ,再经区域增长确定出整个受损面 ,试验对比表明
该算法精确。包晓安等 ( 2004) [4 ]采用改进的 LV Q网络
算法 ,对苹果进行等级判别试验 ,识别准确率达 88. 9% ,
且具有较好的稳定性。计算机视觉技术在热带水果外部
品质检测方面 ,王江枫、罗锡文等 ( 1997) [5 ]利用计算机
视觉技术进行芒果重量及果面坏损检测 ,分析确定了所
需图像区域的算法 ,试验证明此方法对果面坏损分级准
确率为 80% 。在对水果品质分类时 ,目前较多地应用人
工神经网络等模式识别方法 ,但存在过学习、局部极小
点等问题。 支持向量机 ( Suppo rt V ector Machine )是
V apnik等人根据统计学理论提出的一种新的通用学习
方法 ,它是建立在统计学理论的 VC维 ( Vapnik-
Cherv onenks Dimension )理论和结构风险最小原理
( Structural Risk Minimiza tion Inductiv e Principle )基
础上的 ,能较好地解决小样本、非线性、高维数和局部极
小点等实际问题 [ 6, 7] ,已成为机器学习界的研究热点之
一 ,并成功的应用于分类、函数逼近和时间序列预测等
方面。 当前 ,对于热带水果红毛丹的计算机视觉检测国
内外尚未开展相关的研究。本文对单个红毛丹样品的静
态分级原理进行研究 ,主要研究红毛丹静态分级所采用
的图像处理方法 ,同时为了使分类模型具有良好的可推
广性 ,研究了基于支持向量机的红毛丹等级分类方法 ,
为今后研究红毛丹的动态检测打下了基础。
1 材料与方法
1. 1 试验样本
红毛丹样本来自海南省保亭县 ,样本总数为 192
颗。试验时 ,首先由专业分级员将红毛丹样本按色泽分
成优等品、一等品、二等品和次品 4个等级 ,然后利用如
图 1所示的试验装置采集所有样本的图像。
108
1. 2 试验装置与设备
试验装置如图 1所示 ,该系统由 CCD摄像机、图像
采集卡、监视器、光照箱、及计算机等组成。 红毛丹样本
置于 6上 ,由于果实呈椭圆形或卵圆形 ,每个样本以长
轴为旋转轴 ,每间隔 120°拍摄一幅图像 ,每个样本所得
的 3幅图像分别进行处理。
图 1 红毛丹图像采集装置
Fig. 1  Diag ram o f appar atus fo r a cquiring
rambutan images by machine vision
2 图像处理及模式识别方法
2. 1 图像处理方法
红毛丹色泽以表面着色程度和刺毛完整性来表征。
图 2为优等、一等、二等和次等的典型果实图像。
从图 2中可以很容易看出色泽和刺毛完整性的变
化。优等色泽鲜艳、次等色泽很暗 ;优等果实的刺毛鲜艳
完整 ,等级越低则刺毛越来越疏少。 光照箱中背景颜色
是用以衬托红毛丹 ,使在所采集的图像中 ,红毛丹的特
征 (包括大小、形状、轮廓、颜色、等 )能明显地区别于背
景 ,这样就可以容易地使水果与背景分开 ,提取水果图
像的特征 ,为进一步进行水果的分级打下基础。 本文选
择红毛丹图像背景为淡绿色 ,淡绿色背景一方面便于将
各等级的红毛丹从背景中分割出来 ,同时也利于将穗梗
从红毛丹个体中分割出来。
图 2 典型红毛丹果实图像
Fig. 2  Images of typical rambutan
2. 1. 1 背景分割
分析红毛丹图像的 R、 G、 B分量直方图如图 3所
示。 G、 B分量可以将图像分割为两部分: 值低的部分代
表背景 (包括部分穗梗区域 ) ,值高的部分代表红毛丹个
体。这里选用 G分量的灰度值 ,采用最大方差自动取阈
值法 ( O STU)分割算法来分割图像背景。 图 4a经背景
分割后的图像如图 4b所示。
图 3  RGB分量直方图
Fig. 3  Histo g ram o f RGB levels of rambutan image
2. 1. 2 果实区域分割
将分割出背景的图像转变为二值图像 (图 5a)。从图
中可以看出长穗梗基本上可以与红毛丹分离开来 ,短穗
梗与红毛丹有一定粘连。首先采用面积标记算法得到图
像中面积最大的区域。然后将得到的二值图像与原始红
毛丹图像进行与操作 ,这样得到去除大部分长穗梗区域
的红毛丹图像 (图 5b)。选择红毛丹图像背景为淡绿色 ,
通过对 192个样本图像分割操作表明 ,果实区域能完全
分割出来。
109 第 11期 章程辉等:红毛丹色泽品质的计算机视觉分级技术研究
图 4 去除背景前后的红毛丹果实图像
Fig. 4  Rambutan images befo re and
a fter removing backg round
图 5 红毛丹的二值图像和去除大部分长穗梗的红毛丹图像
Fig . 5  Bina ry value image of r ambutan and color
rambutan image after remov ing stem
2. 2 红毛丹彩色纹理特征提取
颜色和纹理是图像分析和模式识别的两个重要属
性。本文应用 Geo rge Paschos[ 8]提出的基于色度的彩色
纹理分析方法 ,该方法计算简单、但很有效。
在 CIE XYZ颜色空间中 ,其刺激值 X、 Y、 Z可由图
像的 R、 G、 B转换得到 (本文采用 PAL制式系统 ) ,由
XYZ经计算得到色度值 x、 y、z [ 9] ,由于色度值 z = 1 -
x - y ,它并不是独立变量 ,所以一般只考虑色度值 x、
y。 CIE XYZ颜色空间中图像的像素点的色度值 ( x ,y )
对应于二维欧氏坐标空间点的集合。(x , y )点的集合称
为色度图。设图像像素总数为 N ,定义一幅图像的色度
图的迹为
T ( x , y ) =
1  ( x , y )出现
0  ( x , y )未出现 ( 1)
一幅图像中可能有多个像素点拥有同样的 ( x ,y )
色度值 ,因此可做出基于色度空间的二维色度分布直方
图。二维色度分布直方图定义为
D (x , y ) = nk ( 2)
式中 nk—— ( x ,y )出现的个数。
图像的色度图的迹和二维色度分布直方图可以用
(p ,q )阶色度矩来表征。定义:
mtpq = ∑Xs- 1
x= 0
∑Ys - 1
y= 0
x p yq T (x , y ) ( 3)
mdpq = ∑Xs- 1
x= 0
∑Ys - 1
y= 0
x
p
y
q
D( x , y ) ( 4)
式中 p ,q = 0, 1, 2,…… ; Xx ,Ys—— x - y空间的离
散维数 , Xs = Ys = 100,x = [x× 100 ], y = [y× 100 ]。
mt和 md在一定程度上反映了整个图像颜色中某种色
度存在与否以及色度分量的分布特性。
由上述定义可知 ,mt、md在一定程度上反映整个
图像颜色的“多彩”性和色度分量的分布特性。相似的
纹理图像具有相近的色度矩 ,不同的纹理图像色度矩存
在差异 ,故色度矩可表征一幅彩色纹理图像。
选 择 mt 01、mt 10、mt 11、mt 21、mt 12、mt 03、mt 30、md02、
md20、md11、md30、md03、md12、md21作为图像纹理特征。
2. 3 支持向量机 ( SVM)模式识别方法
SVM是从线性可分情况下的最优分类面发展而来
的。对非线性问题 ,可以通过非线性变换转化为某个高
维空间中的线性问题 ,在变换空间求最优分类面。 这一
特点提供了解决算法可能导致的“维数灾难”问题的方
法:在构造判别函数时 ,不是对输入空间的样本作非线
性变换 ,然后在特征空间中求解 ;而是先在输入空间比
较向量 (例如求点积或是某种距离 ) ,对结果再作非线性
变换。 这样 ,大的工作量将在输入空间而不是在高维特
征空间中完成。 SVM分类函数形式上类似于一个神经
网络 ,输出是 s中间节点的线性组合 ,每个中间节点对
应一个支持向量 ,如图 6所示。函数 K称为点积的卷积
核函数 ,它可以看作在样本之间定义的一种距离。
图 6 支持向量机示意图
Fig . 6  Diagr am o f suppo r t v ecto r machine
图 7 四类问题的决策导向无环图
Fig . 7  Decision directed acyclic g raph
o f four types of questions
基本的 SVM算法是针对两类的分类情况 ,对于多
类模式识别问题 ,则需要构造 SVM多类分类器。本文采
用“一对一”的算法。对于 N类问题构造所有可能的两类
分类器 ,每个分类器仅仅对 N类中的某 2类训练样本进
行训练 ,则要构造 N ( N - 1) /2个分类器。组合这些分
类器并使用投票法 ,得票最多的类即为样本所属的类。
对于“一对一”的算法 , Pla t t等人提出了一种基于决策
导向无环图 ( Decision Directed Acyclic Graph )的快速
110 农业工程学报 2005年 
有效算法 ,称为 DAGSVM算法。 对于 N类问题 ,共有
N (N - 1) /2个结点 ,一个结点对应一个分类器。这些
结点按只有一个根结点的三角形排列 ,第 1层为根结
点 ,第 2层有两个结点 ,第 3层为 3个结点 ,以此类推。一
个 4类问题的决策导向无环图如图 7所示。
4 试验结果与分析
设计 4× ( 4- 1) /2= 6个两类分类器 ,分别用于将
两个级别两两分开。 支持向量机核函数为径向基函
数 [8 ]
K (x i ,x j ) = exp(-
‖ xi - x j‖ 2
2e2 ) ( 5)
式中  xi、 xj—— 192× 14的输入向量 ( 192个训练样本
的图像纹理特征 ) ; e—— 核函数宽度参数。本文选择为
e,错分惩罚常数 C = 100,构造Δ- 间隔分类超平面。训
练结果如表 1所示。 同时应用 BP人工神经网络
( M ATLAB神经网络工具箱 )在同一批数据上完成训
练。从训练时间来看 , BP人工神经网络所需时间是支持
向量机方法的近 20倍 ;从正确识别率来看 , BP人工神
经网络为 88% ,而支持向量机方法的平均正确率为 ( 94
+ 88+ 89+ 95) /4= 91. 5% 。
表 1 测试样本训练结果
Table 1  Result s o f SV M class
品质级别 训练样本 正确识别样本 正确识别率 /%
优等 48 45 94
一等 48 42 88
二等 48 43 89
次品 48 46 95
5 结 论
本文通过应用计算机视觉研究了红毛丹外观色泽
品质的检测技术。 结论如下:
1)通过分析和试验验证发现淡绿色背景下图像能
比较准确地反映红毛丹的特征细节 ,而且果体图像易于
与背景进行分割 ,同时也有利于将穗梗从红毛丹个体中
分割出来。
2)用最大方差自动取阈值法 ( O STU)能有效地分
割红毛丹图像背景。面积标记算法能得到去除长穗梗区
域的红毛丹图像 ;
3)基于色度的彩色纹理能有效地表征红毛丹外观
色泽的本质特征 ;用支持向量机模型对 4个等级的红毛
丹的正确分类率为 94%、 88%、 89% 、 95% 。同时笔者对
结果进行反复试验验证表明其具有较好的稳定性。
4) 支持向量机算法是基于二次寻优的问题 ,得到
的将是全局最优解 ,有效避免了神经网络易陷入局部极
值问题 ,同时通过非线性变换和核函数巧妙解决了高维
数问题 ,使得其算法复杂度与样本维数无关 ,加速了训
练学习速度。本文的试验结果也证明了这点。
[参 考 文 献 ]
[1] 付 峰 ,应义斌 .球体图像灰度变换模型及其在柑桔图像
校正中的应用 [ J].农业工程学报 , 2004, 20( 4): 117- 120.
[2 ] 应义斌 ,饶秀勤 ,马俊福 .柑橘成熟度机器视觉无损检测方
法研究 [ J].农业工程学报 , 2004, 20( 2): 144- 147.
[3 ] 应义斌 ,景寒松 ,马俊福 ,等 .机器视觉技术在黄花梨尺寸
和果面缺陷检测中的应用 [ J].农业工程学报 , 1999, 15( 1):
197- 200.
[4 ] 包晓安 ,张瑞林 ,钟乐海 .基于人工神经网络与图像处理的
苹果识别方法研究 [ J].农业工程学报 , 2004, 20( 3): 109-
112.
[5 ] 王江枫 ,罗锡文 ,等 .计算机视觉技术在芒果重量及果面坏
损检测中的应用 [ J].农业工程学报 , 1998, 14( 4): 186-
189.
[6 ]  Vladimir N. Vapnik著 ,张学工 译 .统计学习理论的本质
[M ].北京: 清华大学出版社 , 2000, 9.
[7] 张学工 .关于统计学习理论与支持向量机 [ J].自动化学
报 , 2000, ( 1): 32- 42.
[8]  Geo rge Paschos. Fa st co lo r tex tur e recognition using
ch roma ticity moments [ J]. Patte rn Recognition Le tters,
2000, 21: 837- 841.
[9]  Milan Sonka, Vaclav Hlavac , Roger Boy le. 图像处理、分
析与机器视觉 (第 2版 ) [M ].北京 :人民邮电出版社 , 2002.
[10 ] 刘木华 ,蔡健荣 ,周小梅 . X射线图像在农畜产品内部品质
无损检测中的应用 [ J].农机化研究 , 2004, ( 2): 193- 195.
Determination of color quality of rambutan based on computer vision
Zhang Chenghui
1, 3 , Liu Muhua
2 , Wang Qun
3
( 1. Analysis and Testing Center , Chinese Academy of Tropical Agricultural Sciences, Haikou 571101, China;
2. College of Engineering, J iangx i Agricultural University , N anchang 330045, China;
3. College of Food Science and Nutritional Engineering , China Agricultural University , Beijing 100083, China)
Abstract: In view o f draw backs o f rambutan g rade identi fica tion, w hich still relies on human sensory evalua tion,
the determination of colo r quali ty of rambutan based on computer v ision w as studied. The images of ranbutan
w ere obtained by CCD camera. Image processing alg orithm of O STU and area labeling were applied to 48
rambutan images in o rder to remove the images o f backg round and stem, and the tex ture features of colo r and
lust re w ere ex t racted. A multi-g rade suppo rt vecto r machine ( DAGSVM ) w as set up, and colo r and lustre
fea tures w ere the inputs of DAGSVM. The resul ts show that the accuracies o f four colo r g rades rambutan
recognized by SVM model were 94% , 88% , 89% , 95% respectiv ely wi th good stabili ty. The identification speed
and ability of this model a re much superior to algo ri thm neural netwo rk.
Key words: Rambutan; image processing; colo r and lust re; suppo rt vecto r machine
111 第 11期 章程辉等:红毛丹色泽品质的计算机视觉分级技术研究