免费文献传递   相关文献

基于广义回归神经网络的薄荷属植物的分类识别



全 文 :
第 37卷第 2期 唐山师范学院学报 2015年 3月
Vol.37 No.2 Journal of Tangshan Normal University Mar. 2015
──────────
基金项目:龙岩学院校立服务海西项目(lyxy2011057)
收稿日期:2014-07-17
作者简介:黄劲潮(1980-),男,福建莆田人,硕士,讲师,研究方向为数据库、算法、网络安全。 -45-

基于广义回归神经网络的薄荷属植物的分类识别
黄劲潮
(龙岩学院 继续教育学院,福建 龙岩 364000)

摘 要:薄荷属植物易杂交以致多型性现象严重,对于薄荷属植物的分类主要采用分类检索表法或数量分
类法等,但这些方法花费的时间与物力较大。选取了薄荷属植物类别区分的一些强相关属性作为训练组,构建
了广义回归神经网络来对薄荷属植物进行分类、识别,在保证准确度的同时也兼顾了识别的速度。同时,该模
型也可用来识别薄荷属植物的某种属性是否与类别区分强相关。
关键词:GRNN;薄荷属;分类;识别
中图分类号:TP301.6 文献标识码:A 文章编号:1009-9115(2015)02-0045-04
DOI:10.3969/j.issn.1009-9115.2015.02.014

Classification and Recognition of Mentha Based On the Generalized
Regression Neural Network
HUANG Jin-Chao
(College of Continuing Education, Longyan University, Longyan 364000, China)

Abstract: Mentha is easily to hybrid that polymorphism phenomenon is serious, therefore, the classification of Mentha mainly
uses classification method or the number of classification and so on, but it spends a lot of time and effort of these methods. This paper
selects some strong related attributes of plant category distinctions of Mentha as the training set, constructs the Generalized Regression
Neural Network with mentors to classify and recognize Mentha, and ensures the accuracy and the recognition speed. At the same time,
the model can also be used to tell whether some certain attribute of Mint is strongly related with classification recognition or not.
Key Words: GRNN; Mentha; classification; recognition

薄荷属植物在我国分布广泛,由于其易杂交以致多
型性现象严重。对于薄荷属植物的分类和识别,不仅有
助于了解薄荷属植物的亲缘关系,对于农业生产和植物
学来说也是必不可少的工作。目前对于各种不同的薄荷
品种,主要使用分类检索表法作为鉴定方法[1];房海灵
提出一种可以利用数量分类学对薄荷属植物分类进行
研究的方法[2]。但这些方法都存在花费时间较多,需要
投入大量的财力物力的缺点。
本文采用有导师学习神经网络中的广义回归神经
网络(GRNN)来对薄荷属植物进行分类和识别。广义
回归神经网络作为一种有导师学习神经网络,它具有非
常好的学习能力。因此它被应用于许多领域中,研究者
多用它来解决拟合回归问题,实际上它也可以用于模式
识别、分类识别[3]。
1 广义回归神经网络概述
1.1 广义回归神经网络的结构
广义回归神经网络由 Specht 提出的,它是一种基
于非线性回归理论的前馈式神经网络模型。广义回归神
经网络来源于 RBF神经网络,是它的一个分支[4]。
广义回归神经网络和一般的 RBF 神经网络一样由
输入层、隐含层和输出层组成,它的结构如图 1所示。
输入层的工作是把样本数据输入到中间层隐含层,在输
入层不进行运算。在中间层拥有和训练集合样本数一样
多的神经元节,它使用欧氏距离函数作为权值函数(记
做||dist||),权值函数可以计算出输入层权值 IW1,1 与神
经网络输入值之间的距离,其中,隐含层的阀值是 b1。
第 37卷第 2期 唐山师范学院学报 2015年 3月
-46-
第二层采用径向基函数(一般采用高斯函数)作为传递
函数。神经网络第三层是输出层,它是线性的。输出层
采用规范化点积权函数(nprod)作为它的权函数,并
使用向量 n2 来计算网络,它使用向量 al 和权值矩阵
LW2,1每行元素的点积再除以向量 al的各元素之和得到
的了元素,并将算出的向量 n2输出给线性传递函数
a2 = purelin(n2),
最终得到神经网络的输出值[4]。

图 1 广义回归神经网络的结构
1.2 广义回归神经网络算法结构
广义回归神经网络的学习算法从结构上看,与 RBF
神经算法比较相似,主要区别在于第三层输出层。下面
给出广义回归神经网络算法与实现步骤。
1.2.1 确定第二层隐含层神经元的径向基函数
中心
不失去一般性意义,假设使用的训练集样本输入矩
阵 I和输出矩阵 O如下
11 12 1
21 22 2
1 2
=
Q
Q
C C CQ
i i i
i i i
I
i i i
       


  

(1a)
11 12 1
21 22 2
1 2
Q
Q
D D DQ
o o o
o o o
O
o o o
        


  

(1b)
在式(1)中,iab代表着第 b 个训练样本的第 a 个输
入变量;而 oab代表了第 b 个训练样本的第 a 个输出变
量;C代表输入变量的维数;D代表输出变量的维数;
Q为训练集含有的样本数量。
GRNN 的第二层隐含层拥有和训练集合样本数一
样多的神经元节,即如果有 Q 个隐含层神经元,那么
径向基函数中心为
C=P′ (2)
1.2.2 确定第二层隐含层的神经元阈值
如果有 Q 个隐含层神经元,那么相应的神经元阈
值为
F1=[f11,f12,…,f1Q] (3)
在式(3)中,
11 12 1
0.8326... Qf f f spread
   

spread代表了径向基函数的展开速度。
1.2.3 确定第二层与第三层之间权值
当 1、2 步骤中的第二层中的神经元的径向基函数
中心及神经元阈值确定后,二层神经元节的输出输出便
如式(4):
Vi=exp(-||C-oi||2b1), i=1,2,…,Q (4)
其中,oi =[oa1,oa2,…,oaR]代表了第 a 个训练样本矢量。
并记
vi=[ iv1 ,
iv2 ,…,
i
Qv ]。
广义回归神经网络中二层到与三层间的连接权重
值 w取为训练集的输出矩阵,如式(5):
W=o (5)
1.2.4 确定第三层输出层神经元节点输出值
当步骤 3中的二层到三层的连接权值确定后,根据
图 1结构图,就可以确定第三层神经元节点的输出值,
如式(6):
2,1
1
, 1,2, ,
i
i
Q
i
j
j
LW a
n i Q
a

   
 (6)
yi=purelin(ni)=ni , i=1,2,…,Q (7)
1.3 广义回归神经网络的优点
广义回归神经网络比起传统的 BP神经网络,具有
如下优点:
神经网络不需要迭代,只要单向训练就可以。
隐含层拥有和训练集合样本数一样多的神经元节,
意味着神经元节数量由训练样本集数量自行确定。
神经网络不同层间权重值由训练样本集确定,不用
黄劲潮:基于广义回归神经网络的薄荷属植物的分类识别
-47-
像 BP网络那样每次迭代后再修改权值。
第二层节点的激活函数一般使用高斯函数,它对输
入层输入信息有局部激活特效。他的特点是如果输入相
似于局部神经元节的特征的输入值吸引力特别强。
1.4 GRNN的 MATLAB工具箱函数
函数 newgrnn 用于创建一个 GRNN,其调用格式
如下:
Net= newgrnn(I, O spread)
其中,P 为网络输入向量;T 为网络目标向量;spread
代表了径向基函数的展开速度(默认为 1.0);net 为创
建好的 GRNN。
2 使用 GRNN对薄荷属进行分类识别
2.1 思路步骤
本文从下列两个方面对薄荷属的分类进行研究:
(1)利用 GRNN建立薄荷识别模型,并对模型的
性能进行评价。
(2)利用 GRNN建立薄荷不同属性及不同属性组
合与薄荷种类间的识别模型,并与(1)式中所建模型的进
行比较,可以识别薄荷属植物的某种属性是否与类别区
分强相关。
实现 GRNN 的模型建立及性能评价,大体上可以
分为以下几个步骤,如 2所示。

图 2 GRNN建模步骤
2.2 生成训练集与测试集
薄荷属从外观上看,主要区别在于它的叶片。薄
荷叶片的颜色、形状会随着不同的生长期而有所不同,
但在相同生长期的同类别(紫茎、青茎)之间,差异
不大[5]。最终我们挑选了种植较广的三种薄荷作为训练
样本:日本薄荷 Marvensis、椒样薄荷 M.piperita、留兰
香薄荷 Mspicata;同时我们选择样本叶片外观区别较为
明显的四种属性:叶片形状、叶片颜色、叶片长度和叶
片宽度作为输入样本属性。
现采集到 150组不同类型薄荷(三种薄荷各 50组)
叶片的 4种属性:形状、颜色、长度和宽度,样本编号
与 4 种属性的关系如图 3 所示(其中,样本编号 1-50
为 Marvensis, 51-100 为 M.piperita, 101-150 为
Mspicata)。根据图 1 点的排列分布,可以直观看出叶
片形状、长度、宽度三图中不同薄荷类型间有较好的
线性关系,而叶片颜色不同薄荷类型间呈现出非线性
的关系。

图 3 四种属性与样本编号
不失去一般性意义,这里采用随机法产生训练集与
测试集。如前文所述,iris_data.Mat 数据文件中包含两
个变量:features 和 classes,分别对应薄荷的属性及类
别。在各个类别的 50个样本中分别随机选取 40个样本
(三类共 120 个)构成训练集,剩余的 10 个样本(三
类共 30个)作为测试集。
2.3 建立模型
产生训练集及测试集后,利用 MATLAB 自带的神
经网络工具箱函数 newgrnn,进行 GRNN创建及仿真测
试。具体程序如下:
%% 模型建立
result_grnn = [];
time_grnn = [];
for a = 1:4
第 37卷第 2期 唐山师范学院学报 2015年 3月
-48-
for b = a:4
I_train =I_train(a:b,:);
I_test = I_test(a:b,:);
%% GRNN建模与测试
t = cputime;
%网络建立
net_grnn = newgrnn(I_train,O_train);
% 模拟仿真
O_sim_grnn = sim(net_grnn,i_test);
O_sim_grnn = round(o_sim_grnn);
O = cputime - o;
time_grnn = [time_grnn o];
result_grnn = [result_grnn O_sim_grnn];
end
end
2.4 性能评价
模型建立及仿真测试后,通过计算测试集的预测正
确率以及程序运行时间,便可以对模型的性能进行综合
评价。
其中 result_grnn为 30行 10列的矩阵,对应表 1中
的 10个模型。
表 1 十个模型的输入变量
编号 叶片形状 叶片颜色 叶片长度 叶片宽度
1 ○
2 ○ ○
3 ○ ○ ○
4 ○ ○ ○ ○
5 ○
6 ○ ○
7 ○ ○
8 ○
9 ○ ○
10 ○
其中,“○”标示对应的输入属性参与模型的建立。
2.5 结果分析
由于训练集和测试集是随机产生的,因此每次运行
时的结果亦会有所不同。图 4、图 5所示为某次程序运
行所得结果。从图 4可以发现,GRNN模型 30次预测,
27次命中,测试集预测正确率达 90.0%,具有良好的泛
化能力。从图 5 看出,GRNN 10 个模型的平运行时间
在 50 ms左右,速度较快。
如表 1 所列,利用 4 个属性(叶片形状、叶片颜
色、叶片长度、叶片宽度)建立的模型编号分别为 1、
5、8、10。表 2描述了与之对应的 GRNN模型的测试
集正确率。
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
测试集样品编号
真实值
GRNN预测值
1
2
3
10

图 4 测试集预测结果
1 2 3 4 5 6 7 8 9 10
模型编号
0
0.05
0.10
0.15
0.20
0.25
GRNN

图 5 十个模型运行时间
表 2 四属性分布建立的模型测试集正确率
模型编号 1 5 8 10
GRNN 0.900 0 0.366 7 0.766 7 0.933 3
由表 2 中可以看出,叶片颜色单独建立的 GRNN
模型(模型编号为 5)性能不佳,正确率只有 36.7%;
用叶片形状、叶片宽度和叶片长度单独建立的 GRNN
型(模型编号分别为 1、8和 10)性能较好,正确率分
别达 90.0%、76.7%和 93.3%。这表明叶片颜色与薄荷
类别的相关性较小,而叶片形状、叶片宽度和叶片长度
与薄荷类别的相关性较大,该结论与图 3中呈现的规律
一致。
3 总结
GRNN具有良好的泛化性能,其权值和阈值由训练
样本一步确定,无须迭代,计算量小。本文首先参考文
献,选取了 150 组薄荷属植物(3 种不同的薄荷各 50
组)的 4种属性:叶片形状、叶片颜色、叶片长度和叶
片宽度,作为构建 GRNN神经网络的训练与测试样本,
建立了基于 GRNN 的薄荷属种类识别模型,进一步对
薄荷属植物进行分类;同时建立了各个属性及属性组合
与薄荷属类的识别模型,探求各个属性及属性组合与薄
荷属种类的相关程度。得到构建后的 GRNN 模型与薄
荷属植物强相关属性或属性组合后,只需要对新的薄荷
属植物测量该强相关属性组合值,就可以较为准确的对
新植物进行识别。
应当看到,作为训练组所选取的(下转第 64页)
第 37卷第 2期 唐山师范学院学报 2015年 3月
-64-
式的数字化学习环境,建立师生互动的新型教学模式。
如网络教学平台、实践教学信息平台,同步课堂,在线
学习,在线考试等。
资源类应用:指提供教育用资源以及内容的应用。
如教育资源库,资源汇聚,数字图书馆、数字档案馆、
数字博物馆等。
行政类应用:指从教育部门或学校的行政职能部门
需要完成的一些管理活动所需要的功能群。如办公自动
化系统,教务管理系统,科技管理系统,决策支撑系统,
学生综合管理,人力资源管理,资产设备管理,学报管
理,图书馆里,后勤服务管理,校园一卡通管理等。
个人类应用:个人类应用是指个人交流类应用。如
博客,社区交友,即时消息,家校互联等。
3.4 用户对象
平台针对的用户群体对象有:教育主管部门,学校,
班级,教研室,家庭,应用及内容厂商。
用户个体对象有:教育部门工作人员,教师,学生,
家长,各组织单位以及厂商管理员。
4 结束语
基于云环境下数字化校园建设,旨在通过云环境提
供各种资源管理和服务,建立一个服务学校教学、科研
和管理的“数字校园基础公共服务平台”,以解决其功
能众多,分布异构,数据处理复杂,硬件更新频繁,软
件安装繁琐和数据安全凸显等问题,及改善学校在教
学、管理及科研建设方面所遇到的困境。本文针对字化
校园建设中存在的问题,利用云环境功能及应用,对学
校的数字化校园建设提出了架构建设思路。
[参考文献]
[1] 王颢翔.数字化校园信息规划方法研究[D].西安:西安建筑
科技大学,2010.
[2] 薛静.基于虚拟化的云计算平台安全机制研究[D].西安:西
北大学,2010.
[3] 孟祥宇,刘云飞,吴军.构建数字化校园与学习环境的对策
探讨[J].信息与电脑,2011(1):146.
[4] 尹显雄.基于 SOA架构的数字化校园建设方案设计及实践
[D].北京:北京邮电大学,2012.
[5] 史寿乐,余鸣,周国正,等.数字化校园的规划与实现[J].电脑
知识与技术,2011(4):937-938.
[6] 王鹏.走进云计算[M].北京:人民邮电出版社,2009:6.

(责任编辑、校对:田敬军)




(上接第 48 页)薄荷的种类数量、样本组数、强相关
属性越多,构建出的 GRNN 模型预测的精度越高。同
时,该模型也可作为筛选薄荷属植物强相关属性的一种
方法。
[参考文献]
[1] 乐云辰.薄荷属不同植物品种遗传关系分析[D].上海:上海
交通大学,2008.
[2] 房海灵.薄荷属植物的数量分类[J].安徽农业科学,2007,35
(26):8181-8183.
[3] 史峰,王辉,胡斐,郁磊.MATLAB 智能算法 30 个案例分析
[M].北京航空航天大学出版社,2011.
[4] 裴亚丹.基于多目视觉的适境计算理论研究.[D].北京:北京
交通大学,2012.
[5] 张永清,刘合刚.药用植物栽培学[M].北京:中国中医药出版
社, 2013:372-380.

(责任编辑、校对:田敬军)