免费文献传递   相关文献

离散小波特征提取及人工神经网络分类法的傅里叶变换红外光谱法识别鳞毛蕨科3种植物



全 文 :DOI:10. 3724 /SP. J. 1096. 2012. 10479
离散小波特征提取及人工神经网络分类法的
傅里叶变换红外光谱法识别鳞毛蕨科 3 种植物
余 鹏1 徐 锐2 程存归* 1
1(浙江师范大学化学与生命科学学院,金华 321004) 2(河南科技大学化学与制药学院,洛阳 471003)
摘 要 利用水平衰减全反射-傅里叶变换红外光谱法测定了 3 种药用鳞毛蕨科植物贯众、阔鳞鳞毛蕨和变
异鳞毛蕨根部的 FT-IR。运用基于离散小波多分辨率分析法对 FT-IR吸收较为相似的 3 种药用蕨类植物根的
FT-IR进行特征提取。选择第 4、5 分解层数的特征向量,进行人工神经网络(Artificial neural network,ANN)训
练;再用训练出来的网络对不同产地的 3 种药用蕨类植物根所得 FT-IR小波提取的特征向量进行分类。通过
对 240 个不同样本的预测,说明能够采用基于 FT-IR-离散小波特征提取及人工神经网络分类法对同科 3 种药
用蕨类植物根的 FT-IR进行识别。
关键词 水平衰减全反射傅里叶变换红外光谱;离散小波特征提取;人工神经网络;鳞毛蕨科植物;识别分析
2011-05-15 收稿;2011-09-09 接受
* E-mail:ccg@ zjnu. cn
1 引 言
随着现代科学技术的发展,学科之间的联系越来越密切,出现了许多相互交叉、相互渗透的边缘科
学。20 世纪 60 年代前后,在植物分类学与植物化学这两门科学之间出现了一门新的边缘科学———植
物化学分类学[1]。植物化学分类学亦称植物化学系统学,是利用化学的特征,来研究植物各类群间的
亲缘关系,探讨植物界的演化规律。对于一个植物体而言,其化学成分不是单一的,如何利用其复杂的
化学成分来进行物种间的鉴别成为一个植物化学分类学的焦点问题[2]。傅里叶变换红外光谱由于能
给出复杂体系的所有物质的化学结构信息,不同植物体具有不同的化学成分或相同的化学成分所占比
例的不同,都可以产生不同的傅里叶变换红外光谱,因而将傅里叶变换红外光谱技术作为一种分析工具
应用于植物的识别具有重要的理论意义和现实依据[3]。借助于化学计量学,能够更为准确和快速地利
用傅里叶变换红外光谱法进行植物的分类与识别[4 ~ 9]。
蕨类植物早在 4 亿年前便已遍布地球表面,它同时兼具原始维管束植物与高等隐花植物双重演化
的地位。大多数蕨类植物均有药用价值,药用蕨类植物含有黄酮、甾类、生物碱等活性物质,对多种疾病
有明显疗效[10]。本研究选择形态较为相似的 3 种鳞毛蕨科的中型草本植物贯众、阔鳞鳞毛蕨及变异鳞
毛蕨为分析对象,采用水平衰减全反射傅里叶变换红外光谱法测定 FT-IR 后运用离散小波进行特征提
取,得到特征向量值后进行人工神经网络训练及检验,得到了较高的识别率。
2 实验部分
2. 1 仪器与样品
NEXUS 670型傅里叶变换红外光谱仪(美国 Thermo公司),配 DTGS 检测器,OMNIC E. S. P. 5. 1智能操
作软件,水平衰减全反射(HATR)附件,光谱范围为 4000 ~650 cm1,分辨率 2 cm1,扫描累加次数 64次。
贯众为鳞毛蕨科植物贯众(Cyrtomium fortunei J. Sm)的干燥全草;阔鳞鳞毛蕨为鳞毛蕨科植物阔鳞
鳞毛蕨(Dryopteris championii (Bench)C. Chr. apud Ching)的干燥全草;变异鳞毛蕨为鳞毛蕨科植物变
异鳞毛蕨(Dryopteris varia (L.)O. Ktze.)的干燥全草。所有样品均于 2008 年 3 月分别采自于浙江金
华北山及四川峨眉山,并经过浙江师范大学植物学教研室及上海师范大学植物学教研室鉴定。将采得
的样品洗净,不经过任何化学处理,于避光处晾干。然后分别裁取样品的根部作为分析的对象,放入粉
第 40 卷
2012 年 3 月
分析化学 (FENXI HUAXUE) 研究报告
Chinese Journal of Analytical Chemistry
第 3 期
371 ~ 375
碎机中粉碎,再置于玛瑙研钵上研磨成约 75 !m的细小均匀粉末。准确称取每种样品 8 mg,待测。
2. 2 测定方法
在采集数据前,按要求将 HATR附件水平放置于傅里叶变换红外光谱仪的样品仓中,分别将样品
粉末置于锗晶片与校正压力装置之间,转紧压力装置后直接测定样品的 FT-IR。为了降低测定误差,每
次测定接触面积均固定为 0. 314 mm2,图谱基线采用自动校正法进行校正。
2. 3 数据处理
通过测定,得到样品的 FT-IR。采用 Matlab 6. 1 软件,对拷贝自实验中所给定的样品的 FT-IR 进行
一维离散小波变换,在各个分辨率下观察样品的 FT-IR差异程度,从中选择两个具有代表性的分辨率进
行提取特征向量值。进行人工神经网络识别时,以 3 种蕨类根部的 FT-IR 作为实验样本。样本的训练
集和测试集各选取 240 个,每种植物不同产地的训练数及预测样本数各选择 40 个,样本经过 FT-IR 测
定后进行一维离散小波特征提取,其所选择的特征向量值作为特征信息进行 ANN的训练与预测。
3 结果与讨论
3. 1 鳞毛蕨科 3 种植物根的 HATR-FTIR谱图比较
贯众、阔鳞鳞毛蕨和变异鳞毛蕨 3 种植物根部典型的 FT-IR如图 1 所示。
图 1 3 种蕨类植物根部的 FT-IR
Fig. 1 FT-IR spectra of the root of three kinds of pterido-
phyte plants
a. 贯众;b. 阔鳞鳞毛蕨;c. 变异鳞毛蕨。a. Cyrtomium for-
tunei J. Sm;b. Dryopteris championii (Bench)C. Chr. apud
Ching;c. Dryopteris varia (L.)O. Ktze.
从图 1可见,由于黄酮、甾类、生物碱、三萜类化合
物、鞣质、甾醇、内酯、氨基酸等是蕨类植物中主要的活
性物质,故在 3300 cm1均有羟基伸缩振动吸收峰,并
在 1030 ~1200 cm1间出现不同的 C O 键伸缩振动
吸收峰。在 3378 cm1处的吸收峰为三萜类、多糖类和
甾醇类化合物的羟基吸收峰。3328,1612 和 1434 cm1
处的吸收峰为氨基酸的氨基和酸根吸收峰。1031
cm1处为糖类的 C O 吸收峰,由于1031 cm1处的吸
收峰为第一强峰,可推断属多糖类化合物。在 2921 和
1373 cm1处的吸收峰为 CH2 和 CH3的吸收峰。
由于 3 种蕨类植物为同科植物,所含化学成分
比较相近,所以从所得 FT-IR 图谱很难直接获得更
多分类识别的信息。小波变换是继傅里叶变换后所
出现的一种更为有效的信号处理及特征提取方法,
素有“数学显微镜”之称。为了更为直观地识别 3 种
鳞毛蕨科植物,采用离散小波变换进行提取特征向量值。它能将图谱变换为一系列小波系数,这些系数
可以被高效压缩和存储。提取特征向量后进一步采用人工神经网络进行分类识别。
3. 2 3 种蕨类植物的离散小波特征提取
在进行离散小波分解时,应该根据信号的光谱特性选择适当的小波基函数和分解层数。在小波多分
辨率分解过程中,根据 HATR-FT-IR信号的特性并比较不同分辨率下信号分解的效果,确定合适的小波基
及小波尺度。其标准是突出原始光谱中的若干个特征峰,并选取平滑性好的小波基。常用的小波基有
Mexicon hat,Meyer,Morlet,Daubechies,Coiflet及 Symlets等(图 2)。以小波基形状与待分析信号形状是否
更接近及衰减信号是否更快作为选择的前提,经比较分析,选取了 Daubechies小波作为“分析小波”。本研
究提取小波域中原始信号 FT-IR中的两个特征峰,以提取其特征值。对3种蕨类植物的 FT-IR分别进行了
一维离散小波变换,分解的层数为 5。经过比较分析,选择其中两层(4和 5)提取特征值。
图 3 为利用离散小波变换分别对贯众、阔鳞鳞毛蕨及变异鳞毛蕨的 FT-IR 进行多分辨率离散小波
变换分解的结果。由图 3 可见,当离散小波变换的分辨率比较低时,从小波域上无法分辨其光谱的主要
特征,因为其中有较多的细节干扰信号。而细节信号对光谱变化比较敏感,对原始光谱中各个特征峰反
应过于强烈,不利于特征提取。因此,取第 4 层和第 5 层这 2 个分辨率的离散小波细节信号作为特征变
273 分 析 化 学 第 40 卷
图 2 小波基函数的曲线
Fig. 2 Wavelet basis function curves in time domain
(a)Mexicon hat wavelet;(b)Meyer wavelet;(c)Morlet wavelet;(d)Daubechies wavelet;(e)Coiflet wavelet;(f)Symlets wave-
let.
图 3 离散小波分解 3 种蕨类根部 FT-IR的结果
Fig. 3 Result of pre-processed spectra of FTIR spectra of the root of three kinds of pteridophyte plants with multiresolu-
tion discrite wavelet transform (DWT)
量提取空间。特征变量定义为离散小波域内第 4 层和第 5 层这 2 个分辨率下光谱的能量。为了有效提
取离散小波域内两个分辨率下的具有代表性的特征值,对每个分辨率下的光谱分别划分特征区间。考
373第 3 期 余 鹏等:离散小波特征提取及人工神经网络分类法的傅里叶变换红外光谱法识别鳞毛蕨科 3 种植物
虑到植物 FT-IR谱的复杂性,本研究从区别比较大的两个区域划分了特征区间(图 4)。由图 4 可见,第 4
层和第 5层每层划分为两个区域,每种植物共获得 4 个特征值,作为人工神经网络的输入与输出值。
图 4 3 种蕨类植物特征区间划分示意图
Fig. 4 Division of two feature regions of detail signal in DWT domain
a. 贯众;b. 阔鳞鳞毛蕨;c. 变异鳞毛蕨。a. Cyrtomium fortunei J. Sm;b. Dryopteris championii(Bench)
C. Chr. apud Ching;c. Dryopteris varia (L.)O. Ktze.
3. 3 反向传播(Back-propagation,BP)算法
由于本研究主要用于植物的分类和识别,故采用人工神经网络的反向传播(BP)网络模型。对于反
向传播神经元网络,当各节点均采用 Sigmoid 型函数时,一个隐含层就足以实现任意的判决分类问题。
采用本研究组已建立的算法[11],并采用随机输入方式。
3. 4 网络确定与应用结果
经实验确定 BP网络结构为 4 个输入节点、6 个隐层节点和 3 个输出节点,误差 0. 05,α 为 0. 8,
η为 0. 02。考察训练成功的网络对 3 种蕨类植物如何进行识别。所用的 BP 网络结构中 4 个输入节点
依次为归一化为 0 ~ 1 之间的 4 个特征向量,输出节点按作为教师信号的蕨类植物种类分为:1 类(贯
众) ;2 类(阔鳞鳞毛蕨) ;3 类(变异鳞毛蕨)。训练后的网络对 240 个不同产地样品的 FT-IR 经过离散
小波变换后的特征向量数据的预测结果见表 1。
表 1 样品数据的预测结果(%)
Table 1 Prediction resluts of samples data (%)
样品
Samples
产地
Place of origin
识别率
Recognition rate (%)
预测率
Prediction rate (%)
贯众
Cyrtomium fortunei J. Sm
浙江金华北山 Beishan,Zhejiang 100. 00 100. 00
四川峨眉山 Emeishan,Sichuan 100. 00 100. 00
阔鳞鳞毛蕨
Dryopteris championii
(Bench)C. Chr. apud Ching
浙江金华北山 Beishan,Zhejiang 100. 00 100. 00
四川峨眉山 Emeishan,Sichuan 100. 00 97. 50
变异鳞毛蕨
Dryopteris varia (L.)O. Ktze.
浙江金华北山 Beishan,Zhejiang 100. 00 100. 00
四川峨眉山 Emeishan,Sichuan 100. 00 97. 50
从预测结果可见,贯众、阔鳞鳞毛蕨及变异鳞毛蕨这 3 种蕨类植物均基本上被正确判别,只有采自
四川峨眉山的阔鳞鳞毛蕨和变异鳞毛蕨各有一个样本被错误分类,两产地的预测准确率平均值分别达
100. 00%,98. 75%和 98. 75%。
3. 5 结论
(1)蕨类植物作为药用多使用根部,考虑到根部受环境的影响相对比较小,所以研究时采用蕨类根
部作为实验对象;(2)与压片法及液膜法不同,利用 HATR-FT-IR法测定蕨类植物,能进行直接测定获得
谱图,从而使所得 FT-IR有较好的可比性。采用离散小波变换进行数据压缩可以对红外吸收较为相似
的贯众、阔鳞鳞毛蕨及变异鳞毛蕨 3 种蕨类植物的 FT-IR 进行特征提取。选择第 4 层和第 5 层分辨率
下的特征值作为分析的基础,从所得特征值进行人工神经网络分类能够较为有效地进行分类。此方法
在形态较为相似的同科植物贯众、阔鳞鳞毛蕨及变异鳞毛蕨 3种蕨类植物的分类上具有较高的可行性,从
而为光谱学与计算机科学技术相结合在植物分类学中的更为广泛的应用提供了较为科学的研究基础。
473 分 析 化 学 第 40 卷
References
1 LIU Shu-Qian,ZHENG Jun-Hua,GUO De-An,XU Bing-Jiu. Northwest Pharmaceutical J.,1999,14(5) :222 ~225
刘叔倩,郑俊华,果德安,徐秉玖. 西北药学杂志,1999,14(5) :222 ~ 225
2 HUANG Hao,SUN Su-Qin,XU Jin-wen,WANG Zhao. Spectrosc. Spec. Anal.,2003,23(2) :253 ~ 257
黄 昊,孙素琴,许锦文,王 钊. 光谱学与光谱分析,2003,23(2) :253 ~ 257
3 Lv H F,Cheng C G,Tang X,Hu Z H. Acta Bot. Sinica,2004,46(4) :401 ~ 406
4 CHENG Cun-Gui,TIAN Yu-Mei,ZHANG Chang-Jiang. Chinese J. Anal. Chem.,2008,36(8) :1051 ~ 1055
程存归,田玉梅,张长江. 分析化学,2008,36(8) :1051 ~ 1055
5 CHENG Cun-Gui,XIONG Wei,JIN Wen-Ying. Chinese J. Anal. Chem.,2009,37(5) :676 ~ 680
程存归,雄 玮,金文英. 分析化学,2009,37(5) :676 ~ 680
6 Cheng C G,Liu J,Zhang C J,Cai M Z,Xiong W. Appl. Spectros. Rev.,2010,45(2) :148 ~ 164
7 Cheng C G,L J,Wang H,Xiong W. Appl. Spectros. Rev.,2010,45(3) :165 ~ 178
8 CHENG C G,Liu J,Cao W Q,Zheng R W,Wang H,Zhang C J. Vib. Spectrosc.,2010,54(1) :50 ~ 55
9 CHEN Zhi-Cheng,LIU Jun-Xian,HUANG Shu-Shi,TAO Zhan-Hua,WANG Yi-Bing. Com. Appl. Chem.,2009,26
(4) :482 ~ 486
陈植成,刘军贤,黄庶识,陶站华,王一兵. 计算机与应用化学,2009,26(4) :482 ~ 486
10 CHENG Cun-Gui,MAO Jiao-Yan. Chem. Indu. Forest Prod.,2005,25(2) :107 ~ 110
程存归,毛姣艳. 林产化学与工业,2005,25(2) :107 ~ 110
11 CHENG Cun-Gui,Tian Yu-Mei,Zhang Chang-Jiang. Acta Chim. Sinica,2008,66(7) :793 ~ 798
程存归,田玉梅,张长江. 化学学报,2008,66(7) :793 ~ 798
Recognition Among Three Kinds of Pteridophyte Plants Based on
Fourier Transform Infrared-Discrete Wavelet Feature Extraction
and Artificial Neural Network Classification Method
YU Peng1,XU Rui2,CHENG Cun-Gui* 1
1(College of Chemistry and Life Science,Zhejiang Normal University,Jinhua 321004,China)
2(College of Chemical and Pharmaceutical Engineering,
Henan University of Science and Technology,Luoyang 471003,China)
Abstract Fourier transform infrared (FT-IR)and horizontal attenuated total reflectance (HATR)techniques
were used to obtain the FT-IR of three kinds of pteridophyte plants (the root of Cyrtomium fortunei J. Sm,
Dryopteris championii (Bench)C. Chr. apud Ching and Dryopteris varia (L.)O. Ktze.). The similar fea-
tures of FT-IR among the root of Cyrtomium fortunei J. Sm,Dryopteris championii (Bench)C. Chr. apud Ch-
ing and Dryopteris varia (L.)O. Ktze. were extracted by discrete wavelet transform. The scale 4 and 5 were
used to extract the feature vectors,which were used to train the artificial neural network(ANN). The trained
neural network was used to classify the root of Cyrtomium fortunei J. Sm,Dryopteris championii (Bench)C.
Chr. apud Ching and Dryopteris varia (L.)O. Ktze.,which were collected from different places. According
to 240 prediction samples,we could effectively identify the root of Cyrtomium fortunei J. Sm,Dryopteris cham-
pionii (Bench)C. Chr. apud Ching and Dryopteris varia (L.)O. Ktze. by FT-IR with discrete wavelet fea-
ture extraction and artificial neural network classification.
Keywords Horizontal attenuated total reflectance-Fourier transform infrared spectroscopy;Discrete wavelet
feature extraction;Artificial neural network;Dryopteridaceae plants;Identification analysis
(Received 15 May 2011;accepted 9 September 2011)
573第 3 期 余 鹏等:离散小波特征提取及人工神经网络分类法的傅里叶变换红外光谱法识别鳞毛蕨科 3 种植物