免费文献传递   相关文献

利用主成分分析和神经网络鉴别4种唇形科药材



全 文 :尚可见棕色块。见图 6。
图 6 龙珠果全草粉末显微特征详图
1. 叶上表皮细胞 2. 叶下表皮细胞及气孔 3. 非腺毛
4. 导管 5. 草酸钙簇晶 6. 纤维 7. 石细胞 8. 草酸钙
方晶 9. 色素块 10. 花粉粒
3 小结
龙珠果根横切面中皮层较宽,薄壁细胞中可见
石细胞;茎横切面中可见非腺毛,皮层较窄,其间有
数个纤维束排列成环,薄壁细胞中可见草酸钙簇晶;
全草粉末中非腺毛多,顶端尖,表面有疣状突起,纤
维细胞壁增厚明显,石细胞较多,孔沟明显,可见草
酸钙簇晶及砂晶,偶见方晶,尚可见棕色块。以上特
征可作为龙珠果的显微鉴定依据,并为该药材的质
量评价提供了参考。
参 考 文 献
[1] 国家中医药管理局《中华本草》编委会 . 中华本草
[M].第五册 . 上海:上海科学技术出版社,1999:478-
479.
[2]中国科学院中国植物志编辑委员会 . 中国植物志[M].
第五十二卷第一分册 . 北京:科学出版社,1999:111.
利用主成分分析和神经网络鉴别 4 种唇形科药材
于 生,孙文君,单鸣秋,姚卫峰,张 丽,丁安伟*
(南京中医药大学 /江苏省方剂高技术研究重点实验室,江苏 南京 210046)
摘要 目的:提出了一种用紫外-可见光谱技术快速鉴别 4 种唇形科药材(薄荷、荆芥、香薷及广藿香)的新方
法。方法:首先用主成分分析法对 4 种药材进行聚类分析并获取他们的紫外-可见指纹图谱,再结合人工神经网络
技术进行品种鉴别。结果:主成分分析表明,主成分 1 和主成分 2 的累积可信度已达 99%,以主成分 1 和 2 对所有
建模样本的得分值做出的得分图,对 4 种药材具有良好的区分作用。利用对于 4 种药材品种敏感的特征波段作为
神经网络的输入建立三层 BP人工神经网络模型。对未知的 20 个样本进行预测,品种识别准确率达到 100%。结
论:该方法具有很好的分类和鉴别作用,为以上 4 种唇形科药材的品种鉴别提供了一种新方法。
关键词 紫外-可见光谱;主成分分析;人工神经网络;唇形科;聚类
中图分类号:R282. 5 文献标识码:A 文章编号:1001-4454(2012)03-0393-03
收稿日期:2011-11-07
基金项目:国家中医药行业科技专项(201007012-1-7) ;江苏省中医药管理局科技计划项目(LZ11198)
作者简介:于生(1980-) ,女,实验师,研究方向:中药分析;Tel:025-85811839,E-mail:yusheng1219@ sina. com。
* 通讯作者:丁安伟,Tel:025-85811523,E-mail:awding105@ 163. com。
薄荷(Menthae Haplocalycis Herba)、荆芥(Schi-
zonepatae Herba)、香薷(Moslae Herba)与广藿香
(Pogostemonis Herba)均为唇形科植物,为临床常用
的芳香解表类中药材,由于属于同科植物,而且其药
用部位均为原植物的干燥地上部分,经过加工炮制
后从外观上较难鉴别区分。但这 4 种药材的性味归
经、功效及主治各有不同,因此临床使用时必须严格
区分。
中药所含成分类型、不饱和度、含量的差异,从
而导致 UV-Vis其吸收曲线的形态、峰位、峰强度亦
异,以此达到鉴别目的。目前常用的方法主要有直
接光谱法、导数光谱法及多溶剂谱线组法等,已广泛
用于中药材及中药制剂的鉴别,如新疆贝母〔1〕、云
南白药〔2〕、积雪草〔3〕等等。
本研究建立了一种基于主成分分析和神经网络
鉴别唇形科该 4 种药材的紫外-可见光谱模型,借助
这个模型,可以很好地鉴别区分以上 4 种药材,并为
中药材的鉴别方法提供了新的思路。
1 材料与方法
1. 1 仪器与试药 岛津 UV-2401 型紫外-可见分
·393·Journal of Chinese Medicinal Materials 第 35 卷第 3 期 2012 年 3 月
DOI:10.13863/j.issn1001-4454.2012.03.021
光光度计,岛津 AY220 型电子天平(精确到 0. 1
mg) ,H66025T 型超声清洗机(无锡超声电子设备
厂) ,甲醇为色谱纯。药材经南京中医药大学中药
鉴定学教研室吴启南教授鉴定分别为唇形科植物薄
荷、荆芥、香薷与广藿香。详见表 1。
表 1 4 种药材采收信息表
药材 采收日期 来源 药材 采收日期 来源
薄荷 20100620 江苏东台 香薷 20100812 江苏南京
20100622 江苏南通 20100813 江西宜春
20100623 江苏宜兴 20100813 江西新余
20100625 安徽南陵 20100813 江西分宜
20100627 浙江长兴 20100820 江西分宜
荆芥 20101020 河北安国 广藿香 20101015 广东湛江
20101024 江苏泰州 20101022 广东湛江
20101022 安徽亳州 20101016 广东遂溪
20101027 江苏扬州 20101010 广东阳春
20101027 江苏宜兴 20101017 广东阳春
1. 2 供试品溶液的制备 取各药材 0. 5 g,精密称
定,置于 50 mL 具塞锥形瓶中,精密加入甲醇 20
mL,密塞,称定质量,超声处理(功率 250W,频率
50kHz)1 h,放冷,再称定质量,用甲醇补足减失的质
量,滤过,精密量取续滤液 1 mL,置 10 mL 量瓶中,
加甲醇定容至刻度,即得。
1. 3 光谱的获取 药材均按“1. 2”项下方法制备
供试品溶液,每份溶液均以甲醇为参比溶液,在 200
~ 800 nm范围内进行全波长扫描,光谱采样间隔为
0. 5 nm。光谱数据以 ASCⅡ码形式导出进行处理。
其中每批药材中随机抽取 6 份,每种药材得到 30 个
样本,4 种药材每种取 25 个样本,共 100 个样本作
为训练集,余下 20 个样本作为测试集。
1. 4 人工神经网络模型 建立了一个三层的人工
神经网络结构,隐含层的传递函数采用 Tansig 函
数,其余均采用 Purelin 函数。网络输入层节点数为
601、经多次实验确定隐含层节点数为 8,输出层节
点数为 1。目标误差为 0,网络指定参数中学习速率
为 0. 2,设定训练迭代次数为 1000 次。以上人工神
经网络的模型拟合采用 Matlab 6. 5 的神经网络工具
箱在 CPU为 DUO CORE 2. 1G,内存为 2G的笔记本
上进行运算。
2 结果与分析
2. 1 唇形科 4 种药材的紫外-可见光谱 4 种药材
的典型紫外-可见光谱曲线如图 1 所示。图 1 中横
坐标为波长,范围是 200 ~ 800 nm,纵坐标为吸光
度。从图 1 中可以看出,不同药材的光谱曲线有明
显区别,并具有一定的特征性和指纹性,这一差异为
唇形科 4 种药材鉴别奠定了数学基础。我们用 4 种
药材共 120 个样品作为建模样本,按照前述“供试
品溶液的制备”和“光谱的获取”方法获得其 UV-Vis
光谱,并转换成 ASCⅡ码,用主成分分析法对其聚
类。
图 1 4 种药材典型紫外-可见光谱图
1. 薄荷 2. 荆芥 3. 香薷 4. 广藿香
2. 2 主成分分析对不同品种进行聚类 对 4 种药
材薄荷、荆芥、香薷和广藿香各 5 批共 100 个样品所
组成的训练集进行主成分分析聚类。前三个主成分
的特征值及可信度如表 2 所示。
表 2 主成分特征值及可信度
主成分 PC1 PC2 PC3
可信度 95. 21% 4. 31% 0. 34%
由于前两个主成分的累计可信度已达 99%,所
以仅用前两个主成分基本可以表示原始光谱的主要
信息。
图 2 表示 100 个建模样本的主成分 1、2 得分
图,图中横坐标表示每个样本的第一主成分得分值,
纵坐标表示每个样本的第二主成分得分值。如图 2
所示,薄荷、荆芥、香薷和广藿香明显分成四类,说明
主成分 1、2 对 4 种药材有较好的区分作用。荆芥与
香薷均位于第一、二象限之间,所在区域较接近,但
各自 25 个样本仍聚类较好。另 2 种药材均位于 x
轴的下方,其中广藿香的 25 个样本聚类很好,紧密
的分布在图 2 的第四象限;薄荷的 25 个样本聚类虽
然不及前三者,但是也仅分布在第三象限。
2. 3 基于指纹图谱建立 BP 品种预测模型 全波
段从 200 ~ 800 nm共有 1201 个数据点。但是,采用
全光谱计算时,计算量大,而且有些区域样品的光谱
信息很弱,与样品的组成或性质间缺乏相关关系,不
能反映出不同药材之间的不同,对他们之间的差异
·493· Journal of Chinese Medicinal Materials 第 35 卷第 3 期 2012 年 3 月
图 2 100 个建模样本主成分 1、2 得分图
1. 薄荷 2. 荆芥 3. 香薷 4. 广藿香
没有或极少贡献。所以在主成分分析的基础上,选
取对 4 种药材较敏感的波段 200 ~ 500 nm共 601 个
数据点作为输入建立 BP品种预测模型。
通过调整网络参数得到最优的网络结构,从而
得到最优的预测模型,其结构为 601(输入)-8(隐
含)-1(输出)三层BP神经网络模型。该模型训练
图 3 训练过程中的均方误差
表 3 20 个未知样本的预测结果
预测样 预测值 真实值 预测样 预测值 真实值
(1) 1. 0149 1 (11) 2. 9644 3
(2) 1. 0107 1 (12) 2. 9973 3
(3) 1. 0080 1 (13) 2. 9830 3
(4) 1. 0024 1 (14) 2. 9940 3
(5) 1. 0044 1 (15) 2. 9804 3
(6) 1. 9996 2 (16) 3. 9999 4
(7) 2. 0054 2 (17) 3. 9999 4
(8) 1. 9957 2 (18) 4. 0006 4
(9) 2. 0198 2 (19) 4. 0002 4
(10) 2. 0192 2 (20) 4. 0005 4
注:1. 薄荷,2. 荆芥,3. 香薷,4. 广藿香
过程中的均方误差(MSE)值变化如图 3 所示,经 10
次迭代计算后的 MSE 为 2. 09 × 10 -30,已经远远满
足模型的预测要求。对测试集的 20 个未知样本进
行预测,结果如表 3 所示。设定 4 种药材的真实值
为,“1”代表薄荷,“2”代表荆芥,“3”代表香薷,“4”
代表广藿香。设定品种预测结果偏差在 ± 0. 1 以
内,为品种区分的界限。结果表明,所有未知样本都
未超出偏差范围,得到对未知样本预测的正确辨别
率为 100%。
3 结论
紫外-可见光谱法具有简单方便、快速、样品用
量少、重现性好、成本低等特点,是容易普及的仪器
分析方法。但是,目前用于中药鉴别方面的直接光
谱法、导数光谱法及多溶剂谱线组法,均为凭直观分
析谱图,只给出了定性结果,没有通过数学处理建立
模型定量鉴别。
主成分分析是多元统计中的一种数据挖掘技
术。在不丢失主要光谱信息的前提下选择为数较少
的新变量来代替原来较多的变量,解决了由于谱带
的重叠而无法分析的困难。BP 神经网络模型是一
个强有力的学习系统,能够实现输入与输出之间的
高度非线性映射。目前使用最多的是多层结构的误
差反向传播学习算法,并且已经证明此种模型可以
逼近任何连续的非线性曲线〔4〕。
本研究应用主成分分析结合人工神经网络建立
了唇形科 4 种药材鉴别的模型,该模型的预测效果
良好,识别率达到 100%。说明该模型用于这些药
材的鉴别是成功的。此外,该模型的成功建立和预
测,摒弃了以往中药材和中药制剂品种鉴别和质量
分级多为主观性意见的缺点,换之以客观的数据及
定量的形式进行评判,为中药品质评价和质量标准
的完善,尤其是真伪品、易混淆品种、同类品种之间
的研究,提供了新的方法和思路。
参 考 文 献
[1]顾雪中,沈国芳 . 新疆贝母的紫外光谱鉴别[J]. 中草
药,2001,32(7) :646-647.
[2]田薇,陈乃武,李永民,等 . 紫外光谱组法鉴别云南白药
及其伪品[J].中药材,2003,26(6) :404-405.
[3]陈瑶,秦路平,郑汉臣,等 . 导数紫外吸收光谱法鉴别积
雪草及其混淆品[J].中药材,2002,25(8) :550-551.
[4]何勇,李晓丽,邵咏妮 . 基于主成分分析和神经网络的
近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱
分析,2006,26(5) :850-853.
·593·Journal of Chinese Medicinal Materials 第 35 卷第 3 期 2012 年 3 月