全 文 :第3 6卷,第5期 光 谱 学 与 光 谱 分 析 Vol.36,No.5,pp1358-1362
2 0 1 6年5月 Spectroscopy and Spectral Analysis May,2016
不同采收期滇龙胆的红外光谱鉴别研究
申云霞1,2,赵艳丽1,张 霁1,金 航1,王元忠1*
1.云南省农业科学院药用植物研究所,云南 昆明 650200
2.云南中医学院中药学院,云南 昆明 650500
摘 要 采收是中药生产的重要环节,采收时间直接影响中药质量和产量,是中医临床安全有效用药的前
提,开展中药适时采收期的研究具有重要意义和应用价值。采用傅里叶变换红外光谱法对72份不同采收期
的滇龙胆进行鉴别研究,用TQ8.0软件对原始光谱进行一阶导数(first derivative,FD)、二阶导数(second
derivative,SD)、标准正态变量(standard normal variate,SNV)、多元散射校正(multiplicative scatter correc-
tion,MSC)和平滑(savitaky-golay filter,SG)预处理,样品按3∶1分为校正集和预测集,同时建立主成分分
析(principal component analysis,PCA)和偏最小二乘判别分析(partial least square discriminant analysis,
PLS-DA)模型。结果显示,选取1 800~600cm-1波段范围的光谱,去除光谱噪音;SNV结合二阶导数光谱
和SG(15,3)平滑,预处理结果满意。主成分分析表明,前三个主成分方差贡献率为92.47%,5月、9月和
10月份采收的样品差异较小。偏最小二乘判别分析建立判别模型,决定系数R2 和校正均方根误差(RM-
SEE)分别为0.967 8和0.086 0,可对18个预测集样品进行准确分类。红外光谱法结合主成分分析、偏最小
二乘判别分析对不同采收期滇龙胆的分类和判别效果较好,为不同采收期的中药鉴别提供理论依据。
关键词 滇龙胆;不同采收期;傅里叶变换红外光谱;主成分分析;偏最小二乘判别分析
中图分类号:O657.3 文献标识码:A DOI:10.3964/j.issn.1000-0593(2016)05-1358-05
收稿日期:2014-12-19,修订日期:2015-04-15
基金项目:国家自然科学基金项目(81260608)和云南省自然科学基金项目(2013FD066,2013FZ150)资助
作者简介:申云霞,女,1991年生,云南中医学院中药学院研究生 e-mail:shenyunxia1991@163.com
*通讯联系人 e-mail:yzwang1981@126.com
引 言
中药质量控制和评价是中药研究、应用及发展的热点及
难点[1]。品种、产地、采收加工、炮制和制剂工艺是影响中
药品质的重要因素,同时影响其药性和药效[2]。中药规范化
生产有利于确保中药材、饮片、中成药质量的稳定和用药的
安全有效。采收加工是中药生产的源头,合理采收对中药材
质量与产量具有一定影响,是中药产业实现质量稳定、可控
的重要前提[3]。
近年来,适时采收对中药质量的影响备受关注。研究表
明,白术的收获期以摘蕾前五月下旬到六月上旬为宜,此时
白术内酯含量最高[4]。前胡在12月份到翌年2月份,香豆素
类成分含量达到最高阶段,与传统采收时间相吻合[5]。不同
采收期香加皮中4-甲基水杨醛的含量差异较大,夏季的平均
含量最高位0.71%,春、秋两季的含量分别为0.22%和
0.39%,夏季为最佳采收期,与传统香加皮采收期为春、秋
两季有差别[6]。不同采收期的美花石斛多糖含量存在差异,
九月到次年一月多糖含量相对较高[7]。金银花的最佳采收期
为“二白”和“大白”期采摘,此时绿原酸和木犀草苷含量最
高[8]。水红花子的最佳采摘期为十月中旬,此时槲皮素的含
量最高,为0.697mg.g-1[9]。因此,对中药采收期的研究具
有重要意义。
滇龙胆(Gentiana rigescens Franch.)为龙胆科植物,是
治疗肝胆疾病常用中药[10]。沈涛等[11]采用高效液相色谱法
对不同采收期、不同部位的滇龙胆进行研究,发现不同部位
的样品所含萜类物质具有差异,9月—11月为其最佳采收
期。目前,主要以单一指标成分及药用部位的产量作为中药
的采收期评价指标,由于地域、生产环境的差异,难以客观
地对中药采收期进行评价。红外光谱法具有特征性强、快
速、无损和简便等优点,能够反映样品化学成分整体信息,
已广泛应用于农作物[12-13]、食品[14-17]及中药[18-19]的鉴定及质
量分析。本实验采用傅里叶红外光谱法结合主成分分析和偏
最小二乘判别分析法对不同采收期滇龙胆进行研究,取得满
意的结果,以期为其合理采收和质量控制提供科学依据。
1 实验部分
1.1 材料
样品采自云南省农业科学院药用植物研究所种质资源
圃,于2008年4月播种,2009年3—10月,每月采收9份样
品,共72份。经云南省农业科学院药用植物研究所金航研究
员鉴定为滇龙胆根及根茎。在50℃条件下烘48h,粉碎过
100目筛,备用。样品采集时间和编号见表1。
表1 滇龙胆样品信息
Table 1 Information of G.rigescens samples
编号 采收日期 编号 采收日期
A 3月9日 E 7月13日
B 4月9日 F 8月13日
C 5月13日 G 9月15日
D 6月13日 H 10月15日
1.2 仪器与设备
Perkin-Elmer Fronter型傅里叶红外光谱仪,DTGS检测
器,光谱范围4 000~400cm-1,分辨率4cm-1,信号累加扫
描16次。压片机为 YP-2(上海山岳科学仪器仪器公司)。
KBr为分析纯,购于天津市风船化学试剂科技有限公司。
1.3 方法
取样品与KBr粉末(1∶100)混合研磨均匀,压制成透明
薄片,放入红外光谱仪中测定,每个样品平行测定三次,计
算平均光谱。红外光谱采集过程中室温保持在23℃,空气
相对湿度保持在40%~48%。
1.4 光谱及数据处理
所有原始光谱数据用Nicolet Omnic8.0软件进行基线校
正、归一化预处理;用TQ8.0软件进行一阶导数(FD)、二阶
导数(SD)、标准正态变量校正(SNV)、多元散射校正
(MSC)、savitaky-golay filter平滑(SG)预处理,并进行主成
分分析(PCA)。SIMCA-P+11.0软件用于建立偏最小二乘判
别分析(PLS-DA)模型。
1.5 方法学考察
精密度实验:取同一份滇龙胆样品,参照1.3测定方法,
连续测定5次,获得5个红外光谱图,计算图谱间的相似度
及相对标准偏差。
稳定性实验:取同一份样品,参照1.3测定方法,每隔
一个小时测定一次,共测5次,计算图谱间的相似度及相对
标准偏差。
重现性实验:取一份样品,平行制备5个样品片,分别
测定,计算图谱间的相似度及相对标准偏差。
2 结果与讨论
精密度、稳定性和重现性考察结果表明,图谱间相似度
的相对标准偏差(RSD)分别为0.03%,0.98%和0.24%;该
方法可靠、重复性和稳定性强。
2.1 滇龙胆光谱特征
根据1.3中实验方法,扫描72份样品的傅里叶红外光
谱,所得光谱如图1和图2所示,滇龙胆不同采收季节的原
始图谱特征峰相似,难以从图谱进行鉴别,需要采用化学计
量学方法对其进行区分。
图1 滇龙胆的傅里叶变换红外光谱
Fig.1 FTIR spectra of G.rigescens
图2 滇龙胆的二阶导数光谱
Fig.2 Second derivative of FTIR of G.rigescens
2.2 光谱预处理结果
红外光谱在测定过程中,受样品粒度、光的散射和仪器
响应等因素的影响,产生噪音和光谱的基线漂移;适当的预
处理方法,可以提高光谱的分辨率、有效消除基线漂移和噪
声[20]。表2显示,选取1 800~600cm-1波段范围内的光谱,
主成分数为10的条件下,经SNV+SD+SG(15,3)预处理
后对样品的误判数最少,变量特征的解释能力为96.6%,该
表2 不同预处理方法的结果(主成分数为10)
Table 2 Results of different pretreatment methods
(The number of principal components=10)
预处理方法
光谱范围
/cm-1
主成
分数
解释变量
特征/%
误判数
未处理 4 000~400 10 99.6 3
MSC 4 000~400 9 99.1 1
SNV 4 000~400 9 99.2 5
MSC+FD 3 600~500 10 89.2 4
MSC+FD+SG(15,3) 1 800~600 10 96.1 1
MSC+FD+SG(13,3) 1 800~600 8 93.0 2
SNV+FD+SG(11,5) 4 000~400 8 86.9 2
SNV+FD+SG(13,5) 3 600~500 9 94.8 1
MSC+SD+SG(15,5) 1 800~500 10 93.7 1
MSC+SD+SG(15,3) 3 600~500 8 92.6 2
SNV+SD+SG(13,3) 4 000~400 8 91.2 1
SNV+SD+SG(15,3) 1 800~600 10 96.6 0
9531第5期 光谱学与光谱分析
方法可用于模型的建立。
2.3 主成分分析
主成分分析是一种数据降维方法,将多个相关变量简化
为少数几个不相关变量的多元统计分析方法[21]。选用2.2中
最优预处理方法,对数据进行主成分分析,前三个主成分分
别为65.32%,22.01%,5.14%,累积贡献率大于90%,包
含了原始数据的绝大部分信息和样本的聚类信息。PC1,
PC2和PC3得分散点图见图3,样品按采收期的差异分为八
类,在散点图上的位置与实际有一定的相关性。5月、9月和
10月采收的样品空间分布较相近,形成一个聚集区域,即此
时采收的样品差异较小,与药典规定的春、秋两季采挖相
符[10];7月采集的样品离散程度较大,8月采集的样品距离
其他样品较远,显示出较大的差异性。
图3 不同采收期滇龙胆样品的主成分得分图
Fig.3 Score plot for PC1,PC2and PC3of G.rigescens
with different harvest times
2.4 偏最小二乘判别分析建立与验证
2.4.1 异常值的检测
仪器的噪声、基线漂移和测定条件改变等因素会产生异
常光谱,利用傅里叶红外光谱数据建模时,异常样品的存在
会影享模型的稳健性。利用SIMCA-P+11.0软件 Hotteling
T2控制图对所有样品进行检测,若样品超出99%的置信区
间,即判定为异常样品。图4为72个样品的异常值检测结
果,除友4个样品在95%~99%置信区间内,剩余样品均在
95%的置信区间,表明没有异常样品需要剔除。
2.4.2 PLS-DA模型的建立
PLS-DA方法是基于PLS建立的样本分类变量与傅里叶
红外光谱特征间的回归模型。在进行光谱预处理和异常值检
验之后,选取2.2中经SNV+SD+SG(15,3)预处理的光谱
对训练集样品建立偏最小二乘判别模型,前三个主成分累积
贡献率为80.68%,R2 为0.967 8,校正均方根误差(RM-
SEE)为0.086,表明模型具有良好的预测能力。由图5所示,
建立的模型将样品根据不同采收期分为8类,3月、5月、9
月和10月份采集的样品在空间分布上较相近,即所含的化
学成分具有相似性。图6显示了所建立的模型对八个不同采
集时间的滇龙胆样品光谱数据的累积贡献能力(R2 Y(cum))和
模型的预测能力(Q2 Y(cum)),R2 Y(cum)值均大于95.59%,
Q2 Y(cum)值均大于83.10%,适用于样品的鉴别。
图4 样品异常值检测
Fig.4 Outlier detected of samples
图5 滇龙胆的偏最小二乘判别分析结果
Fig.5 Results of PLS-DA of G.rigescens
图6 不同采收期滇龙胆的累计贡献率和预测率
Fig.6 Accumulative contribution rate and predictive rate
of G.Rigescensin different harvest times
2.4.3 PLS-DA模型的验证
将建立好的判别模型用于验证,随机选取18份样品作
为验证集,对验证集样品进行判定。即考察预测值Ypre与偏
差Ydev,判定准则为:(1)当Ypre>0.5,Ydev<0.5,判定样品
属于该类;(2)当Ypre<0.5,Ydev<0.5,判定样品不属于该
类;(3)Ydev>0.5,判定不稳定[22]。结果如表3所示,根据判
别准则,建立的判别模型能对18份验证集样品进行准确预
测。
0631 光谱学与光谱分析 第36卷
表3 验证集的偏最小二乘判别分析结果
Table 3 Results of PLS-DA model for discrimination of validation set
编号
分类变量预测值 类别
Ypre Ydev 预测 实际
编号
分类变量预测值 类别
Ypre Ydev 预测 实际
1 0.992 1 0.255 9 A A 10 0.967 2 0.207 9 E E
2 1.444 1 0.320 4 A A 11 0.973 9 0.215 1 E E
3 0.825 9 0.191 9 B B 12 0.987 8 0.212 7 F F
4 0.793 1 0.181 1 B B 13 0.845 4 0.181 7 F F
5 0.952 9 0.211 7 C C 14 0.766 9 0.170 9 G G
6 0.982 3 0.212 3 C C 15 1.060 5 0.233 8 G G
7 0.958 1 0.205 5 D D 16 0.910 4 0.196 4 H H
8 1.158 4 0.259 7 D D 17 0.628 8 0.144 2 H H
9 0.950 1 0.217 9 D D 18 0.733 5 0.155 1 H H
注:Ypre为预测值,Ydev为偏差
Note:Ypreis predictive value,Ydevis doviation
3 结 论
采集不同采收期滇龙胆的傅里叶变换红外光谱,考察样
品的精密度、稳定性和重现性,试验结果表明该方法稳定和
可靠。用TQ8.0软件对所有原始光谱进行预处理,选取1
800~600cm-1光谱波段,采用标准正态变量结合二阶导数
法及SG平滑预处理,建立主成分分析模型,前三个主成分
的累积贡献率为92.47%,能够反映原始数据的大部分信息,
显示滇龙胆样品成分之间的相关性,不同采收期样品在空间
中离散分布,其中5月、9月和10月采收的样品在空间分布
较近,即所含化学成分相似性较高,与药典规定的春、秋两
季采挖相符。为了对样品准确鉴别,利用SIMCA-P+11.0
软件,选择预处理后的光谱,建立PLS-DA模型,根据经累
积贡献能力、R2 和RMSEE对模型进行评估,表明模型的稳
定性较好。所建立的模型对验证样品的准确识别率为100
%;与目前沿用的以药用部位单一指标性活性成分结合生物
产量的采收期确定方法相比,FTIR具有简便、无损、真实宏
观及反应样品综合信息等优点,为快速鉴别中药不同采收期
提供参考。
References
[1] XIAO Pei-gen,XIAO Xiao-he(肖培根,肖小河).China Journal of Chinese Materia Medica(中国中药杂志),2000,25(2):67.
[2] XIAO Xiao-he,JIN Cheng,ZHAO Zhong-zhen,et al(肖小河,金 城,赵中振,等).China Journal of Chinese Materia Medica(中国中药
杂志),2007,32(14):1377.
[3] DUAN Jin-ao,YAN Hui,SU Shu-lan,et al(段金廒,严 辉,宿树兰,等).China Traditional and Herbal Drugs(中草药),2010,41
(10):1755.
[4] BAI Yan,CHEN Lei,WANG Xiao-ni,et al(白 岩,陈 磊,王小妮,等).China Traditional and Herbal Drugs(中草药),2010,41
(1):129.
[5] YU Jun-nian,WU Wen-ling,LIU Shou-jin,et al(俞军年,吴文铃,刘守金,等).China Journal of Chinese Materia Medica(中国中药杂
志),2013,38(10):1489.
[6] LI Tian-xiang,ZHANG Li-juan,LIU Hong,et al(李天祥,张丽娟,刘 虹,等).China Traditional and Herbal Drugs(中草药),2007,
38(8):1256.
[7] WU Kong-yuan,WANG Quan-wen,JIN Jia-xing,et al(武孔媛,王全文,金家兴,等).China Traditional and Herbal Drugs(中草药),
2010,35(10):1221.
[8] ZHANG Yan,WANG Wen-quan,GUO Lan-ping,et al(张 燕,王文全,郭兰萍,等).China Traditional and Herbal Drugs(中草药),
2013,44(18):2611.
[9] ZHENG Zong-jian,ZHAI Yan-jun,CHU Zheng-yun,et al(郑宗建,翟延君,初正云,等).China Journal of Chinese Materia Medica(中
国中药杂志),2009,34(6):783.
[10] Chinese Pharmacopoeia Commission(中华人民共和国药典委员会).Pharmacopoeia of the People’s Republic of China(中华人民共和国药
典),Part One(第一部).Beijing:China Medical Science Press(北京:中国医药科学出版社),2010.89.
[11] SHEN Tao,YANG Mei-quan,ZHAO Zhen-ling,et al(沈 涛,杨美权,赵振玲,等).Chinese Buletin of Botany(植物学报),2011,46
(6):652.
[12] Lu Y Z,Du C W,Yu C B,et al.Computers and Electronics in Agriculture,2014,107:58.
[13] Martínez-Valdivieso D,Font D,Teresa M,et al.Computers and Electronics in Agriculture,2014,108:71.
[14] Pinar D,Sertac O,Feride S.Spectrochimica Acta Part A,2015,135:757.
1631第5期 光谱学与光谱分析
[15] Fernández-González A,Montejo-Bernardo J M,Rodríguez-Prieto H,et al.Spectrochimica Acta Part A,2015,135:757.
[16] Yasmina S,Daniel C,Steve F,et al.Food Chemistry,2015,172:207.
[17] Laroussi-Mezghani S,Vanloot P,Molinet J.Food Chemistry,2015,173:122.
[18] Zhao Y L,Zhang J,Yuan T J,et al.Plos One,2014,9(2):1.
[19] Yong-Kook K,Myung Suk A,Jong Suk P,et al.Journal of Ginseng Research,2014,38:52.
[20] Li D,Jin Z X,Zhou Q,et al.Journal of Molecular Structure,2010,974:68.
[21] Li N,Che Y Y,Zhang L,et al.Journal of Chinese Pharmaceutical Sciences,2013,22:55.
[22] Galtier O,Dupuy N,Le Dreau Y,et al.Analytica Chimica Acta,2007,595(1-2):136.
Study on the Discrimination of FTIR Spectroscopy of Gentiana Rigescens
with Different Harvest Time
SHEN Yun-xia1,2,ZHAO Yan-li 1,ZHANG Ji 1,JIN Hang1,WANG Yuan-zhong1*
1.Institute of Medicinal Plants,Yunnan Academy of Agricultural Sciences,Kunming 650200,China
2.Colege of Chinese Materia Medica,Yunnan University of Traditional Chinese Medicine,Kunming 650500,China
Abstract The harvest time of traditional Chinese medicine(TCM)is a very essential part for the production and quality of TCM
which is the prerequisite for safe and effective clinical use of TCM.It is of great importance to carry out the research of timely
harvest time of TCM.With Fourier transform infrared spectroscopy(FTIR)to study harvest time of Seventy-two Gentiana Ri-
gescens samples.First derivative,second derivative,standard normal variate,multiplicative scatter correction and Savitaky-Go-
lay(15,3)smoothing of al original spectra were pretreated with TQ8.0software.Samples were divided into calibration set and
prediction set at the ratio of 3∶1.Principal component analysis(PCA)and partial least square discriminant analysis(PLS-DA)
model were established.The result indicated that after removing noise spectrum,the spectra range was from 1 800to 600cm-1,
the method SNV combined with SD and SG present the best result of spectra pretreatment.The contribution rates of first three
principal components were 92.47% with PCA.Smal differences were found for the samples harvested in May,September and
October.Same spectrum range was chosen and PLS-DA was applied to establish the model.The R2 and RMSEE were 0.967 8,
0.086 0,respectively,and the prediction accuracy is 100%.The methods of PCA and PLS-DA have good ability to classify and
identify different harvest time of Gentiana Rigescens.It provided a basis for the identification of different harvest time of TCM.
Keywords Gentiana rigescens;Different harvest seasons;Fourier transform infrared spectroscopy;Principal component analy-
sis;Partial least square discriminant analysis
(Received Dec.19,2014;accepted Apr.15,2015)
*Corresponding author
2631 光谱学与光谱分析 第36卷