免费文献传递   相关文献

基于PCA和FCA的不同生长年限当归13C NMR指纹图谱



全 文 :基于 PCA和 FCA的不同生长年限当归 13C NMR指纹图谱

顾志荣 1,2,杨应文 2,王亚丽 1,2,孙宇靖 1,2(1.甘肃中医学院科研实验中心,甘肃 兰州 730000;2.甘肃中医学院当归
研究所,甘肃 兰州 730000)

[摘要] 目的:利用 13C NMR 指纹图谱和化学模式识别建立不同生长年限当归的鉴别与质量评价方法。方法:利用对照品图谱和
参考文献对指纹图谱中特征信号峰进行初步归属,采用主成分分析(PCA)与模糊聚类分析(FCA)进行研究。结果:主成分分析
与模糊聚类分析均能将 27批不同生长年限当归样本完全分开,1年生与 2年生当归 13C NMR指纹图谱相似性较强,但与 3年生当
归有明显差异,阿魏酸、藁本内酯、3-正丁基苯酞及部分糖类是引起不同生长年限当归指纹图谱差异的主要化学成分。结论:本
研究建立的 13C NMR指纹图谱结合主成分分析、模糊聚类分析能够快速、准确地对不同生长年限当归进行鉴别与质量评价。
[关键词] 13C NMR;指纹图谱;当归;生长年限;主成分分析;模糊聚类分析
[中图分类号] O 482.53 [文献标识码] A [文章编号]

Research on
13
C NMR fingerprint of Angelica sinensis from different growing years based on principle
component analysis and fuzzy cluster analysis
GU Zhi-rong
1,2
, YANG Ying-wen
2
, WANG Ya-li
1,2*
, SUN Yu-jing
1,2
(1. Center of Scientific Experiment, Gansu University of
TCM, Gansu Lanzhou 730000, China; 2. Research institute of Angelica sinensis, Gansu University of TCM, Gansu Lanzhou 730000,
China)
ABSTRACT OBJECTIVE:To establish an identification and quality evaluation method of Angelica sinensis from different growing
years based on 13C NMR fingerprint and pattern recognition. METHODS:The characteristic signal peaks in 13C NMR fingerprint were
preliminarily assigned by 13C NMR spectra of reference substance and references, and principal component analysis (PCA) coupled with
fuzzy cluster analysis (FCA) were used for analysis. RESULTS:The results showed that 27 batches of samples can completely classified
by PCA and FCA. The 13C NMR fingerprint of 1-year-old samples and 2-year-old samples had strong similarities, but both of them had
significant differences with 3-year-old samples. Ferulic acid, Ligustilide, 3-Butylphthalide and some of Sugars were the main composition
caused these differences. CONCLUSION:The established 13C NMR fingerprint combined with PCA and FCA can be used for
identification and quality evaluation of Angelica sinensis from different growing years.
KEY WORDS:
13C NMR; fingerprint; Angelica sinensis; different growing years; principal component analysis; fuzzy cluster analysis

当归为伞形科当归属植物 Angelica sinensis (Oliv.) Diels 的干燥根,以甘肃岷山一带为道地产区。当
归主要含有挥发油、有机酸、多糖等化学成分[1],能够对人体多个生理系统产生影响。目前,对当归化学成分
的研究,正逐渐由传统的单体成分及有效部位研究转向指纹图谱与代谢组学的研究[2],研究手段主要有液相色
谱及其联用技术[3]、气相色谱及其联用技术[4]、红外光谱技术[5]以及 1H NMR技术[6]等。这些技术与化学计量学、
计算机科学以及系统生物学的结合使用,已成为当前中药分析的热点及主要研究方向[7]。NMR技术样品用量少、
前处理简单、谱图提供的信息量大,很适合复杂成分研究,在植物药与中药复方的研究方面应用广泛[8],但当
归的 13C NMR 指纹图谱研究目前未见相关报道。本研究首次尝试建立基于 13C NMR 技术的不同生长年限当归指纹
图谱,采用对照品图谱与参考文献对特征信号峰进行初步归属,通过主成分分析与模糊聚类分析进行模式识别,
为当归药材的鉴定及质量控制提供实验基础。
1 材料
Bruker Avance III 400(MHz)型超导傅立叶变换 NMR 谱仪(瑞士 Bruker 公司);BT1250 型电子天平
(1/100000,德国 Sartorius公司);AS7240B型超声器(天津奥特赛恩斯仪器有限公司)。
超纯水(自制,电阻率≥18.2 MΩ·cm);乙醇(分析纯,北京化工厂);DMSO-d6(99.9% + 0.03% V/V TMS)
(Cambridge Isotope 公司)。对照品:阿魏酸(批号 MUST-11112204)、藁本内酯(批号 MUST-11042201)、3-
正丁基苯酞(批号 MUST-11101210),均购于成都曼思特生物科技有限公司。27 批当归样品,均采集于甘肃岷
县,经甘肃中医学院药学院晋玲教授鉴定为 Angelica sinensis (Oliv.) Diels。样品信息见表 1。
表 1 当归样品信息表
Tab.1 Sample information of Angelica sinensis
No. 生长年限 采集时间 No. 生长年限 采集时间 No. 生长年限 采集时间
A1 1年 2009.08.03 B6 2年 2010.07.12 C1 3年 2011.02.27
A2 1年 2009.09.13 B7 2年 2010.07.26 C2 3年 2011.04.03
A3 1年 2009.10.15 B8 2年 2010.08.15 C3 3年 2011.05.29
A4 1年 2009.12.10 B9 2年 2010.08.27 C4 3年 2011.06.28
B1 2年 2010.03.09 B10 2年 2010.09.14 C5 3年 2011.07.26
B2 2年 2010.04.04 B11 2年 2010.09.25 C6 3年 2011.08.03
B3 2年 2010.05.29 B12 2年 2010.10.05 C7 3年 2011.09.13
网络出版时间:2014-12-09 16:07
网络出版地址:http://www.cnki.net/kcms/detail/42.1204.R.20141209.1607.046.html


2 方法与结果
2.1 样品的制备 精密称取各样本粉末(过 60目筛)0.5 g,加 90 %乙醇 15 ml,浸泡 12 h,超声提取 30 min,
滤过,挥干溶剂,残余物干燥备用。
2.2
13
C NMR 测定条件 当归样品及对照品谱图用 Bruker Avance III 400(MHz)型超导傅立叶变换 NMR 谱仪
在 25 ℃测定,共振频率 100.62 MHz,延迟时间 4 s,脉冲 9.4 μ s,数据点数 64 k,扫描次数 2 048次,溶
剂为 DMSO-d6,TMS 为内标。
2.3 对照品 13C NMR 谱图 阿魏酸、藁本内酯、3-正丁基苯酞是当归的主要有效成分及用于质量控制的指标性
成分[1],因此,它们的 13C NMR 图谱对于确认和辨别当归的主要化学成分非常重要。对照品 13C NMR 谱见图 1。



图 1 对照品阿魏酸、藁本内酯、3-正丁基苯酞的 13C NMR 谱图
Fig.1
13
C NMR spectra of control sample: Ferulic acid, Ligustilide and 3-Butylphthalide
2.4 不同生长年限当归的 13C NMR 指纹图谱 27 批不同生长年限当归的 13C NMR 指纹图谱叠加图见图 2。可以
看出,不同生长年限当归的 13C NMR 谱图出峰位置相似,且碳谱强度较高,难以直观看出它们的差异。因此,
将不同生长年限当归样品的代表性 13C NMR 谱图进行对比分析,结果如图 3所示。可以看出,1 年生和 2年生当
归样品 13C NMR 特征信号峰出峰位置比较相似,谱峰具有很高的相似性,信号峰大多出现在 δ 40 左右和 δ 60~
δ 105 的位移区间;3 年生当归样品与 1年生和 2年生样品相比,大部分出峰位置基本一致,但在 δ 57处多
了一个特征信号峰,可作为鉴别不同生长年限当归药材质量的一个依据。

图 2 不同生长年限当归的 13C NMR 指纹图谱
Fig 2
13
C NMR fingerprint of Angelica sinensis from different growing years
B4 2年 2010.06.15 B13 2年 2010.10.14 C8 3年 2011.09.30
B5 2年 2010.06.28 B14 2年 2010.12.24 C9 3年 2011.10.29



图 3 不同生长年限当归的代表性 13C NMR 指纹图谱
Fig 3 Representative
13
C NMR fingerprint of Angelica sinensis from different growing years
2.5 当归 13C NMR指纹图谱的初步归属 对 27批不同生长年限当归的 13C NMR指纹图谱提取共有模式,利用对
照品阿魏酸、藁本内酯、3-正丁基苯酞的 13C NMR 谱图,并参考相关文献[9-13],对检测出的主要化学成分进行初
步归属,结果见图 4。可以看出,用 90%乙醇提取的供试品,检测出的主要化学成分有糖类、阿魏酸、藁本内
酯和 3-正丁基苯酞。其中,13C NMR 谱图上响应较强的信号峰可作为当归药材的特征信号峰及不同生长年限当
归的鉴别与质量评价指标,即:δ 104、δ 92、δ 83、δ 77、δ 70~δ 75、δ 63、δ 62、δ 56、δ 40
和 δ 19 处。

图 4 不同生长年限当归 13C NMR 指纹图谱共有模式图及初步归属
Fig 4 Common pattern spectra of
13
C NMR fingerprint of samples and its preliminary assignment
2.6 主成分分析(PCA) 对 27批当归样本 13C NMR指纹图谱中的特征信号峰进行积分,积分区间 δ 10~δ
170,积分间隔 0.02。结果显示,每个样本的指纹图谱均可得到 20 个积分值,以(1)~(20)表示,由此构
成 27 × 20的数据矩阵,供主成分分析。特征信号峰标示如图 5所示。其中,(2)号峰为藁本内酯的特征信
号峰,(3)~(9)号峰为阿魏酸的特征信号峰,(10)~(17)、(19)、(20)号峰为糖类的特征信号峰,(18)
号峰为 3-正丁基苯酞的特征信号峰。

图 5 13C NMR 图谱共有模式特征信号峰标示
Fig 5 Identifier of characteristic signal peaks in common pattern map of
13
C NMR fingerprint
以 13C NMR指纹图谱中 20个特征信号峰的积分值作为变量,对积分数据进行标准化处理,再进行主成分分
析。抽取的主成分特征值及贡献率见表 2,第 1主成分(p[1])载荷分析见图 6,主成分多维模式投影见图 7。
由表 2可以看出,p[1] ~ p[3] 的累计方差贡献率达到 97.519%,表示前 3个主成分能够解释原变量信息的
97%以上,因此选取前 3个主成分进行分析。其中,第 1主成分方差贡献率为 81.088%,其载荷分析(图 6)显
示:(1)~(7)、(9)~(12)、(15)~(18)、(20)号峰位于正值区域且载荷值均较大,表明这些特征信号
峰对不同生长年限当归的区分贡献较大,主要是阿魏酸、藁本内酯、3-正丁基苯酞以及部分糖类。由图 7可以
看出,提取前 3个主成分进行分析,能够将 27批不同生长年限当归样本完全分开。其中,第 1年(育苗期)
与第 2年(成药期)当归样本分布在了距离较近的区域,两者与第 3年(留种期)当归样本距离较远。这一结
论与本研究组前期工作结论相一致[6]。
表 2 主成分分析特征值及贡献率
Tab 2 The characteristic value and contribution of PCA
主成分 特征值 方差贡献率/% 累积贡献率/%
1 14.218 81.088 81.088
2 5.077 10.385 91.473
3 1.542 6.046 97.519


图 6 第 1主成分线形载荷图
Fig 6 Loading line plot of p[1]

图 7 27 批当归样本主成分分析多维模式投影图
Fig 7 Multi-dimensional mode projection of PCA of 27 samples
2.7 模糊聚类分析(FCA) FCA是利用模糊集合理论进行聚类的方法,将图谱(数据)间的模糊关系简单直
观地转化为模糊矩阵以评价图谱间的相似性和差异程度,进而对样本集进行分类识别,其原理与中药指纹图谱
的模糊性特点一致[14]。利用模糊聚类中的几何平均最小法对 27批不同生长年限当归 13C NMR指纹图谱进行相似
性评价,相关系数(
ij
r )按式(1)计算:
)(Σ)min(Σ
11
jkik
m
k
jkik
m
k
XXX,X
ij
r

 (1)
式中:i 和 j 分别表示不同生长年限当归样本指纹图谱,k表示指纹图谱共有峰的序号,m 为共有峰的总数
(文中 m = 20),
ikX 和 jkX 分别为 i和 j样品中的第 k号共有峰面积积分值。
按式(1)确定出论域上的模糊矩阵 R为:





















































































1.00 0.49 0.54 0.90 0.92 0.93 0.83 0.74 0.73 0.90 0.89 0.58 0.69 0.65 0.79 0.68 0.93 0.76 0.73 0.68 0.93 0.82 0.73 0.79 0.95 0.83 0.68
1.00 0.84 0.98 0.90 0.83 0.93 0.79 0.67 0.92 0.80 0.79 0.73 0.56 0.74 0.55 0.68 0.93 0.87 0.82 0.78 0.98 0.60 0.83 0.92 0.93 0.82
1.00 0.69 0.60 0.93 0.89 0.73 0.99 0.79 0.68 0.83 0.65 0.69 0.68 0.98 0.99 0.92 0.93 0.63 0.68 0.92 0.55 0.79 0.76 0.93 0.72
1.00 0.68 0.92 0.80 0.82 0.62 0.77 0.89 0.62 0.76 0.77 0.65 0.72 0.92 0.54 0.58 0.92 0.83 0.99 0.72 0.78 0.92 0.50 0.78
1.00 0.97 0.54 0.68 0.77 0.87 0.72 0.68 0.92 0.99 0.96 0.82 0.57 0.78 0.76 0.83 0.92 0.65 0.82 0.59 0.68 0.71 0.57
1.00 0.68 0.63 0.82 0.79 0.93 0.69 0.59 0.88 0.92 0.92 0.68 0.83 0.88 0.82 0.79 0.63 0.68 0.93 0.83 0.65 0.74
1.00 0.58 0.63 0.60 0.65 0.68 0.76 0.59 0.68 0.93 0.56 0.78 0.73 0.89 0.80 0.99 0.68 0.87 0.92 0.78 0.89
1.00 0.96 0.73 0.64 0.79 0.89 0.94 0.92 0.93 0.70 0.50 0.68 0.48 0.94 0.93 0.55 0.68 0.72 0.90 0.93
1.00 0.65 0.79 0.66 0.59 0.92 0.93 0.55 0.82 0.45 0.99 0.65 0.92 0.68 0.62 0.69 0.96 0.92 0.89
1.00 0.54 0.69 0.68 0.48 0.61 0.70 0.67 0.65 0.79 0.74 0.83 0.92 0.91 0.70 0.61 0.73 0.79
1.00 0.73 0.93 0.69 0.82 0.87 0.64 0.57 0.61 0.65 0.72 0.72 0.69 0.84 0.94 0.59 0.78
1.00 0.73 0.78 0.94 0.93 0.69 0.63 0.82 0.92 0.70 0.92 0.82 0.49 0.62 092 0.83
1.00 0.83 0.59 0.93 0.92 0.88 0.82 0.72 0.79 0.92 0.72 0.61 0.73 0.68 0.72
1.00 0.94 0.76 0.68 0.89 0.64 0.82 0.68 0.83 0.93 0.87 0.67 0.64 0.63
1.00 0.78 0.86 0.82 0.87 0.94 0.83 0.62 0.84 0.55 0.52 0.79 0.97
1.00 0.89 0.50 0.67 0.92 0.83 0.73 0.82 0.64 0.97 0.76 0.83
1.00 0.92 0.83 0.74 0.77 0.86 0.88 0.67 0.75 0.93 0.95
1.00 0.84 0.93 0.92 0.89 0.87 0.94 0.92 0.89 0.68
1.00 0.83 0.84 0.91 0.93 0.99 0.89 0.91 0.83
1.00 0.68 0.74 0.84 0.93 0.92 0.83 0.72
1.00 0.98 0.78 0.77 0.89 0.74 0.83
1.00 0.83 0.98 0.72 0.73 0.84
1.00 0.62 0.72 0.89 0.83
1.00 0.81 0.64 0.74
1.00 0.76 0.87
1.00 0.91
1.00
R

由模糊矩阵可知,不同生长年限当归样本 13C NMR指纹图谱
ij
r 均较大,相似度很高。取
ij
r = 0.70作为阈
值进行动态聚类,结果见图 8。可以看出,除样本 C1离群外,模糊聚类法能够将 27批不同生长年限当归样本
完全分开,其分类结果与主成分分析一致。

图 8 不同生长年限当归样本 13C NMR 指纹图谱模糊聚类结果
Fig.8 The FCA result of
13
C NMR fingerprint of 27 samples
3 讨论
3.1 提取溶剂的选择 据文献报道,当归进行 NMR测定的提取溶剂是 75%乙醇[9]。为了更为全面地提取当归化
学成分,本研究在文献报道的基础上对乙醇浓度进行了筛选,分别采用 70%、75%、80%、85%、90%、95%的乙醇
对当归样品进行超声提取,进行 13C NMR测定。结果显示,70%~85%及 95%乙醇提取物 13C NMR 谱图出峰区间较
小,化学成分的信息量相对较少,而 90%乙醇提取物 13C NMR谱图特征峰的出峰区间较大,检测到的化学成分较
多,所以选定 90%乙醇作为提取溶剂。
3.2 氘代试剂的选择 由于当归中化学成分多数为脂溶性成分,通过参考文献[9],本实验对氘代氯仿(CDCl3)
和氘代二甲基亚砜(DMSO-d6)进行筛选。结果显示,用 CDCl3溶解样品后所得
13
C NMR谱图中谱峰重叠较为明
显,谱图的分辨率较低,不利于化学成分的指认。此外,CDCl3对 90%乙醇提取的当归的残余物溶解较为困难。
故最终选择溶解性较好,所得谱图清晰、易辨的 DMSO-d6为制备样品的氘代试剂。
3.3 代表性 13C NMR 指纹图谱分析、PCA 以及 FCA结果均显示,第 1年(育苗期)与第 2年(成药期)当归样
本分布较近,指纹图谱相似性强,但两者与第 3年(留种期)当归样本差异明显。引起差异的原因可能与第 3
年当归样本已经柴化,化学成分(尤其是小分子及挥发性成分)散失严重有关。第 2年当归样本分布集中,质
量均一性较好,这与传统当归采收经验相一致。
参考文献:
[1] Yi LZ , Liang YZ , Wu H, et al. The analysis of Radix Angelicae Sinensis (Danggui)[J]. J Chrom. A, 2009, 1216:1991-2001.
[2] Qian YY, Wang YL, Sa RN, et al. Metabolic fingerprinting of Angelica sinensis during growth using UPLC-TOFMS and chemometrics
data analysis[J]. J Chem Centr, 2013, 7: 42-46.
[3] Bai YJ, Kong M, Xu JD, et al. Effect of different drying methods on the quality of Angelicae Sinensis Radix evaluated
through simultaneously determining four types of major bioactive components by high performance liquid chromatography photodiode
array detector and ultra-high performance liquid chromatography quadrupole time-of-flight mass spectrometry[J]. J Pharm and
Biomed Anal, 2014, 94: 77-83.
[4] Wei SY, Xu CJ, Mok DK, et al. Analytical comparison of different parts of Radix Angelicae Sinensis by gas chromatography coupled
with mass spectrometry[J]. J Chrom A, 2008,1187(1-2): 232-238.
[5] 潘新波, 王亚丽, 孙宇靖, 等. 甘肃岷县不同生长年限当归药材的红外光谱分析[J]. 光谱实验室, 2012, 29(6): 3314-3319.
[6] 杨应文, 王亚丽, 萨日娜, 等. 不同生长年限当归 1H NMR 指纹图谱的研究[J]. 波谱学杂志, 2013, 30(1): 70-79.
[7] 黄仕清, 徐文芬, 张明昶, 等. 地稔挥发油的气相特征指纹图谱研究[J]. 中国医院药学杂志, 2014, 34(5): 349-352.
[8] Song XF, Wang JS, Wang PR, et al.
1
H NMR-based metabolomics approach to evaluate the effect of Xue-Fu-Zhu-Yu decoction on
hyperlipidemia rats induced by high-fat diet[J]. J Pharm. and Biomed Anal, 2013, 78-79(5): 202-210.
[9] 孙元琳, 陕方, 崔武卫, 等. 当归糖类 ASP3 及其水解产物的 NMR 光谱分析[J]. 高等学校化学学报, 2009, 30(9): 1739-1743.
[10] 孔丽娟, 梁侨丽, 吴启南, 等. 黑三棱的化学成分研究[J]. 中草药, 2011, 42(3): 440-442.
[11] 肖永庆, 李丽, 游小琳, 等. 川芎化学成分的研究[J]. 中国中药杂志, 2002, 27(7): 519-521.
[12] 易进海, 刘云华, 陈燕, 等. 核磁共振波谱法测定藁本内酯对照品的含量[J]. 药物分析杂志, 2010, 30(4): 680-682.
[13] 夏玮, 刘书琦, 张文清, 等. 桑叶糖类 MP-3b 的结构性质研究[J]. 中成药, 2009, 31(3): 427-430.
[14] Velmurugan T. Performance based analysis between k-Means and Fuzzy C-Means clustering algorithms for connection oriented
telecommunication data[J]. Applied Soft Computing, 2014,19: 134-146.
[基金项目] 国家自然科学基金项目(30960037);2011 年甘肃省发改委战略新兴产业和产业技术研究与开发专项项目 [作者简介]顾志荣,男,在读硕士,
电话:13519311935,E-mail:guzr8817@163.com
[通信作者] 王亚丽,女,博士,教授,博士生导师,研究方向:中药分析与化学计量学研究,E-mail:cnwyl1166@hotmail.com
[收稿日期] 2014-04-01