全 文 :中药葛根及同属植物的化学模式识别
第二军 医大学药 学院 (上 海 2 0 0 4 3 3) 曾 明 “ 张汉明 郑水庆 许景峰 ‘ ’ 苏中武
摘 要 应用主 成分分 析法 (P C A )对来 源于全 国不同产地 的野 葛及葛属的其它 8 种植物进行 了
化学模式识别研究 , 为葛属植 物的药材质量评价及分类提 供了依据 。
关健词 主成分分 析 Sha n n o n 信息理论 葛根 葛属
葛根为常用 中药 , 具有解表退热 , 生津止
渴和止泻之功效 。 中国药典 (1 9 9 5 版 )收载的
原植 物有 野葛 尸u er ar 故 Z砧at a (W il d . )O -
h w i及粉葛 P . th o m 、on 汀 B e nt h 。 我国葛属植
物资源丰富 , 有 9 种 2 变种 , 为使其得到合理
开发利用 , 我们从化学角度对葛根的质量进
行 一了评价 , 同时为葛属植物的分类提供参考
依据 。
葛根化学成分复杂 , 含有多种黄酮及三
菇类等成分 , 而这些成分 间往往是发挥协 同
作用的 , 单一成分难 以 评价其质量 , 故将葛根
甲醇浸出液的紫外光谱 (U V )作 为一整体来
进行综合分析 , 以 I n n l 间隔测吸收值 , 每波
长与特定 波长 的吸收度 比值作为指标 , 采用
S h a n n o n 信息理论 , 对所有样本计算每一波
长通道的信息量 , 取富含信息量 的通道作为
分 类指标 。 最 后 , 运用主成分分析法 (P C A )
进行综合分析 , 取得 的结果较为满意 。
1 样品 、仪器与试剂
U V
一
2 6 5 型 紫 外分 光光 度 计 (岛 津 、 日
本 ) 。 葛根原药材系作者采集 , 详见表 1 。 化学
试剂均为分析纯 。
2 数据收集与处理
取药材粉末 0. 5 9 , 加甲醇 s m L 室温浸
2 4 h
, 浸出液用 甲醇适量稀释 , 在 U V 一 2 65 型
紫外分光光度计上 , 于 2 0 n m 一 3 40 n m 区
间 , 每间隔 I n m 测定一个吸收值 , 得样本原
始数据 。
样本原始数据是一定浓度样品在测定波
长的吸收值 , 它随样品浓度大小而变化 , 不 同
样本间缺少 可 比性 。 因此需要进行数据转换 ,
根据比尔定律 A 一 E C I“ , 对每一浸出物样本
两测定波 长下吸收度 比值为一常数 。 将每一
波长下的吸收值 与特定波长的吸收值比值作
为分类指标 。
表 1 PC A 分析中使用的样 品
编号 学 名 采集地点
] p
“e r a r ia lo ba , a 辽宁旅顺
2 尸 · 勿b at “ 陕西西安
3 P
·
lo b a t a 河北井隆
4 P
· 肠ba ta 山 东泰安
S P
·
z o ba ta 江西南昌
6 尸 · 翻ba ta 安徽金寨
7 八 t/l o m 用nl i 江酉奉新
8 P. th o m 、nl i 云 南大理
9 P. th
o
m 用瓜 : 云 南丽 江
10 尸· t h ‘, 刀 ; 、o n i ; 贵州岑巩
l P
·
t/l
o阴、nl ; 云 南景洪
1 2 p
· ‘,二“n 、i、 四川峨嵋
] 3 j
〕 . a l吵e : “ 10 1汀‘ 、 云 南景洪
14 子, · 。u l夕。: n 。 云 南水胜
15 P
· 。d o li、 云 南巍 山
16 广 · ‘·‘lu li、 云 南丽江
1 7 p
·
m ,) , , ta , , ‘, 广东博罗
1 8 1 )
·
P
r
d
‘、, 2“‘,一‘之l万、 云南巍山
l , 尸· P‘·d “ n 。 ,‘; 。 l; 、 四 川峨嵋
2 。 于‘· Ph 。 ; e lo ; d 。 、 广东广州
3 特征选择
经处理 , 每 一样本均可得 1 2 2 个 特征变
量 (整数 ) , 对于 PC A 法需满 足样本数大 于变
量数这一条件 , 因此 , 首先须对样本进行降维
处理 , 但是 , 维数 (特征数 )及其对谱图的分辨
率是相互矛盾的两个方面 , 试用 S ha n n o n 信
息理论进行特征选取 。
S ha n n o n 信息理论是研究从数量上定量
A d d r e s s
:
Z e n g M in g
,
C o lle g e o f Ph a
r n l a e y , S e
e o n d M ilita
r y M
e
d ie
a
l U n iv e r s it y
,
Sh a n g h a i
* * 北京军区 总医 院药剂科
一
6 5 2
.
描述信息的方法 〔‘〕 , 信息量的大小主要取决
于事件发生的几率和事件间的相互关 系 , 可
用下式表示
I(j)一 智P J(i)L o G : 火 PJ(i)
i= 1
式 中 m i为第 波长下对所有样本的不
连续 的最大特征变量值 , P j(i )为第 i波长下
特征变量值为 i 的样本对所有数据集样本发
生的几率 , I( j)为第 i波长通道对所有样本的
信息量之和 。 各波长通道的信息量计算结果
见表 2 , 选择 I值最大的 10 个波长通道的吸
收比值作为分类特征 , 见表 3 。
表 2 数据样本波长通道的信息 t
终长
、n l l 夕
信息 量 终兰
气1 1 1 1 1 夕
信息量 终气气 1 1 1 1 1 夕 信息量 终长气1 1 1 1 1少 信息量 脾长气1 1】lj 信息量
6
.
4 1
月生Q口
88
0
4
曰
5.5.
92674.5
5
.
1 0
4
.
7 0
4
.
8 4
5
.
2 6
5
。
1 3
4
。
7 0
4
。
5 7
4
.
9 2
4
。
7 9
4
.
9 2
4 8 4
5 2 6
5
.
4 0
5
.
2 7
4
。
9 8
4
.
9 2
5
.
1 4
5
.
1 3
4 9 2
5
。
2 6
5
.
3 2
5
.
6 2
9,口自弓Q50乙7.89
9
.
9 9
6
.
1 3
3 2 0
3 2 1
3 2 2
3 2 3
3 2 4
3 2 5
3 2 6
3 2 7
3 2 8
3 2 9
3 3 0
3 3 1
3 3 2
3 3 3
3 3 4
3 3 5
3 3 6
3 3 7
3 3 8
3 3 9
3 4 0
3626.6.
2 9 5
2 9 6
2 9 7
2 9 8
2 9 9
3 0 0
3 0 1
3 0 2
3 0 3
3 0 4
3 0 5
3 0 6
3 0 7
3 0 8
3 0 9
3 1 0
3 1 1
3 1 2
3 1 3
3 1 4
3 1 5
3 1 6
3 1 7
31 8
3 1 9
O廿h产nb自9,q白6.5
0九jt月了rlOJ月了片5ud0.⋯q力,J八乃马JOdCj4
4
.
3 1 5
.
5 3
6
.
0 1
8274乐5.
5
.
8 2
卜1n乃冲48OA
月
7
.
5.65.
5
.
6 9
左‘尸乃只几O凸J6j一从S八6八钊O白月了1卫5Ctl. .⋯月任户乃5只气5O尸a
n7目toC65勺乙八nA工QJO月100ujt了on山自Q厂JIJ咔h
.
.⋯no口O“Q月了兄一a几匕5次
O以月t夕妇O浮用任00乙J4
.⋯.4)任4月J
5,JC乃OCOS一了OJ只月生q055.5.乐‘任Q乙月了月峥OJ只no口51月71JC.⋯5月味一乃尸O月斗孟几铸n
4几J吐
‘
0庄占牛一On曰4.54.
Q0及U门了4CJ⋯4rJ乃
2 2 0
2 2 1
2 2 2
2 2 3
2 2 4
2 2 5
2 2 6
2 2 7
2 2 8
2 2 9
2 3 0
2 3 1
2 3 2
2 3 3
2 3 4
2 3 5
2 3 6
2 3 7
2 3 8
2 3 9
2 4 0
2 4 1
2 4 2
2 4 3
2 4 4
4
.
7 0
5
.
1 3
5
.
2 1
4
.
3 1
6
.
10
2 4 5
2 4 6
24 7
24 8
24 9
2 50
2 5 1
2 5 2
2 5 3
2 5 4
2 5 5
2 5 6
2 5 7
2 5 8
2 5 9
2 6 0
5 6 1
2 6 2
2 6 3
2 6 4
2 6 5
2 6 6
2 6 7
2 6 8
2 69 5
.
1 3
2 7 0
2 7 1
2 7 2
2 7 3
2 7 4
2 7 5
2 7 6
2 7 7
27 8
2 7 9
2 8 0
2 8 1
2 8 2
2 8 3
2 8 4
2 8 5
2 8 6
2 8 7
2 8 8
2 8 9
2 9 0
2 9 1
2 9 2
2 9 3
2 9 4 5
.
1 8
q舀40尸介宁曰5O一5
‘往‘山石OJ
.⋯5b户n亡Jta刁
3246.7
表 3 最 富含信息 t 的波长通道
波长 ( n m ) 信息量 波 长( n m ) 信息量
个主因子空间的图形分布 , 其中横 坐标代表
第一主成分 , 纵坐标代表第二主成分 。
n尸口9曰O八OJ工了Lng一.
.⋯口Q口目OOJ2 4 82 5 12 50
2 47
2 52
2 4 6
2 5 3
2 碑5
2 4 4
2 5 4
8
.
5 7
8
.
2 5
7
.
9 2
7
.
4 4
7
.
2 2
4 主成分分析结果
主成分分 析结果是 通过适 当的数学 变
换 , 最大限度地保 留原样本集所含原始信息 ,
使新变量成为原变量的线性组合 , 并寻求主
成分未研究样本的一种方法 , 运算结果如下 :
第一主成分的特征值 入, 一 9 . 5 1 02 , 方差贡献
率 为 95 . 1 0 , 第 二 主 成 分 的 特 征 值 入: ~
0
.
3 2 5 2
, 方 差贡献率 为 3 . 25 , 二个 主成分 的
累计方差贡献率为 98 . 35 。 图 1 为样本在两
《中草 药》19 98 年第 29 卷第 1 0 期
图 1 所有样本的主成分分析图
从 P C A 图可见 : 商品流通中的主流样本
野葛和粉葛 , 二者相近 , 与其它样本的分离明
显 , 它们的共 同特征是总黄酮及葛根素 、大豆
.
6 5 3
昔元和大豆昔等异黄酮 活性成分含量较高 ,
植物特征为托叶背着 , 不裂 。野葛产于黄河 以
北 , 1 、 2 、 3 号聚在一起 ;产于黄河 以南的 4 、 5 、
6 号聚在一处 , 它们的活性成分含量低于 1 、
2
、
3 号北方产的野葛 。 7 、 8 、 9 、 1 0 、 1 1 号为粉葛
聚在一处 , 它们黄酮类活性成分含量低 于野
葛 , 而淀粉含量较高 。
1 2 号是峨 嵋葛 , 形态 、 成分与野葛和 粉
葛相似 , 靠近主流样本 。
1 3 号 密花葛 , 14 号黄 毛葛 , 1 5 、 1 6 号食
用葛 , 这三种植物的共同形态特征是托叶基
部二裂 , 呈箭头形 , 聚在一处 。 13 号密花葛 ,
其主根含大量水分 , 黄酮类成分低 , 有别于葛
属其它植物 。 14 号黄毛葛 , 1 5 、 1 6 号食用葛 ,
与野葛相比 , 总黄酮和葛根素的含量低 , 而大
豆昔及大豆昔元的含量则无明显差异 。
17 号 山葛 , 其 植物形态 与野 葛相似 , 但
其总黄酮和葛根素等活性成分含量很低 。
位于 P CA 图左上方的 1 8 、 1 9 、 20 号植物
的托叶为基部着生 。 1 8 、 19 号苦葛 , 以其根苦
麻 、有毒 、粉末具强刺激性而迥异于葛属其它
植物 , 总黄酮及葛根素 、大豆昔和大豆昔元的
含量低 , 皂昔含量则明显高于其它种 。 20 号
三裂叶葛 , 其根细小 , 果实细长无毛 , 植物形
态与本属植物有较大差异 , 黄酮类成分亦低 。
5 小结
5
.
1 从 PCA 结果可知 , 主流样本野葛和粉
葛相近 , 说 明二者成分较为一致 ; 与其它样本
间有一定差距 , 说明葛属的其 它种 同野葛和
粉葛 的化学成分有所不 同 , 不宜作为葛根入
药 。 此结果与 T LC 及 H P LC 测定结果基本
一致 (另文发表 ) 。
5
.
2 峨嵋葛的归属有争议 , 中科院华南植物
所认为 , 其独立成种的理 由不充分 , 应归属于
山葛 P . lo ba ta v a r . m o n ta n a 〔2〕 。 中国 医科院
药植所从化学成分 的角度不同意此观点〔3〕 ,
但作何归属未作明确表态 。 根据 PC A 分析 ,
我们同意峨嵋葛独立成种不合适 , 但其化学
成分与野葛和粉葛相似 , 归属于野葛或粉葛
较为合理 。
5
.
3 从 PC A 图上可知 , 山葛与主流样本野
葛和粉葛相距较远 , 化学成分相差较大 , 特别
是 主要活性成分葛根素的含量甚微 , 从化学
角度看 , 作为野葛的变种似乎不妥 , 还应独立
成种 。
5
.
4 中药 以其化学成分的多样性和模糊性
为特点 , 以 药材浸出液的紫外光谱为基础进
行质量分析 , 用量少 , 灵敏 , 具较强的实用性 ,
采用主成分分析把紫外光谱作为一整体在以
Sh a n n o n 方程提取特征后进行综合评价 , 避
免了单纯 以某一指标或某个指标 (如峰位 , 峰
强度等 )进行定性比较的不确定性 ; 反映的是
总化学特征 , 聚为一类的 , 暗示它们的总化学
成分相似 ;是从化学成分角度研究中药质量
的又一种具有前途的方法 。当然 , 紫外光谱仅
仅反 映了部分具有紫外 吸收化学成分 的行
为 , 若结合红外光谱 、药效学实验等技术评价
则更为全面 。 作者将另文报告该方面的工作 。
参 考 文 献
1 S e o t t D R
, e t a l
.
A rz al C h em
, 1 9 8 6 ; 5 8
:
8 8 1
2 吴德邻 , 等 . 热带亚热带植物学报 . 1 9 9 1 ; 2 : 12
3 顾志平 , 等 . 药学学报 , 1 9 9 6 ; 3 1 (5 ) : 3 8 7
(1 9 9 7
一
0 7
一
1 6 收稿 )
S tu d ies o n R a d ix Pu e r a r ia e (P u era ri a lo b a ta )b y C h em ic a l P a tte r n R ec o g n itio n
Z e n g M in g
,
Z h a n g H a n m in g
,
Z h e n g S h u iq in g
, e t a l
.
(C o lle g e o f Ph a r m a e y
,
S ee o n d M ilit
a ry M
e diea 1 U
-
n iv e r s ity
,
S h a n g h a i 2 0 0 4 3 3 )
A b s tr a e t C he m ie a l p a t te r n r e eo g n it io n o f P u e r a r ia lo b a ta (W illd )
.
O h w i a n d 8 kin d o f P u e ra
r ia
p la n t s fr o m diffe r e n t P a r t s o fC h in a w e r e e a r rie d o u t b y PC A m e th o d t o p r o v id e a b a sis fo r th e q u a lity e o n t r o l
a n d e la s s ific a t io n o f p la n t s P u e r a r z a
K e y w o rd s P C A S ha n n o n
·
6 5 4
.
D C
.
in fo r m a tio n th e r o y r a d ix P u e r a ria e P u e r a r ia D C
·