免费文献传递   相关文献

田基黄高效液相色谱指纹图谱共有模式的研究



全 文 :第 21卷 第 6期
Vo.l 21 No. 6
钦 州 学 院 学 报
JOURNAL OF QINZHOU UNIVER SITY
2006年 12月 
Dec. , 2006 
  [收稿日期 ] 2006 09 27
  [作者简介 ] 蔡泽凡(1979 -), 男 ,广东陆丰人 , 顺德职业技术学院电子工程系助教.
田基黄高效液相色谱
指纹图谱共有模式的研究
蔡 泽 凡
(顺德职业技术学院 电子工程系 , 广东 顺德 528300)
  [摘 要 ]  高效液相色谱指纹图谱已经普遍应用于中药材及制剂的分析检测 ,在用高效液相色谱指纹
图谱进行分析中 , 建立图谱的共有模式是关键的一环 , 共有模式的好坏直接影响分析的结果. 以田基黄的高效
液相色谱指纹图谱为例 ,说明了一种建立共有模式行之有效的方法.
  [关键词 ]  高效液相色谱(HPLC);田基黄;聚类分析;共有模式
  [中图分类号 ] TP391. 41  [文献标识码 ] A  [文章编号 ] 1673 8314(2006)06 0047 04
  提高质量控制水平是实现中药现代化的关
键.中药是成分复杂的混合体系 , 要达到鉴别真
伪 ,评价原料药材、半成品和成品质量稳定的目
的 ,首选高效液相色谱指纹图谱.
  高效液相色谱指纹图谱之所以普遍应用于中
药材及制剂的分析检测 , 是因为高效液相色谱
(HPLC)具有分离效能高、分析速度快 、方法重现
性好、适用的样品类型广泛等优点. [ 1 , 2]而在分析
的过程中 ,首先必须建立所有样本的一个公共的
标准 , 也就是它们的共有模式 ,有了共有模式 ,才
能比较它们之间的相似度.可见 ,共有模式的建立
是非常关键的 ,共有模式的好坏 ,决定了利用高效
液相色谱指纹图谱进行分析的成败.
1 相关知识介绍
1. 1 C -均值算法 [ 3]
  C -均值算法也叫 K -均值算法 ,它是一种动
态聚类方法 ,这个算法的基础是误差平方和准则.
设样本集 Y可以分为 C类 , Γ1, Γ2, …, ΓC 表示 C
个样本子集 , m 1, m2 , …, mC代表 C个聚类中心.
  若 N i是第 i聚类的样本数目 , m i是这些样本
的均值(聚类中心),即
    m i = 1N
i

y Γi
y (1)
  把 Γi中的各个样本 y与均值 m i间的误差平
方和对所有类相加后为
    Je =∑c
i=1 ∑y Γi‖ y - m i‖ 2 (2)
Je是误差平方和 ,对于不同的聚类 , Je的值是不同
的 ,使 Je极小的聚类是误差平方和准则下的最优
聚类结果。详细内容请参阅文献[ 3] .
1. 2 分级聚类分析 [ 3]
  由于聚类分析只是把 N个没有类别标签的
样本分成一些合理的类 , 在极端的情况下 ,最多可
分为 N类 ,最少只有一类 ,因此我们可以把问题看
成是将 N个样本划分成 c个类的划分序列。第一
个划分是把样本分成N个类 ,每类包含一个样本;
第二个划分是把样本分成N - 1个类;下一个划分
是把样本分成 N - 2个类 ,等等 ,直到第 N个划分
时 ,把样本仅分成一个类.
  如果类数 c =N - K +1,则我们称这个划分
处于 K水平。任何两个样本 yi和 yj总会在某一水
平被分为同一类。分级聚类就是这样一种划分序
列. 这种划分序列具有如下的性质:只要在K水平
时被归入同一类后 , 在进行更高水平的划分时 , 它
们也永远属于同一类.详细内容请参阅文献 [ 3] .
2 田基黄样品的选取
  本文用到的田基黄、遍地金高效液相色谱指
钦州学院学报 第 21卷
纹图谱以及它们的实验条件 、获取方法均由中山
大学现代中药质量研究开发中心提供 , 在此特别
感谢中山大学现代中药质量研究开发中心以及该
中心的苏薇薇教授等人.
  田基黄(Hypericum japonicum Thumb. )又
名地耳草 , 民间别名有小元宝草、雀舌草 、七层塔
等 , 为藤黄科植物地耳草的全草 , 一年生小草
本. [ 4] 广布长江流域及以南各省区;缅甸 , 印度 ,
斯里兰卡 ,日本 , 大洋洲 ,生于田野较湿处。全草入
药 ,能清热解毒 , 止血消肿 ,治肺炎 ,跌打损伤及疮
毒.
  为了能全面反映实际情况 , 我们从药材的产
地 、品种、栽培、加工等方面进行考虑 ,选取了田基
黄的 30多个样品 ,表 1列出了部分样品的信息.
表 1 部分田基黄样品以及其他样品的有关说明
编号 产地 来源 备注
1 广西桂林 2002.8购于广西桂林药材站 饮片
2 广西桂平 2002.8购于广西桂平 长约 40cm
5 广东东莞 2003.8采集 饮片
8 江西万安 2003.7采集 长约 40cm
9 广东惠州 2003.9采集 长约 25cm
10 浙江温州 购于浙江温州 饮片
11 湖南邵阳 2003.7采集 饮片
12 云南昆明 购于云南昆明 饮片
13 云南蒙自 购于云南蒙自 长约 15cm
… …… …… ……
34 未知品种 ,但是和田基黄样品的图谱相差甚大
35 某一个田基黄图谱头尾对调得到的新图谱
36 遍地金 ,人们误把其当作田基黄
图 1 田基黄的典型 HPLC指纹图谱
3 田基黄 HPLC指纹图谱的获得
3. 1 色谱分析条件
  用十八烷基硅烷键合相硅胶为填充剂
(250mm ×4. 0mm, 5μm);二元线性梯度洗脱:A
为 0. 05mo l /L 磷酸二 氢钾缓冲 液 (磷酸调
pH3. 0), B 为 乙 腈 , 0m in(A:96%, B:4%) →
100m in(A:73%, B:27%);检测波长:300nm;温
度:28℃。理论板数按异槲皮苷计算应不低于
100000,分离度不小于 1. 5.
3. 2 HPLC指纹图谱的获取
  精密吸取对照品、供试品溶液各 10μl, 分别
注入液相色谱仪 , 测定 , 即得. (注:在正式获取
HPLC指纹图谱之前已经经过了稳定性测试和重
复性测试. )
  田基黄典型的 HPLC指纹图谱如图 1所示.
4 田基黄高效液相色谱指纹图谱共
有模式的建立
  高效液相色谱指纹图谱共有模式的建立一
般来说有均值法和中位数法 , 在我们的实验研究
中 ,这两种方法的效果都不理想 ,特别是在各个样
品的图谱对应的谱峰发生移位的情况下 , 情况更
加糟糕.鉴于此 ,我们采用了另外一种方法来建立
共有模式:先后进行两次共有模式的求取 ,并把最
后一次的共有模式作为最终的共有模式 , 下面进
行详细的介绍.
4. 1 高效液相色谱指纹图谱的预处理
  由于色谱分析条件的漂移和外部噪声等 , 高
效液相色谱指纹图谱存在基线漂移 、谱峰重叠、毛
刺等等 , 在建立共有模式之前必须对这些图谱进
行数据的预处理.通过基线漂移的抑制 、毛刺的去
除、谱峰的识别 、小峰的剔除等预处理 , 我们可以
得到每个图谱几十个谱峰 , 这些谱峰保留了田基
黄色谱指纹图谱的主要信息 , 可以作为建立共有
模式 、计算相似度的依据.
4. 2 求取高效液相色谱指纹图谱的共有模式
4. 2. 1 确定内参照峰
  根据田基黄指纹图谱的特性 , 选择一个在所
有田基黄指纹图谱都存在、而且其峰高明显比周
围的峰要高得多的峰作为内参照峰 ,在此 ,我们选
择的峰是已知成分槲皮苷 ,如图 1所示.
4. 2. 2 归一化
  把内参照峰的保留时间和峰面积定为 1, 将
其它峰的保留时间和峰面积分别除以内参照峰的
保留时间和峰面积 , 可以求得各个峰的相对保留
时间 α和相对峰面积值 Sr, 也即各个峰的归一化
值.
4. 2. 3 建立初始共有模式
  具体做法:对各个样品通过预处理保留下来
的谱峰进行比较 ,把不同的图谱上相对保留时间、
相对峰面积间差值的绝对值小于某个阈值的谱峰
视为相同的峰(由于色谱分析条件的细微变化和
外部噪声等 ,指纹图谱各个成分在洗脱过程中 , 其
48
第 6期 蔡泽凡:田基黄高效液相色谱指纹图谱共有模式的研究
保留时间存在一定的漂移 , 相对峰面积也存在一
定的差异 ,因此 , 我们允许某个特征峰在不同的样
本中可以存在一定的差异), 把在 n(n =75% ×
田基黄样品的个数)个样品中都存在的峰视为特
征峰 , 这些特征峰构成了田基黄高效液相色谱指
纹图谱的初始共有模式. [ 5]
4. 2. 4 共有峰的识别
  把田基黄各个样品的指纹图谱的谱峰和初
始共有模式进行比较 , 把对应的相对保留时间差
值的小于某个阈值 , 且相对峰面积相差也不大于
某个阈值的峰视为样品的共有峰。如果样品不存
在某个特征峰 ,则令其对应的相对峰面积为 0.
4. 2. 5 聚类分析
  以各个样品的共有峰作为参数 , 组成具有
N 1(N1 >5)个样本的样本集 ,采取 C -均值法或
者分级聚类分析方法对这些待检测的样本进行聚
类 ,对于田基黄样本来说 , 把期望聚类数目设置为
5可以收到良好的效果.
4. 2. 6 超常样本的剔除
  通过聚类分析 ,相似的样本将被归入同一聚
类中 , 我们可以把一些超常的聚类剔除 ,而保留下
较好的样本 ,用这些样本来求取最终的共有模式.
本文作者采取下面的剔除原则:
  如果待检测的样本存在明显的伪品 , 我们可
以事先将它们标记出来 , 然后把存在伪品的聚类
剔除;如果没有事先指定的伪品 ,我们则把具有最
少样本数的聚类剔除.
4. 2. 7 建立最终共有模式
  剔除超常样本后 ,假设还剩下 N 2 个样本 ,则
我们就用这 N 2个样本建立最终的共有模式. 建立
的办法很简单:求取这 N 2个样本共有峰的均值向
量 ,则这个均值向量就是我们所需要的最终共有
模式。
5 结果分析
5. 1 相似度的求取
  以共有峰的相对峰面积作为参数 , 采取夹角
余弦法求取相应的相似度 , 考察各个样本和最终
共有模式之间的相似程度.
  假设最终共有模式中有M个特征谱峰 ,可用
一个M维矢量 X 0 =[ x01, x02, …, x0M ] 表示该共有
模式 ,其中 x0i为第 i个谱峰的相对面积值 ,待测样
品的指纹图谱用另一矢量 X =[ x1 , x2, … , xM ] 表
示.在M 维矢量空间中 , 可以根据两矢量间夹角
的余弦函数计算共有模式样品 X0 和待测样品 X
两个指纹图谱间的相似度 , 计算公式如式 (3)所
示. [ 6]
r =(X0 , X) =∑M
i=1
x0i xi / ∑M
i=1
x20i ∑M
i=1
x2i
(3)
  用此方法 , 可以计算得到 N个样品的相似
度.
5. 2 实验结果
  下面的数据均是采用 C -均值方法聚类后得
到的结果.
  我们分别用样本数为 16、21、26、31、36的样
本集(均含有表 1中编号为 34 ~ 36的伪品 ,且每
次都把它们的编号安排在最后三个)进行实验 ,
其结果如表 2、表 3所示.
表 2 16个样品的相似度
样品编号
共有模式 1 2 3 4 5 6 7 8
相似度 1.0000 0. 9753 0. 9842 0. 9958 0.9821 0.9952 0. 9814 0. 9818 0. 99945
样品编号
9 10 11 12 13 14 15 16
相似度 0. 9606 0. 9834 0. 9395 0.9765 0.9685 0. 5027 0. 0141 0.5027
表 3 实验的正确率
样本数目 正确率 样本数目 正确率
16 16 /16 =100% 31 30 /31 =97%
21 20 /21 =95% 35 32 /36 =89%
26 26 /26 =100%
  表 2是当参与实验的样本集的样本数为 16
时的所得到的相似度 , 从表 2可以看出田基黄样
本的相似度都 ≥ 90%,而后面 3个伪劣样本的相
似度都 ≤ 51%, 如果我们把相似度 ≥ 90%视为
合格的标准 ,则 16个样本的识别正确率为 100%,
其他不同样本数的识别正确率如表 3所示.
  从表 3可以看出 ,用我们这里介绍的方法建
立高效液相色谱指纹图谱的共有模式是非常有效
的 ,当待鉴定的样本数在 36个以下时 , 其识别的
正确率为 89% ~ 100%,当待鉴定的样本数在 31
个以下时 , 其识别的正确率更是达到了 95% ~
100%.
[参 考 文 献 ]
[ 1] 石志红.中药指纹图谱技术 [ J] .大学化学 , 2004, 19(1):33.
[ 2] 周玉新.中药指纹图谱研究技术 [M ] .北京:化学工业出版
社 , 2003. (下转第 58页)
49
钦州学院学报 第 21卷
Fi lm s[ J] . Syn th etic Metals, 1999, 102:1346 - 1349.
[ 9] 谭松庭 ,张明秋, 曾汉民.屏蔽 EM I用导电性高分子复合材
料 [M ] .材料工程 , 1998, 5:6 - 9.
[ 10] 万刚,李荣德.电磁屏蔽材料的进展 [ J] .安全与电磁兼容 ,
2003, 1:40 - 41.
[ 11] 贾向明 ,李光宪 ,陆玉本等.本征导电高分子复合材料的研
究进展 [ J] .塑料科技 , 2003, 2:43 - 46.
Study on the E ffectiveness of E lectromagnetic Interference Shielding
of E lectric Conductive Polym er Composites
LIANG Shao-hua
(Department of Physics and E lectronic - Information Engineering , Qinzhou University, Qinzhou 53500 , China)
  Abstrac t:E lec tric conduc ting po lym er is one o f them ost prom isingm a te rials for e lec trom agnetic in te rference(EM I) shiel-
ding. According to the structu re and prepara tion, e lectric conductive po lym er can be divided into tw o ca tego ries: in trinsic and
comp lex. Them ain body and com pound technique o f electric- conductor - filled polym e r are them a jo r fac to rs tha t affect the e lec-
trom agne tic effectivene ss o f elec tric conductive po lym er com posites.
  K ey words:e lectrom agne tic inte rfe rence sh ie lding;e lectric conduc tive po lym er com posite s;sh ielding e ffectiveness
[责任编辑 江元杪 ]
(上接第 49页)
[ 3] 边肇祺 ,张学工等. 模式识别 [M ] .北京:清华大学出版社 ,
1999.
[ 4] 辛义周 ,张希成 ,唐文照.地耳草的化学成分及药理作用研究
进展 [ J] .山东医药工业 , 2003, 22(2):28.
[ 5] 洪莜坤 ,王智华.中药数字化色谱指纹谱 [ M ] .上海:上海科
学技术出版社 , 2003.
[ 6] 陈闽军 ,程翼宇 ,林瑞超.中药色谱指纹图谱相似性计算方法
的研究 [ J] .中成药 , 2002, 24(12):906.
Study on the Common Pattern of the H igh -Performance L iqu id
Chromatograph ic F ingerprint ofHypericum Japonicum Thumb
CA I Ze-fan
(E lectronicE ngineeringDepartment of ShundePolytechnic, Shunde 528300, China)
  Abstrac t:H igh - pe rfo rm ance liqu id chrom a tog raphy finge rprint has been w ide ly app lied to the detec tion and analy sis of tra-
ditiona l Chine sem edicine and its preparations. In o rde r to g ain good e ffec ts, it is the key po int to bu ild up an optim um comm on
pattern of the m ed ic ine finge rprin.t The high - perform ance liqu id chrom a tog raphy finge rprint o f hypericum japonicum thumb is
introduced to demonstrate a good m ethod to bu ild the common patte rn.
  K ey words:high - perfo rm ance liqu id chroma tog raphy;hype ricum japon icum thumb;cluste r analy sis;comm on patte rn
[责任编辑 卢明德 ]
58