免费文献传递   相关文献

Dual index information markedly similar sequence clustering analysis on IRfingerprint spectra of extracts of Guiful Dihuang and Jinkui Shenqi pills with ethanol

双指标信息显著相似序列聚类分析桂附地黄丸金匮肾气丸无水乙醇提取物红外指纹图谱



全 文 :双指标信息显著相似序列聚类分析桂附
地黄丸金匮肾气丸无水乙醇提取物红外指纹图谱
邹华彬
(山东大学 化学与化工学院,山东 济南 250100)
[摘要] 目的:本研究提出了一种适用于复方中成药鉴别及质量控制的理论方法———双指标信息显著相似序列聚类分
析。方法:根据作者等建立的共有峰率和变异峰率双指标序列分析法,构建了双指标信息方程,将共有遗传信息和变异信息
综合成单一信息量,综合刻画生物样品的性质。确定双指标信息显著相似序列并用于聚类分析。结果:将该法应用于组成极
其相似的桂附地黄丸和金匮肾气丸无水乙醇提取物红外指纹图谱分析,可以精细准确地将2种复方中成药分类。结论:本研
究建立的双指标信息显著相似序列聚类分析法,是一种优良的适用于生物复杂体系的模式识别方法。
[关键词] 双指标信息;聚类分析;模式识别;桂附地黄丸;金匮肾气丸;指纹图谱
[收稿日期] 20090506
[通信作者] 邹华彬,博士,副教授,中药鉴别及质量控制,生物复
杂体系理论分析。Tel:(0531)86887960,Fax:(0531)88564464,E
mail:huabinzou@126.com
  中药鉴别和质量控制是中医药现代研究的基
础。目前中药质量控制研究发展的理论方法主要针
对中药材的真伪鉴别、产地鉴别及中药质量的定量
评价研究[1]。由于同类中成药缺乏中药材的外观、
色泽、形状、尺寸等直观品质鉴别指标,无法合理建
立标准样品,适用于中药材质量控制的方法不太适
用于中成药的鉴别和质量控制。中成药鉴别实际上
类似于黑箱系统分析,具有极大的困难性。另外,由
于多数中成药由几种至十几种中药材提取物组成,
含有成百上千种相同成分,也是中成药科学鉴别及
质量控制困难的根本原因。发展适用于中成药鉴别
及质量控制的理论方法具有重要的理论意义和应用
价值。
发展适用具有无监督聚类及样品明确分类特征
的模式识别方法,是解决中成药鉴别及质量控制的
重要研究方向。本研究在已有研究工作基础上,建
立了共有峰率和变异峰率双指标序列分析法[29],提
出了一种适用于中成药鉴别和质量控制的理论方
法[10],即根据共有峰率和变异峰率双指标序列分析
中的相似信息和变异信息,提出了一种基于信息的
理论模型———双指标信息量方程。基于该方程,初
步建立了一种适用于中成药的模式识别方法———双
指标信息显著相似序列聚类方法。
中药指纹图谱分析可以反映中药材和中药产品
中的成分种类及含量信息,已被广泛应用于中药的
质量控制研究中[114]。红外光谱反映的是被测中药
所含多种组分在红外光区域内各官能团吸收的叠
加,不同药材或不同产地的药材,只要各化学成分的
种类和含量不同,红外指纹图谱就会有差异[15]。
桂附地黄丸及金匮肾气丸在《中国药典》1995,
2000,2005年版一部均有收载。桂附地黄丸由肉
桂、牡丹皮、山茱萸、熟地黄、附子、茯苓、山药、泽泻
8味中药组成;金匮肾气丸由桂附地黄丸加牛膝、车
前子组成。2种中成药化学组成较为相似,如果采
用高效液相色谱法对其中的大部分成分进行分离分
析及质量控制,将是十分耗时、费用高昂的困难工
作。二者的鉴别及质量控制目前研究较少[1617]。
本研究对18种金匮肾气丸和桂附地黄丸无水
乙醇提取物红外指纹图谱进行了聚类分析。研究结
果表明,运用双指标信息显著相似序列聚类分析方
法,可以准确鉴别不同品种的组成非常近似的复方
中成药金匮肾气丸和桂附地黄丸产品。
1 双指标信息理论模型的建立
生物遗传与变异是生命演化的基础,因此,遗传
与变异信息的研究是揭示生命演化规律的重要方
法。作者等建立的共有峰与变异峰率双指标序列分
析法,利用遗传信息———共有峰率和变异信息———
变异峰率,可以同时精细刻画任意2个样品之间的
94
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009
相似性和差异性[27],但该法无法综合两类信息成单
一信息。美国科学家香农建立了经典信息理论[18],
在该理论中,信息量的计算公式如下:
I=-∑

i=1
PilogPi (1)
∑Pi=1
Pi=
ni
N,N=∑

i=1
ni
  i=1,2,3,…,m,代表不同的相互独立的随机事
件。
该理论是建立在事件随机分布的基础上,被应
用于聚类分析[1921],主成分分析[22],决策树分
析[2324],蛋白质结构[25],化学计量学[26]。生物体系
作为一个生化反应体系,各种化学反应之间存在着
广泛的相互联系,并非随机体系。变异元素与遗
传———共有元素之间存在着相互作用,决定了生物
演化的途径及存在状态,因此,理论上经典的香农
信息理论,不适应于描述有相互作用的体系,需要建
立适用于生命体系的信息理论方法。目前,缺乏关
于香农信息理论应用于遗传与变异信息研究的报
道。本研究在双指标序列分析法的基础上[29],建立
了一种描述生物遗传与变异信息的理论模型———双
指标信息量方程,该法将生物的遗传与变异信息整
合成统一的单一信息,形成一种全信息的生物理论
描述模型。
1.1 双指标信息理论
1.1.1 共有峰率及变异峰率双指标定义和计算 
双指标共有峰率及变异峰率,反映了任意样品之间
的相似信息及变异性信息。对于任意一个样品,双
指标反映了样品的演化全信息。
根据文献[27],共有峰率及变异峰率双指标定
义和计算公式如下:
共有峰率P:2个比较的 IR指纹图谱中的共有
峰数与该2个IR图的独立峰数的比值。
独立峰:红外指纹图谱中不同的吸收峰。
P=(Ng/Nd)×100%   (2)
P:共有峰率;Ng:共有峰数,指在比较的 2个
IR指纹图谱中都出现的吸收峰的个数。Nd:独立峰
数,指相互比较的2个 IR指纹图谱中的独立峰总
数。
Nd=Ng+na+nb  (3)
na:指纹图谱 a中相对与其共有峰的非共有峰
数,称为a的变异峰数。
nb:指纹图谱b中相对与其共有峰的非共有峰
数,称为b的变异峰数。
变异峰率Pv:1个指纹图谱的变异峰率 Pv是该
IR图中相对于共有峰的变异峰数与其共有峰数的
比值。
Pva=(na/Ng)×100%
Pvb=(nb/Ng)×100%    (4)
Pva:指纹图谱 a的变异峰率。Pvb:指纹图谱 b
的变异峰率。
Na=Ng+na
Nb=Ng+nb     (5)
Na:指纹图谱a的总峰数。Nb:纹图谱b的总峰
数。
共有峰率和变异峰率双指标序列:
以任一样品为参考,分别计算与其他样品红外
指纹图谱的共有峰率和变异峰率,并且根据共有峰
率由大到小排成一个序列(包含共有峰率和变异峰
率值),该序列称为共有峰率和变异峰率双指标序
列。
由于生物演化路径的开放性、多样性,导致生物
关系的非对称性因此仅仅采用一个标准来刻画多
个样品之间的关系,不能得到正确的结论。采用共
有峰率和变异峰率双指标序列分析法,通过该序列
可以精确知道任意一个样品与其他样品的远近关
系,从而可以避免在单一序列空间中比较不同样品
造成的错误。同时变异峰率指标可以在更深的层次
上确定样品之间的异同。
同时,在较大样本情况下,利用双指标序列分析
法及其表示可以使分析结果呈现有序的排列,分析
结果简单明了。
1.1.2 定义双指标信息量计算公式 相似性信息
量:对于相互比较的2个中药复方,它们的红外指纹
图谱共有峰率Pg=
Ng
Nd
反映的是样品间的相似性程
度,其共有峰存在的几率也是Pg。
相似性信息量定义为:-
Ng
Nd
ln
Ng
Nd
=-PglnPg (6)
变异性信息量:对于相互比较的2个中药复方,
样品A的红外指纹图谱变异峰率 Pva=
na
Ng
,其变异
峰na存在的几率是Pa=
Na
Nd
,样品A的变异信息量定
义为:
05
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009

Na
Nd
ln
na
Ng
=-PalnPva   (7)
样品 B的红外指纹图谱变异峰率 Pvb=
nb
Ng
,其
变异峰nb存在的几率是Pb=
nb
Nd
,样品B的变异信息
量定义为:

nb
Ng
ln
nb
Ng
=-PblnPvb  (8)
双指标信息量方程:
任意2个相互比较的中药复方红外指纹图谱的
全信息量为:
I=-(
Ng
Nd
ln
Ng
Nd

na
Nd
ln
na
Ng

na
Nd
ln
na
Ng
)=-(PglnPg+Pa
lnPva+PblnPvb)  (9)
方程(9)称为双指标信息量方程。
3种信息发生的几率之和:
Pg+Pa+Pb=
Ng
Nd

na
Nd

nb
Nd
=1  (10)
在上述公式中,Pva=
na
Ng
,Pvb=
nb
Ng
反映的是变异
元素na,nb与共有元素 Ng之间的相互作用 设想
A,B2个样品由共同的祖先演化生成,在开始二者
完全相同,共有峰率 Pg=
Ng
Nd
=1,变异峰率 Pva=
na
Ng
=0,Pvb=
nb
Ng
=0。由于演化,A,B2个样品出现变
异,经过生化反应,共有元素Ng与变异元素na,nb之
间必有生化作用近平衡,并简化成如下表示:
Ngna

nb
采用变异峰率 Pva=
na
Ng
,Pvb=
nb
Ng
可以描述这两
种变异作用的强度。Pva,Pvb越大,变异作用越显著,
反之越小。
上述双指标信息量,反映了任意2个样品的相
似和变异信息,形成单一全信息变量,可以综合刻画
生物样品之间的信息。
1.2 双指标信息量方程最大信息量状态分析
对于双指标信息量方程:
I=-(
Ng
Nd
ln
Ng
Nd

na
Nd
ln
na
Ng

na
Nd
ln
na
Ng
=-(PglnPg+Pa
lnPva+PblnPvb)  (11)
设Pb=kPa,Pvb=kPva,0≤k≤1。
由关系式(1)~(5),(11),双指标信息量方程
可表示为,I=-{PglnPg+Pg/(1+k)(1/Pg-1)
[ln1/(1+k)(1/Pg-1)+klnk/(1+k)(1/Pg-
1)]}
该方程存在着极大值信息量 Imax。考虑两种情
况,①样品 A,B对称变异,即 k=1,在此情况下经
计算表明,获得最大信息量时,共有峰率为 Pg=
6100%,②样品 A,B极端非对称变异,k=0,在此
情况下经计算表明,获得最大信息量时,共有峰率为
6950%。根据双指标序列分析法,2个样品的共有
峰率越高,相似性越大。因此,根据上述生物光谱信
息量方程的极值分析,当2个样品的共有峰率由 Pg
=100% 降低至小于6100%或6950%,说明二者
性质发生了显著的质变。考虑到生物样品一般情况
下趋近对称变异,2个样品的共有峰率在 Pg=
6100%~100%,二者性质具有较高的相似性。
1.3 双指标信息显著相似序列定义
根据双指标信息量方程极值分析,Pg=6100%
~100%的样品具有较高的相似性,他们的性质没有
发生显著变化,该部分序列定义为双指标信息显著
相似序列,或双指标信息显著相似样品组。
1.4 双指标信息显著相似序列聚类分析
如同参考文献[10]中的优良等级序列,在每个
样品的双指标序列中,双指标信息显著相似序列,具
有与该参考样品较高的相似性,该序列中的样品可
以确定为该参考样品的显著相似样品组。
显著相似序列中的样品与对应序列参考样品具
有最大的信息相似性,最能代表参考样品的品质,表
征参考样品的性质,构成每个样品的有效分类信息,
消除与参考样品差异较大的冗余分类信息。根据不
同样品的显著相似样品组的相似程度对各样品进行
模式识别。
1.5 结果的优化检验
同一类样品双指标信息显著相似序列中相同样
品最多,不同样品最少。将不同类中的样品相互交
换,将使相同样品减少,不同样品增加。对每一个样
品进行检验,可以得到优化的模式识别结果。
2 仪器与试剂
2.1 仪器
NICOLET5700FTIR傅立叶变换红外光谱仪
(美国NicoletInstrumentCorporation)光谱范围4000
15
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009
~400cm-1,分辨率4cm-1。紫外可见分光光度
计(UV240,日本岛津),分析天平,精度00001g。
2.2 药材及试剂
氯仿(AR)、无水乙醇(AR)、KBr(AR)(天津
科密欧化学试剂有限公司)。桂附地黄丸和金匮肾
气丸样品见表1。
表1 桂附地黄丸和金匮肾气丸样品
样品 名称 来源 生产日期 生产批号
S1 桂附地黄丸 合肥神鹿双鹤九华药业有限公司     2003.04.14 0303493
S2 桂附地黄丸 合肥神鹿双鹤九华药业有限公司     2003.09.01 0308413
S3 桂附地黄丸 河南宛西制药股份有限公司       2003.12.21 031204
S4 桂附地黄丸 河南宛西制药股份有限公司       2004.07.19 040702
S5 桂附地黄丸 河南宛西制药股份有限公司       2005.02.21 050203
S6 桂附地黄丸 河南宛西制药股份有限公司       2006.01.05 060101
S7 桂附地黄丸 芜湖张恒春商业有限公司        2004.08.12 20040802
S8 桂附地黄丸 芜湖张恒春商业有限公司        2004.08.12 20040802
S9 桂附地黄丸 安庆亿达丰药业有限公司        2004.05.25 040520
S10 桂附地黄丸 苏州长甲药业有限公司         2005.05.17 0505171
S11 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2003.03.11 3030440
S12 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2003.03.11 3030440
S13 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2004.03.30 4030045
S14 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2004.08.02 4032954
S15 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2004.08.23 4032972
S16 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2005.07.07 5032371
S17 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2005.07.07 5032372
S18 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 2005.08.10 5032879
3 方法与结果
3.1 最佳提取条件
把以上中成药样品粉粹成粉末,过60目筛,60
℃ 烘干2h,分别称取桂附地黄丸和金匮肾气丸样
品各050g(平行3份)分别置索氏提取器中,用60
mL氯仿为提取溶剂加热回流,每隔05h取出1mL
回流液稀释一定倍数,用紫外分光光度计测定最大
吸收峰的吸光度,至吸光度基本恒定确定最佳氯仿
提取时间为15h。挥干样品所吸收的氯仿,样品再
用60mL无水乙醇为提取剂,操作同上,确定无水乙
醇的最佳提取时间皆是20h。
3.2 测试样品制备及测试条件
准确称取200g桂附地黄丸(平行3份),置索
氏提取器中,依次用60mL氯仿、乙醇提取15,20
h。将无水乙醇提取液倒入蒸发皿,水浴蒸发浓缩并
装入样品管冷藏保存。金匮肾气丸提取方法相同。
液膜法测试其红外指纹图谱,灵敏度为 60%,25
cm-1平滑,每份提取物平行测量3次指纹图谱,每
个样品的红外指纹图谱峰是9次测量组合指纹图谱
的平均值。
3.3 重复性试验
在相同条件下,桂附地黄丸同一份无水乙醇提取
物平行测量7次,任意3次组合谱的共有峰率大于
7500%,金匮肾气丸同一份无水乙醇提取物平行测
量7次,任意3次组合谱共有峰率大于7778%。
3.4 稳定性试验
同一份无水乙醇提取物在0~4℃下保存,每隔
1周用液膜法测量1次,连续测4次,比较结果具有
较好的稳定性。桂附地黄丸3次组合谱共有峰率大
于 7468%,金匮肾气丸共有峰率大于8333%,具
有很好的稳定性。
3.5 无水乙醇提取物红外指纹图谱
桂附地黄丸金匮肾气丸无水乙醇提取物红外指
纹图谱见图1。
图1 桂附地黄丸金匮肾气丸无水乙醇提取物
红外指纹图谱
  自3350cm-1左右从上到下依次:S1,S4,S13,
S8,S11,S10,S6,S16,S15从图1可见,桂附地黄丸
25
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009
与金匮肾气丸无水乙醇提取物红外指纹图谱具有高
度的相似性,不易区分。
3.6 无水乙醇提取物红外指纹图谱双指标信息显
著相似序列聚类分析
根据共有峰和变异峰的理论判别方法W检验
法[15]及文献[3]中的方法,确定无水乙醇提取物红
外指纹图谱共有峰和变异峰,进行红外指纹图谱共
有峰率和变异峰率计算并确定18个样品的双指标
序列。
根据本文提出的双指标信息理论模型,当任意
2个样品的共有峰率等于大于61% 时,2个样品具
有显著的相似性,由此可以确定每种样品的双指标
信息显著相似序列,根据每种样品的显著相似序列,
18种样品分为显著不同的A,B两类。见表2。
表2 18种样品的双指标信息显著相似序列
分类 样品 各样品显著相似序列
A S1 (S1)1)S2S3S4S102)  
  S2 S1(S2)S3S4  
  S3 S1S2(S3)S4S5S6S7S8S10 S11S13S14S153)
  S4 S1S2S3(S4)S5S6S7S8S10 S12
  S5 S3S4(S5)S6S7S8S9 S12
  S6 S3S4S5(S6)S7S8S9S10 S11S13S14S15
  S7 S3S4S5S6(S7)S8S9S10 S11S13S14S15
  S8 S3S4S5S6S7(S8)S9S10 S11S13S14S15
  S9 S5S6S7S8(S9)S10  
  S10 S1S3S4S6S7S8S9(S10)  
B S11 (S11)S12S13S14S15S16S17S18 S3S6S7S8
  S12 S11(S12)S13S14S15S16S17S18 S4S5
  S13 S11S12(S13)S14S15S16S17S18 S3S6S7S8
  S14 S11S12S13(S14)S15S16S17S18 S3S6S7S8
  S15 S11S12S13S14(S15)S16S17S18 S3S6S7S8
  S16 S11S12S13S14S15(S16)S17S18  
  S17 S11S12S13S14S15S16(S17)S18  
  S18 S11S12S13S14S15S16S17(S18)  
  注:1)每个样品自身属于其相似样品;2)核心表征序列;3)非核心表征序列部分,核心表征序列共同构成表征序列,该部分具有亚类鉴别作用。
  显著相似样品序列由两部分构成,其一,核心表
征序列,由属于该类的样品组成,占显著相似样品序
列中主要部分。其二,非核心表征序列,由其他类样
品组成,只占显著相似序列的小部分。核心表征序
列构成分类功能,不同类样品核心表征序列中的样
品完全不同。
从上述分析结果看,根据每个样品的显著相似
样品组,18种样品被清晰地聚成两类,第1类为桂
附地黄丸,包括 S1,S2,S3,S4,S5,S6,S7,S8,S9,
S10,形成A类。该类样品的核心表征序列由该类
样品构成,占整个显著相似样品组的主要部分,非核
心表征序列由少数几种 B类中的样品构成。第 2
类为金匮肾气丸,包括 S11,S12,S13,S14,S15,S16,
S17,S18,形成B类。该类样品的核心表征序列由该
类样品构成,占整个显著相似样品组的主要部分,非
核心表征序列由少数几种A类中的样品构成。
从两类样品的非核心表征序列看,A类中10个
样品,其中6个有非核心表征序列,且由 B类样品
构成,同样B类中8个样品,其中5个有非核心表征
序列,且由 A类样品组成。上述结果说明,两类样
品存在一定的相似性,这主要因为它们的组成非常
近似。双指标信息显著相似序列聚类法对组成非常
相似的中药复方具有精细准确的鉴别能力。
在上述18种样品中,S7,S8;S11,S12;S16,S17
为3个批次的不同样品。同一批次的样品,由于原
材料品种、产地、加工方法、储存条件都相同,因此同
一批次内的样品应该具有极高的相似性。实验结果
表明,每个批次的显著相似样品组相同或具有很高
的相似性,说明该方法具有合理性、正确性。
该结果说明,采用双指标信息量方程确定的每
个样品的显著相似样品组,可以很好地表征对应的
每个样品的特性,消除冗余信息,实现组成非常相似
的生物复杂样品的准确模式识别,具有优良的模式
识别能力。
35
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009
4 结论
从上述数据及结果可见,利用本研究建立的双
指标信息显著相似序列聚类法,可以有效鉴定组成
非常相近且复杂的中成药复方桂附地黄丸和金匮肾
气丸产品。本文提出了一种新的生物遗传信息和变
异信息计算方法,并将他们综合成全信息单一信息
量计算方程。利用该方程确定最大信息量所对应的
共有峰率,作为反映生物本性的参数,用于确定每个
样品的显著相似样品组,进行聚类分析,具有优良的
分辨能力及简洁特性。
[参考文献]
[1]  HuaBinzou,GuoShengyang,ZhengRanqin,etal.Progressin
qualitycontrolofherbalmedicinewithIRfingerprintspectra[J].
Anallet,2005,38(9):1457.
[2]  邹华彬,袁久荣,杜爱琴,等.甘草氯仿提取物红外指纹图谱
共有峰率和变异率双指标序列分析法[J].中国中药杂志,
2005,30(1):16.
[3]  邹华彬,袁久荣,杜爱琴,等.甘草水提物红外指纹图谱共有
峰率和变异率双指标序列分析法[J].中成药,2004,26
(10):779.
[4]  ZouHuabin,YuanJiurong,DuAiqin,etal.Dualindexse
quenceanalyticalmethodforIRfingerprintspectraofethanolic
extractofvariousGylcyrhizae'sRootspeciescomponents[J].A
nallet,2005,38(7):1167.
[5]  邹华彬,袁浩,王爱武,等.白芍紫外指纹图谱共有峰率和变
异峰率双指标序列分析[J].光谱学与光谱分析,2007,27
(9):1815.
[6]  庞涛涛,杜黎明.苦丁茶红外指纹图谱共有峰率和变异峰率双
指标序列分析法[J].光谱学与光谱分析,2007,27(3):486.
[7]  冀宪领,盖英萍,牟志美,等.白僵蚕的红外指纹图谱鉴别研
究[J].光谱学与光谱分析 SpectroscSpectAnal,2007,27
(1):66.
[8]  ZouHuabin,YangGuosheng,DuAiqin,etal.Combinational
numeralfingerprintspectraofGlycyrhizaandanalysisofcommon
peakratioinvariablenessinHPLC[J].BiomedChromatogr,
2006,20:642.
[9]  刘圆,孟庆艳,彭镰心,等.共有峰率和变异峰率双指标序列
法分析藏药材红毛五加特定指纹图谱[J].药物分析杂志,
2007,27(8):1182.
[10] 邹华彬,张新玲,翟红,等.明目地黄丸知柏地黄丸无水乙醇
提取物指纹图谱双指标等级序列模式识别[J].中国中药杂
志,2008,33(13):1543.
[11] 董彬,孙素琴,周红涛,胡世林.红外光谱和聚类分析法无损
快速鉴别赤勺[J].光谱学与光谱分析,2002,22(2):232.
[12] 周群,孙素琴,梁曦云.枸杞产地的红外指纹图谱与聚类分析
法研究[J].光谱学与光谱分析,2003,23(3):511.
[13] 程存归,应桃开.导数FTIR结合统计学法应用于中药延胡索
质量控制的研究[J].光谱学与光谱分析,2005,25(1):36.
[14] 叶正良,虞科,程翼宇.一种基于小波变换的近红外化学指纹
图谱分析方法[J].高等学校化学学报,2007,28(3):441.
[15] 邹华彬,袁久荣,王伟.中药指纹图谱共有峰的理论识别W
检验判别法[J].世界科学技术———中医药现代化,2004,6
(2):50.
[16] 张淑玉.金匮肾气丸质量标准探讨[J].中国现代临床医学,
2005,4(6):48.
[17] 杜素兰,耿爱萍,刘永忠.桂附地黄丸TLC鉴别方法的研究与
改进[J].中成药,2001,23(11):837.
[18] 金振玉.信息论[M].北京:北京理工大学出版社,1991:11.
[19] 王海东,刘元东.神经网络建模的变量聚类分析方法[J].计
算机工程,2004,30(10):16.
[20] 王鹏,杨士强,刘志强.信息论联合聚类算法及其在视频镜头
聚类中的应用[J].计算机学报,2005,28(10):1692.
[21] 沈红斌,杨杰,王士同,等.基于信息理论的合作聚类算法研
究[J].计算机学报,2005,28(8):1287.
[22] 丁世飞,靳奉祥,王健,等.一种新的基于信息论的 PCA特征
压缩算法[J].小型微型计算机系统,2004,25(4):694.
[23] 朱宇光,黄树成.一种基于信息熵建立决策树的算法[J].常
州工学院学报,2006,19(1):55.
[24] 刘培勋,MarcRoubens.基于信息论的决策树构建及其在分类
方面的应用[J].中国卫生统计,1994,11(3):19.
[25] 李炜疆,宋江宁.同义密码子携带多少蛋白质二级结构信息
[J].生物物理学报,2003,19(1):41.
[26] 梁逸曾,俞汝勤主编.化学分析手册(10分册)化学计量学
[M].2版,北京:化学工业出版社,2005:195.
DualindexinformationmarkedlysimilarsequenceclusteringanalysisonIR
fingerprintspectraofextractsofGuifulDihuangandJinkui
Shenqipilswithethanol
ZOUHuabin
(SchoolofChemistryandChemicalEngineeringofShandongUniversityeastcampus,Jinan250100,China)
[Abstract] Objective:Inthispaper,anovelmethodDualindexinformationmarkedlysimilarsequenceclusteringanalysis
45
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009
suitableforidentificationandqualitycontrolofformulaChinesepatentmedicinewasestablished.Method:Basedoncommonandvari
ationpeakratiodualindexsequenceanalysisproposedbyauthors,anewequationwasbuiltup,inwhichthecommoninheritedandva
riantinformationcanbeintegratedintouniqueinformationrepresent.Itdescribesthepropertiesofbiologicalsamplessimplyandsyn
theticaly.TheDualindexinformationmarkedlysimilarsequenceweredeterminedandusedtoclustersamples.Result:thenovelap
proachwasappliedforpaternrecognitionofIRfingerprintspectraofcomponentsofGuifuldihuangandJinkuishenqipils,composed
ofextremelysimilarcomponentsextractedwithethanol,canbeclassifiedaccuratelyanddistinctly.Conclusion:theDualindexinfor
mationmarkedlysimilarsequenceclusteringmethodisanexcelentpaternrecognitiononefittoanalyzebiologicalycomplexsamples.
[Keywords] Dualindexinformation;clustering;paternrecognition;GuifulDihuangPil;JinkuiShenqipil;fingerprint
spectra
[责任编辑 周 驰]
55
第34卷第17期
2009年9月
                           
Vol.34,Issue 17
 September,2009