全 文 :双指标信息显著相似序列聚类分析桂附
地黄丸、金匮肾气丸无水乙醇提取物红外指纹图谱
邹华彬
(山东大学 化学与化工学院,山东 济南 250100)
[摘要] 目的:本研究提出了一种适用于复方中成药鉴别及质量控制的理论方法———双指标信息显著相似序列聚类分
析。方法:根据作者等建立的共有峰率和变异峰率双指标序列分析法,构建了双指标信息方程,将共有遗传信息和变异信息
综合成单一信息量,综合刻画生物样品的性质。确定双指标信息显著相似序列并用于聚类分析。结果:将该法应用于组成极
其相似的桂附地黄丸和金匮肾气丸无水乙醇提取物红外指纹图谱分析,可以精细准确地将2种复方中成药分类。结论:本研
究建立的双指标信息显著相似序列聚类分析法,是一种优良的适用于生物复杂体系的模式识别方法。
[关键词] 双指标信息;聚类分析;模式识别;桂附地黄丸;金匮肾气丸;指纹图谱
[收稿日期] 20090506
[通信作者] 邹华彬,博士,副教授,中药鉴别及质量控制,生物复
杂体系理论分析。Tel:(0531)86887960,Fax:(0531)88564464,E
mail:huabinzou@126.com
目前中药质量控制研究发展的理论方法主要针
对中药材的真伪鉴别、产地鉴别及中药质量的定量
评价研究[1]。由于同类中成药缺乏中药材的外观、
色泽、形状、尺寸等直观品质鉴别指标,无法合理建
立标准样品,适用于中药材质量控制的方法不太适
用于中成药的鉴别和质量控制。另外,由于多数中
成药由几种至10余种中药材提取物组成,含有成百
上千种相同或相似成分,也是中成药鉴别及质量控
制困难的根本原因。发展适用于中成药鉴别及质量
控制的理论方法具有重要的理论意义和应用价值。
发展兼具有无监督聚类及样品明确分类特征的
模式识别方法,是解决中成药鉴别及质量控制的重
要研究方向。本研究在已有研究工作,共有峰率和
变异峰率双指标序列分析法[29]基础上,作者曾提出
了一种适用于中成药鉴别和质量控制的理论方
法[10],本研究则根据共有峰率和变异峰率双指标序
列分析中的相似信息和变异信息,提出了一种基于
信息的理论模型———双指标信息量方程。基于该方
程,初步建立了一种适用于中成药的模式识别方
法———双指标信息显著相似序列聚类方法。
中药指纹图谱分析可以反映中药材和中药产品
中的成分种类及含量信息,已被广泛应用于中药的
质量控制研究[115]。
桂附地黄丸及金匮肾气丸在《中国药典》1995,
2000,2005年版一部均有收载。桂附地黄丸由肉
桂、牡丹皮、山茱萸、熟地黄、附子、茯苓、山药、泽泻
8味中药组成;金匮肾气丸由桂附地黄丸加牛膝、车
前子组成。2种中成药化学组成较为相似,二者的
鉴别及质量控制目前研究较少[1617]。
本研究对18种金匮肾气丸和桂附地黄丸无水
乙醇提取物红外指纹图谱进行了聚类分析。研究结
果表明,运用双指标信息显著相似序列聚类分析方
法,可以准确鉴别不同品种的组成非常近似的复方
中成药金匮肾气丸和桂附地黄丸产品。
1 双指标信息理论模型的建立
生物遗传与变异是生命演化的基础,因此,遗传
与变异信息的研究是揭示生命演化规律的重要方
法。作者等建立的共有峰与变异峰率双指标序列分
析法,利用遗传信息———共有峰率和变异信息———
变异峰率,可以同时精细刻画任意2个样品之间的
相似性和差异性[27],但该法无法综合两类信息成单
一信息。美国科学家香农建立了经典信息理论[18],
在该理论中,信息量的计算公式如下:
I=-∑
m
i=1
PilogPi (1)
∑Pi=1
Pi=
ni
N,N=∑
m
i=1
ni
i=1,2,3,…,m,代表相互独立的随机事件。
·5232·
第34卷第18期
2009年9月
Vol.34,Issue 18
September,2009
该理论是建立在事件随机分布的基础上,被应
用于聚类分析[1921],主成分分析[22],决策树分
析[2324],蛋白质结构[25],化学计量学[26]。生物体系
作为一个生化反应体系,各种化学反应之间存在着
广泛的相互联系,并非随机体系。变异元素与遗
传———共有元素之间存在着相互作用,决定了生物
演化的途径及存在状态,因此,理论上经典的香农
信息理论,不适应于描述有相互作用的体系,需要建
立适用于生命体系的信息理论方法。目前,缺乏关
于香农信息理论应用于遗传与变异信息研究的报
道。本研究在双指标序列分析法的基础上[29],建立
了一种描述生物遗传与变异信息的理论模型———双
指标信息量方程,该法将生物的遗传与变异信息整
合成统一的单一信息,形成一种全信息的生物理论
描述模型。
1.1 双指标信息理论
1.1.1 共有峰率及变异峰率双指标定义和计算
双指标共有峰率及变异峰率,反映了任意样品之间
的相似信息及变异性信息。对于任意一个样品,双
指标反映了样品的演化全信息。
根据文献[27],共有峰率及变异峰率双指标定
义和计算公式如下。
共有峰率P:2个比较的 IR指纹图谱中的共有
峰数与该2个IR图的独立峰数的比值。
独立峰:红外指纹图谱中不同的吸收峰。
P=(Ng/Nd)×100% (2)
P:共有峰率;Ng:共有峰数,指在比较的 2个
IR指纹图谱中都出现的吸收峰的个数。Nd:独立峰
数,指相互比较的2个IR指纹图谱中独立峰总数。
Nd=Ng+na+nb (3)
na:指纹图谱 a中相对与其共有峰的非共有峰
数,称为a的变异峰数。
nb:指纹图谱b中相对与其共有峰的非共有峰
数,称为b的变异峰数。
变异峰率Pv:1个指纹图谱的变异峰率 Pv是该
IR图中相对于共有峰的变异峰数与其共有峰数的
比值。
Pva=(na/Ng)×100%
Pvb=(nb/Ng)×100% (4)
Pva:指纹图谱 a的变异峰率。Pvb:指纹图谱 b
的变异峰率。
Na=Ng+na
Nb=Ng+nb (5)
Na:指纹图谱a的总峰数。Nb:纹图谱b的总峰
数。
共有峰率和变异峰率双指标序列:
以任一样品为参考,分别计算与其他样品红外
指纹图谱的共有峰率和变异峰率,并且根据共有峰
率由大到小排成一个序列(包含共有峰率和变异峰
率值),该序列称为共有峰率和变异峰率双指标序
列。
通过该序列可以精确知道任意一个样品与其他
样品的远近关系,从而可以避免在单一序列空间中
比较不同样品造成的错误。同时变异峰率指标可以
在更深的层次上确定样品之间的异同。
同时,在较大样本情况下,利用双指标序列分析
法及其表示可以使分析结果呈现有序的排列,分析
结果简单明了。
1.1.2 定义双指标信息量计算公式 相似性信息
量:对于相互比较的2个中药复方,它们的红外指纹
图谱共有峰率Pg=
Ng
Nd
反映的是样品间的相似性程
度,其共有峰存在的几率也是Pg。
相似性信息量定义为:-
Ng
Nd
ln
Ng
Nd
=-PglnPg (6)
变异性信息量:对于相互比较的2个中药复方,
样品A的红外指纹图谱变异峰率 Pva=
na
Ng
,其变异
峰na存在的几率是Pa=
na
Nd
,样品A的变异信息量定
义为:
-
na
Nd
ln
na
Ng
=-PalnPva (7)
样品 B的红外指纹图谱变异峰率 Pvb=
nb
Ng
,其
变异峰nb存在的几率是Pb=
nb
Nd
,样品B的变异信息
量定义为:
-
nb
Nd
ln
nb
Ng
=-PblnPvb (8)
双指标信息量方程:
任意2个相互比较的中药复方红外指纹图谱的
全信息量为:
I=-(
Ng
Nd
ln
Ng
Nd
+
na
Nd
ln
na
Ng
+
nb
Nd
ln
nb
Ng
)=-(PglnPg+
·6232·
第34卷第18期
2009年9月
Vol.34,Issue 18
September,2009
PalnPva+PblnPvb) (9)
方程(9)称为双指标信息量方程。
3种信息发生的几率之和:
Pg+Pa+Pb=
Ng
Nd
+
na
Nd
+
nb
Nd
=1 (10)
在上述公式中,Pva=
na
Ng
,Pvb=
nb
Ng
反映的是变异
元素na,nb与共有元素Ng之间的相互作用。设想A,
B2个样品由共同的祖先演化生成,在开始二者完全
相同,共有峰率 Pg=
Ng
Nd
=1,变异峰率 Pva=
na
Ng
=0,
Pvb=
nb
Ng
=0。由于演化,A,B2个样品出现变异,经
过生化反应,共有元素 Ng与变异元素 na,nb之间必
有生化作用近平衡,并简化成如下表示:
Ngna
nb
采用变异峰率 Pva=
na
Ng
,Pvb=
nb
Ng
可以描述这两
种变异作用的强度。Pva,Pvb越大,变异作用越显著,
反之越小。
上述双指标信息量,反映了任意2个样品的相
似和变异信息,形成单一全信息变量,可以综合刻画
生物样品之间的信息。
1.2 双指标信息量方程最大信息量状态分析
设Pb=kPa,Pvb=kPva,0≤k≤1。
由关系式(1)~(5),(9),双指标信息量方程可
表示为,I=-{PglnPg+Pg/(1+k)(1/Pg-1)[ln
1/(1+k)(1/Pg-1)+klnk/(1+k)(1/Pg-1)]}
该方程存在着极大值信息量 Imax。考虑两种情
况,①样品 A,B对称变异,即 k=1,在此情况下经
计算表明,获得最大信息量时,共有峰率为 Pg=
6100%,②样品 A,B极端非对称变异,k=0,在此
情况下经计算表明,获得最大信息量时,共有峰率为
6950%。根据双指标序列分析法,2个样品的共有
峰率越高,相似性越大。因此,根据上述双指标信息
量方程的极值分析,当2个样品的共有峰率由 Pg=
100% 降低至小于6100%或6950%,说明二者性
质发生了显著的质变。考虑到生物样品一般情况下
趋近对称变异,2个样品的共有峰率在 Pg =
6100%~100%,二者性质具有较高的相似性。
1.3 双指标信息显著相似序列定义
根据双指标信息量方程极值分析,Pg=
6100% ~100%的样品具有较高的相似性,他们
的性质没有发生显著变化,该部分序列定义为双
指标信息显著相似序列,或双指标信息显著相似
样品组。
1.4 双指标信息显著相似序列聚类分析
如同参考文献[10]中的优良等级序列,在每个
样品的双指标序列中,双指标信息显著相似序列,具
有与该参考样品较高的相似性,该序列中的样品可
以确定为该参考样品的显著相似样品组。
显著相似序列中的样品与对应序列参考样品具
有最大的信息相似性,最能代表参考样品的品质,表
征参考样品的性质,构成每个样品的有效分类信息,
消除与参考样品差异较大的冗余分类信息。根据不
同样品的显著相似样品组的相似程度对各样品进行
模式识别。
1.5 结果的优化检验
同一类样品双指标信息显著相似序列中相同样
品最多,不同样品最少。将不同类中的样品相互交
换,将使相同样品减少,不同样品增加。对每一个样
品进行检验,可以得到优化的模式识别结果。
2 仪器与试剂
2.1 仪器
NICOLET5700FTIR傅立叶变换红外光谱仪
(美国 NicoletInstrumentCorporation)光谱范围
4000~400cm-1,分辨率4cm-1。紫外可见分光
光度计 (UV240,日本岛津),分析天平,精度
00001g。
2.2 药材及试剂
氯仿(AR)、无水乙醇(AR)、KBr(AR)(天津
科密欧化学试剂有限公司)。桂附地黄丸和金匮肾
气丸样品见表1。
3 方法与结果
3.1 最佳提取条件
把以上中成药样品粉粹成粉末,过60目筛,60
℃ 烘干2h,分别称取桂附地黄丸和金匮肾气丸样
品各050g(平行3份)分别置索氏提取器中,用60
mL氯仿为提取溶剂加热回流,确定最佳氯仿提取时
间为15h。挥干样品所吸收的氯仿,样品再用60
mL无水乙醇为提取剂,操作同上,确定无水乙醇的
最佳提取时间皆是20h。
·7232·
第34卷第18期
2009年9月
Vol.34,Issue 18
September,2009
表1 桂附地黄丸和金匮肾气丸样品来源
样品 名称 来源 生产日期 生产批号
S1 桂附地黄丸 合肥神鹿双鹤九华药业有限公司 20030414 0303493
S2 桂附地黄丸 合肥神鹿双鹤九华药业有限公司 20030901 0308413
S3 桂附地黄丸 河南宛西制药股份有限公司 20031221 031204
S4 桂附地黄丸 河南宛西制药股份有限公司 20040719 040702
S5 桂附地黄丸 河南宛西制药股份有限公司 20050221 050203
S6 桂附地黄丸 河南宛西制药股份有限公司 20060105 060101
S7 桂附地黄丸 芜湖张恒春商业有限公司 20040812 20040802
S8 桂附地黄丸 芜湖张恒春商业有限公司 20040812 20040802
S9 桂附地黄丸 安庆亿达丰药业有限公司 20040525 040520
S10 桂附地黄丸 苏州长甲药业有限公司 20050517 0505171
S11 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20030311 3030440
S12 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20030311 3030440
S13 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20040330 4030045
S14 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20040802 4032954
S15 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20040823 4032972
S16 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20050707 5032371
S17 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20050707 5032372
S18 金匮肾气丸 北京同仁堂科技发展股份有限公司制药厂 20050810 5032879
3.2 测试样品制备及测试条件
准确称取200g桂附地黄丸(平行3份),置索
氏提取器中,依次用60mL氯仿、乙醇提取15,20
h。将无水乙醇提取液倒入蒸发皿,水浴蒸发浓缩并
装入样品管冷藏保存。金匮肾气丸提取方法相同。
液膜法测试其红外指纹图谱,灵敏度为 60%,25
cm-1平滑,每份提取物平行测量3次指纹图谱,每
个样品的红外指纹图谱峰是9次测量组合指纹图谱
的平均值。
3.3 重复性试验
在相同条件下,桂附地黄丸同一份无水乙醇提
取物平行测量7次,任意3次组合谱的共有峰率大
于7500%,金匮肾气丸同一份无水乙醇提取物平
行测量 7次,任意 3次组合谱共有峰率大
于7778%。
3.4 稳定性试验
同一份无水乙醇提取物在0~4℃下保存,每隔
1周用液膜法测量1次,连续测4次。桂附地黄丸3
次组合谱共有峰率大于 7468%,金匮肾气丸共有
峰率大于8333%,具有很好的稳定性。
3.5 无水乙醇提取物红外指纹图谱
桂附地黄丸金匮肾气丸无水乙醇提取物红外指
纹图谱见图1。
自3350cm-1左右从上到下依次:S1,S4,S13,
S8,S11,S10,S6,S16,S15从图1可见,桂附地黄丸
与金匮肾气丸无水乙醇提取物红外指纹图谱具有高
图1 桂附地黄丸金匮肾气丸无水乙醇提取物
红外指纹图
度的相似性,不易区分。
3.6 无水乙醇提取物红外指纹图谱双指标信息显
著相似序列聚类分析
根据共有峰和变异峰的理论判别方法W检验
法[15]及文献[3]中的方法,确定无水乙醇提取物红
外指纹图谱共有峰和变异峰,进行红外指纹图谱共
有峰率和变异峰率计算并确定18个样品的双指标
序列。
根据本文提出的双指标信息理论模型,当任意
2个样品的共有峰率等于大于61% 时,2个样品具
有显著的相似性,由此可以确定每种样品的双指标
信息显著相似序列,根据每种样品的显著相似序列,
18种样品分为显著不同的A,B两类,见表2。
显著相似样品序列由两部分构成,其一,核心表
征序列,由属于该类的样品组成,占显著相似样品序
列中主要部分。其二,非核心表征序列,由其他类样
·8232·
第34卷第18期
2009年9月
Vol.34,Issue 18
September,2009
表2 18种样品的双指标信息显著相似序列
分类 样品 各样品显著相似序列
A S1 (S1)1)S2S3S4S102)
S2 S1(S2)S3S4
S3 S1S2(S3)S4S5S6S7S8S10 S11S13S14S153)
S4 S1S2S3(S4)S5S6S7S8S10 S12
S5 S3S4(S5)S6S7S8S9 S12
S6 S3S4S5(S6)S7S8S9S10 S11S13S14S15
S7 S3S4S5S6(S7)S8S9S10 S11S13S14S15
S8 S3S4S5S6S7(S8)S9S10 S11S13S14S15
S9 S5S6S7S8(S9)S10
S10 S1S3S4S6S7S8S9(S10)
B S11 (S11)S12S13S14S15S16S17S18 S3S6S7S8
S12 S11(S12)S13S14S15S16S17S18 S4S5
S13 S11S12(S13)S14S15S16S17S18 S3S6S7S8
S14 S11S12S13(S14)S15S16S17S18 S3S6S7S8
S15 S11S12S13S14(S15)S16S17S18 S3S6S7S8
S16 S11S12S13S14S15(S16)S17S18
S17 S11S12S13S14S15S16(S17)S18
S18 S11S12S13S14S15S16S17(S18)
注:1)每个样品自身属于其相似样品;2)核心表征序列;3)非核心表征序列部分与核心表征序列共同构成表征序列,该部分具有亚类鉴别作用。
品组成,只占显著相似序列的小部分。核心表征序
列构成分类功能,不同类样品核心表征序列中的样
品完全不同。
从上述分析结果看,根据每个样品的显著相似
样品组,18种样品被清晰地聚成两类,第1类为桂
附地黄丸S1~S10,形成 A类。该类样品的核心表
征序列由该类样品构成,占整个显著相似样品组的
主要部分,非核心表征序列由少数几种 B类中的样
品构成。第 2类为金匮肾气丸 S11~S18,形成 B
类。该类样品的核心表征序列由该类样品构成,占
整个显著相似样品组的主要部分,非核心表征序列
由少数几种A类中的样品构成。
从两类样品的非核心表征序列看,A类中10个
两类样品存在一定的相似性,这主要因为它们的组
成非常近似。
在上述18种样品中,S7,S8;S11,S12;S16,S17
为3个批次的不同样品。实验结果表明,每个批次
的显著相似样品组相同或具有很高的相似性,说明
该方法具有合理性、正确性。
该结果说明,采用双指标信息量方程确定的每
个样品的显著相似样品组,可以很好地表征对应的
每个样品的特性,消除冗余信息,实现组成非常相似
的生物复杂样品的准确模式识别,具有优良的模式
识别能力。
4 结论
从上述数据及结果可见,利用本研究建立的双
指标信息显著相似序列聚类法,可以有效鉴定组成
非常相近且复杂的中成药复方桂附地黄丸和金匮肾
气丸产品。本研究提出了一种新的生物遗传信息和
变异信息计算方法,并将它们综合成全信息单一信
息量计算方程。利用该方程确定最大信息量所对应
的共有峰率,作为反映生物本性的参数,用于确定每
个样品的显著相似样品组,进行聚类分析,具有优良
的分辨能力及简洁特性。
[参考文献]
[1] ZouHuabin,YangGuosheng,QinZhengran,etal.Progressin
qualitycontrolofherbalmedicinewithIRfingerprintspectra[J].
Anallet,2005,38(9):1457.
[2] 邹华彬,袁久荣,杜爱琴,等.甘草氯仿提取物红外指纹图谱
共有峰率和变异率双指标序列分析法[J].中国中药杂志,
2005,30(1):16.
[3] 邹华彬,袁久荣,杜爱琴,等.甘草水提物红外指纹图谱共有
峰率和变异率双指标序列分析法[J].中成药,2004,26
(10):779.
[4] ZouHuabin,YuanJiurong,DuAiqin,etal.Dualindexse
quenceanalyticalmethodforIRfingerprintspectraofethanolic
extractofvariousGylcyrhizae'srootspeciescomponents[J].
Anallet,2005,38(7):1167.
[5] 邹华彬,袁浩,王爱武,等.白芍紫外指纹图谱共有峰率和变
异峰率双指标序列分析[J].光谱学与光谱分析,2007,27
(9):1815.
·9232·
第34卷第18期
2009年9月
Vol.34,Issue 18
September,2009
[6] 庞涛涛,杜黎明.苦丁茶红外指纹图谱共有峰率和变异峰率双
指标序列分析法[J].光谱学与光谱分析,2007,27(3):486.
[7] 冀宪领,盖英萍,牟志美,等.白僵蚕的红外指纹图谱鉴别研
究[J].光谱学与光谱分析,2007,27(1):66.
[8] ZouHuabin,YangGuosheng,DuAiqin,etal.Combinational
numeralfingerprintspectraofGlycyrhizaandanalysisofcommon
peakratioinvariablenessinHPLC[J].BiomedChromatogr,
2006,20:642.
[9] 刘圆,孟庆艳,彭镰心,等.共有峰率和变异峰率双指标序列
法分析藏药材红毛五加特定指纹图谱[J].药物分析杂志,
2007,27(8):1182.
[10] 邹华彬,张新玲,翟红,等.明目地黄丸知柏地黄丸无水乙醇
提取物指纹图谱双指标等级序列模式识别[J].中国中药杂
志,2008,33(13):1543.
[11] 董彬,孙素琴,周红涛,等.红外光谱和聚类分析法无损快速
鉴别赤勺[J].光谱学与光谱分析,2002,22(2):232.
[12] 周群,孙素琴,梁曦云.枸杞产地的红外指纹图谱与聚类分析
法研究[J].光谱学与光谱分析,2003,23(3):511.
[13] 程存归,应桃开.导数FTIR结合统计学法应用于中药延胡索
质量控制的研究[J].光谱学与光谱分析,2005,25(1):36.
[14] 叶正良,虞科,程翼宇.一种基于小波变换的近红外化学指纹
图谱分析方法[J].高等学校化学学报,2007,28(3):441.
[15] 邹华彬,袁久荣,王伟.中药指纹图谱共有峰的理论识别W
检验判别法[J].世界科学技术———中医药现代化,2004,6
(2):50.
[16] 张淑玉.金匮肾气丸质量标准探讨[J].中国现代临床医学,
2005,4(6):48.
[17] 杜素兰,耿爱萍,刘永忠.桂附地黄丸TLC鉴别方法的研究与
改进[J].中成药,2001,23(11):837.
[18] 金振玉.信息论[M].北京:北京理工大学出版社,1991:11.
[19] 王海东,刘元东.神经网络建模的变量聚类分析方法[J].计
算机工程,2004,30(10):16.
[20] 王鹏,杨士强,刘志强.信息论联合聚类算法及其在视频镜头
聚类中的应用[J].计算机学报,2005,28(10):1692.
[21] 沈红斌,杨杰,王士同,等.基于信息理论的合作聚类算法研
究[J].计算机学报,2005,28(8):1287.
[22] 丁世飞,靳奉祥,王健,等.一种新的基于信息论的 PCA特征
压缩算法[J].小型微型计算机系统,2004,25(4):694.
[23] 朱宇光,黄树成.一种基于信息熵建立决策树的算法[J].常
州工学院学报,2006,19(1):55.
[24] 刘培勋,MarcRoubens.基于信息论的决策树构建及其在分类
方面的应用[J].中国卫生统计,1994,11(3):19.
[25] 李炜疆,宋江宁.同义密码子携带多少蛋白质二级结构信息
[J].生物物理学报,2003,19(1):41.
[26] 梁逸曾,俞汝勤.化学分析手册第10册[M].2版,北京:化
学工业出版社,2005:195.
DualindexinformationmarkedlysimilarsequenceclusteringanalysisonIR
fingerprintspectraofextractsofGuifuDihuangandJingui
Shenqipilswithethanol
ZOUHuabin
(SchoolofChemistryandChemicalEngineeringofShandongUniversityCentercampus,Jinan250100,China)
[Abstract] Objective:Toestablish,anovelmethod,Dualindexinformationmarkedlysimilarsequenceclusteringanalysisto
identifiyandcontrolthequalityofformulaChinesepatentmedicine.Method:Basedoncommonandvariationpeakratiodualindexse
quenceanalysisproposedbyauthors,anewequationwasbuiltup,inwhichthecommoninheritedandvariantinformationcouldbein
tegratedintouniqueinformationrepresent.Itdescribedthepropertiesofbiologicalsamplessimplyandsyntheticaly.Thedualindexin
formationmarkedlysimilarsequenceweredeterminedandusedtoclustersamples.Result:Thenovelapproachwasappliedforpatern
recognitionofIRfingerprintspectraofcomponentsofGuifudihuangandJinguishenqipils,composedofextremelysimilarcomponents
extractedwithethanol,thetwopilscouldbeclassifiedaccuratelyanddistinctly.Conclusion:Thedualindexinformationmarkedly
similarsequenceclusteringmethodisanexcelentonefitpaternrecognitiononefittoanalyzebiologicalycomplexsamples.
[Keywords] dualindexinformation;clustering;paternrecognition;GuifuDihuangpils;JinguiShenqipils;fingerprint
spectra
[责任编辑 周驰]
·0332·
第34卷第18期
2009年9月
Vol.34,Issue 18
September,2009