全 文 :木香花挥发性组分的化学结构表征及其
保留时间的估计和预测
朱万平1,梅 虎1,2,舒 茂1,2,廖立敏1,杨 娟1,李志良1,2
(1.重庆大学 化学化工学院,重庆 400044;
2.重庆大学 生物医学工程教育部与重庆市重点实验室,重庆 400044)
[摘要] 采用分子电性距离矢量(MEDV)表征木香花挥发性成分的分子结构,运用多元线性回归建立定量结
构-色谱保留关系(QSRR)模型,同时采用逐步回归对模型进行变量筛选,建立了46个木香花挥发性成分在Ultra2
柱上气相色谱保留时间(tR)与MEDV的定量相关10变量6变量模型。两 QSRR模型的建模计算值复相关系数
(R)分别为0906和0903,留一法(leaveoneout)交互校验复相关系数(rCV)分别为0904和0903;表明模型具有
良好估计能力与稳定性。
[关键词] 分子电性距离矢量;描述子;定量结构保留相关;木香花
[中图分类号]R284.1 [文献标识码]A [文章编号]10015302(2008)05060904
[收稿日期] 20070123
[基金项目] 国家“春晖计划”教育部启动基金(9944+37:99
44+9937);重庆直辖市应用基础研究基金(0136);霍英东基金
(199876);重大自主创新基金科技项目(030506+040909)
[通讯作者] 李志良,Tel:(023)65106677,13206179595,E
mail:zli2662@163.com
色谱的定量结构保留关系(QSRR)的构建,需要引入相
关化合物的结构描述子。长期以来,人们在探寻有机物的性
质与结构之间的定量关系(QSPR)[1,2],预测色谱保留时间、
选择色谱分离条件及探索保留机制[3]等方面做了许多有意
义的工作[4,5]。气相色谱保留时间是进行色谱定性分析的基
础。化合物在色谱柱上的保留行为与该化合物结构特征密
切相关。借此,可构建QSRR模型来实现不同结构特征化合
物保留时间的预测。木香花 Rosabanksiae,别名“木香藤”,
“木香”,“锦棚儿”,又名“七里香”;属蔷薇科,蔷薇属的花
卉。据报道,木香花的花和叶有较强的自由基清除活性,传
统中医认为木香花的根和叶具有止痛和止血之功效。本研
究用已有的数据进行建模,可根据此模型对其他组分在 GC
MS中的保留时间进行预测,有助于成分较复杂的中药化学
成分的分离。作者所采用的数据来自于参考文献[6]
(表1)。
1 原理与算法
用分子电性距离矢量(MEDV)对有机物分子结构进行
表征时[710],考虑到分子中原子间的静电相互作用,忽略非
骨架氢原子的影响,将碳,氮,氧,硫,氟,溴,碘等非氢原子根
据与其相连的非氢原子数目分为 4类,这4类非氢原子之间
发生相互作用可以按以下方式组合:m11,m12,m13,m14,m22,
m23,m24,m33,m34,m44,简写成 x1,x2,x3,x4,x5,x6,x7,x8,x9,
x10。MEDV各元素按下式计算:
xr=mnl= ∑
i=n,j=l
qiqj
dij
(n=1,2,3,4;n≤l≤4)
式中n,l表示原子 i,j的原子类型,qi,qj表示原子 i,j相
对于碳原子的相对电负性,dij表示原子 i,j之间的相对距离
(即所经最短路径相对于碳碳单键相对键长之和)。
2 模型建立
多元线性回归(multiplelinearregression,MLR)是一种经
典的建模方法,它对自变量和因变量加以线性拟合以得到最
小二乘(leastsquare,LS)意义下的最佳结果。首先计算出文
献[6]中报道的46个木香花挥发性成分10个 MEDV矢量。
借助多元线性回归(MLR)方法对MEDV矢量和tR(exp)进行
相关性研究,得到10变量的预测模型(M1)回归方程:
tR=-217x1+0283x2+2288x3+0189x4+1649x5+
1108x6+2196x7-0725x8+2144x9+0420x10(M1)
为了进一步考察 MEDV各矢量对 QSAR建模过程的影
响和对模型的贡献大小,对变量进行了逐步回归(SMR)分
析,结果见表2。
随着变量的引入,回归系数r不断增大,SD逐渐减少;从
MEDV的10个变量中筛选出了6变量(未引入变量 2,4,8
和10),此时回归系数 R为0903(与10变量的0906非常
接近),而交互检验的回归系数 rCV接近最大值(0904),交
互检验的标准偏差 SDCV达到最小值(5596)。说明 6变量
的QSAR模型(M2)较10变量的 QSAR模型(M1)具有更强
的预测能力。6变量的QSAR模型(M2)的回归方程为:
·906·
第33卷第5期
2008年3月
中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
Vol33,Issue 5
March,2008
表1 木香花挥发油中46种组分及其在气相色谱质谱中的保留时间
No. 化合物 Exp[6] Cal1 Er PreLOO1 ErLOO Cal2 Er PreLOO2 ErLoo
1 乙缩醛 acetal 354 2810 3268 10882 10340 2135 85931 2576 9034
2 辛烷 octane 496 9401 4440 10013 5052 9572 4611 10005 5044
3 糠醛 furfural 611 6305 5192 12722 6609 6374 5261 12043 5930
4 异戊酸 isovalericacid 631 2178 8486 5482 11790 1286 7594 2970 9278
5 呋喃甲醇2furanmethanol 677 6045 7272 14749 7976 6796 7023 14192 7419
6 苯乙烷 ethylbenzene 695 6474 8520 17011 10057 6490 8536 15934 8980
7 对二甲苯 pxyene 727 6449 8183 17641 10375 6973 7707 15526 8260
8 戊酸 pentanoicacid 785 6256 5405 14746 6895 6412 5561 14461 6610
9 壬烯1nonene 822 11973 3749 12544 4320 12045 3821 12353 4129
10 苯甲醛 benzaldehyde 1270 16517 3815 16829 4127 16218 3516 16384 3682
11 蘑菇醇1octen3ol 1322 12959 -0263 12921 -0301 12404 -0818 12359 -0863
12 癸烷 decane 1521 14363 -0845 14277 -0931 14554 -0654 14507 -0701
13 桉叶油素 cineol 1685 20864 4013 23450 6599 22118 5267 23982 7131
14 苯甲醇 benzylmethanol 16931 5940 -0989 15850 -1079 15732 -1197 15674 -1255
15 苯乙缩醛 henzeneacetaldehyde 1801 18346 0337 18368 0359 17933 -0076 17929 -0080
16 3,3,6三甲基1,5庚二烯4醇 1920 20036 0835 21324 2123 20184 0983 21290 2089
3,3,6trimethyl1,5heptadien4ol
17 氧化里呐醇 linalooloxide 1935 21044 1695 21880 2531 20887 1538 21446 2097
18 十一烷 undecane 2021 16886 -3325 16580 -3631 17091 -3120 16880 -3331
19 苯乙醇 phenylethylalcohol 2030 18122 -2176 17906 -2392 17899 -2399 17777 -2521
20 冰片烯2bornene 2152 15510 -6006 8479 -13037 16823 -4693 14170 -7346
21 顺马鞭草烷醇 cisverbenol 2172 21192 -0531 19187 -2536 22002 0279 22399 0676
22 冰片 borneol 2214 18184 -3952 17478 -4658 18042 -4094 17736 -4400
23 萜烯醇 terpenol 2247 24872 2402 41880 19410 28326 5856 32835 10365
24 二戊烷2pentane 2212 20116 -2005 19711 -2410 20692 -1429 20574 -1547
25 十二烷 dodecane 2334 19428 -3909 19087 -4250 19651 -3686 19400 -3937
26 6甲基十二烷6methyldodecane 2468 20615 -4070 20285 -4400 20058 -4627 19895 -4790
27 4甲基十二烷4methyldodecane 2484 20812 -4029 20541 -4300 20326 -4515 20172 -4669
28 2甲基十二烷2methyldodecane 2494 23356 -1589 23265 -1680 23445 -1500 23367 -1578
29 紫苏醛 perilaaldehyde 2476 20172 -4593 19827 -4938 20001 -4764 19655 -5110
30 十三烷 tridecane 2582 21986 -3835 21648 -4173 22227 -3594 21964 -3857
31 紫苏醇 perilaalcohol 2644 19761 -6684 19272 -7173 19666 -6779 19192 -7253
32 丁香油酚 eugenol 2665 22817 -3837 22122 -4532 22173 -4481 21736 -4918
33 丁香酚甲醚 eugenolmethylether 2831 23060 -5250 22094 -6216 21997 -6313 21404 -6906
34 榄香脂素 elemicin 2834 28906 0570 29293 0957 27005 -1331 26682 -1654
35 匙叶桉油烯醇 spathulenol 2836 25177 -3186 24344 -4019 25928 -2435 25431 -2932
36 氧化石竹烯 caryophyleneoxide 2884 32338 3495 40662 11819 32008 3165 33388 4545
37 绿花白千层醇 viridiforol 2912 26187 -2937 25847 -3277 25575 -3549 25364 -3760
38 韦得醇 widdrol 3133 37564 6231 42780 11447 37395 6062 42117 10784
39 法尼醇 farnesol 3340 30307 -3097 29605 -3799 28931 -4473 28336 -5068
40 δ杜松醇 δcadinol 3362 31627 -1994 30862 -2759 31499 -2122 31074 -2547
41 α杜松醇 αcadinol 3366 31627 -2032 30848 -2811 31499 -2160 31066 -2593
42 松樟脑 junipercamphor 3390 33605 -0293 33113 -0785 32732 -1166 32563 -1335
43 正十九烷 nonadecane 3774 37552 -0183 37509 -0226 37923 0188 37965 0230
44 棕榈酸 nhexadecanoicacid 3874 40733 1993 41495 2755 40850 2110 41549 2809
45 二十烷 eicosane 3937 40171 0806 40411 1046 40565 1200 40903 1538
46 二十六烷 heneicosane 4092 42795 1874 43495 2574 43212 2291 44013 3092
tR =-1286+2064×x1+2151×x3+1664×x5+
0976×x6+2373×x7+1992×x10(M2)
利用上述两模型对46种木香花挥发性化合物的气相色
谱保留时间进行了估计和预测,结果见表1。
3 结论
本研究对46种木香花挥发性有机化合物所建立的 QS
RR模型,充分考虑了各非氢原子对该类化合物气相色谱保
留时间的贡献,且模型所采用的参数均为计算值,简单易得。
采用 LOO交互检验,对模型稳定性和预测能力进行了
评价,结果显示,所得模型具有良好的稳定性和预测能力。
通过构建分子电性距离矢量(MEDV),对天然木香花挥发性
有机化合物的气相色谱保留时间进行了性质与结构之间的
定量关系(QSPR)研究。研究结果表明:MEDV能较好地描
述木香花挥发性有机化合物分子结构特征,采用MEDV建立
·016·
第33卷第5期
2008年3月
中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
Vol33,Issue 5
March,2008
表2 逐步回归变量分析(n=46)
No a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 R SD F RCV SDCV FCV
1 15977 0827 0729 8840 15096 0458 9120 11527
2 819715681 1244 0829 7089 24450 0651 7655 17901
3 109617177 1516 1146 0835 5767 32281 0682 6577 21592
4 062712501 1570 1145 3260 0869 5253 31598 0800 6085 20930
5 058110572 1568 1177 0946 2749 0876 5179 26434 0802 6195 16067
6 -1286 2064 2151 1664 0976 2373 1992 0903 4674 28728 0903 5596 18081
7 -1733 1812 2231 1670 1173 2285 -08892324 0906 4662 24924 0804 6200 11735
8 -2392 1510 0277 2238 1649 1112 2279 -07252328 0908 4716 21791 088913657 11476
9 -2191 1561 0289 2229 1648 1113 2261 -07252273 0451 0906 4783 18430 0903 6668 7541
10 -2178 1135 0283 2288 0189 1649 1108 2196 -07252144 0420 0906 4850 16131 0904 7334 5086
的QSRR模型具有预测该类化合物气相色谱保留时间的能
力。这对于天然产物中挥发性有机化合物的色谱的定量结
构保留关系(QSRR)研究具有一定参考价值。
[参考文献]
[1] 杨学谨,李延东,王善伟,等.二茂铁衍生物疏水参数的测定及
其保留值与结构定量关系的研究[J].色谱,1996,14(2):86.
[2] LiuSS,LiZL.Approachtoestimationandpridictionfornormal
boilingpoint(NBP)ofalkanesbasedonanovelmoleculardis
tanceedge(MDE)vector[J].ChemInfComputSci,1998,38
(3):387.
[3] 刘树深,刘 堰,李志良,等.一个新的分子电性距离矢量
(MEDV)[J].化学学报,2000,58(11):1353.
[4] LiuSS,XiaZN.Moleculardistanceedgevector:anextension
fromalkanestoalkohols[J].JChemInfComputSci,1999,39
(6):951.
[5] LiuSS,YinCS,CaiSX,etal.QSARstudyofsteroidbench
markanddipeptidesbasedonMEDV13[J].JChemInfComput
Sci,2001,41(2):321.
[6] 刘应萅,余爱农.木香花挥发油化学成分分析[J].精细化工,
2007,24(8):782.
[7] 周丽平,夏之宁,李伯玉,等.多环芳烃分子结构的距边矢量表
征及其气相色谱保留指数预测[J].色谱,2001,19(1):25.
[8] 孙立力,李志良.分子电性距离矢量(MEDV)用于醇的分子结
构表达和物理性质预测[J].化工学报,2005,56(2):203.
[9] ZhouY,SunLL,HuM,etal.Estimationandpredictionofrel
ativeretentionIndicesofpolychlorinatednaphthalenesinGCwith
molecularelectronegativitydistancevector[J].Chromatography,
2006,64(910):565.
[10] LiuSS,LiuY,YinDQ,etal.Predictionofchromatographic
relativeretentiontimeofpolychlorinatedbiphenylsfromthemo
lecularelectronegativitydistancevector[J].JSepSci,2006,29,
296301.
Chemicalstructuralcharacterizationofsomecomponentsfromessentialoil
ofRosabanksiaeforestimationandpredictionoftheirretentiontime
ZHUWanping1,MEIHu1,2,SHUMao1,2,LIAOLimin1,YANGJuan1,LIZhiliang1,2
(1.ColegeofChemistryandChemicalEngineering,ChongqingUniversity,Chongqing400044,China);
2.KeyLaboratoryofBiomedicalEngineeringMinistryofEducationChongqingUnivesity,Chongqing400044,China)
[Abstract] Themolecularelectronegativitydistancevector(MEDV)wasusedtodescribethechemicalstructuralcharacterization
of46componentsofessentialoilsintheflowerofRosabanksiae.Variousmultiplelinearregression(MLR)modelswerecreatedwithvar
iablescreeningbythestepwisemultipleregressiontechniqueandstatistics.TheQSRRmodelsof10and6variableswerebuiltbyMLR
withthecorelationcoeficients(R)ofmolecularmodelingbeing0906and0903.Crossvalidationofthemodels,whichcontainselected
vectorswereperformedbyleaveoneoutprocedure(LOO)andthesatisfiedresultswithcorelationcoeficients(RCV)of0904and
0903,respectively.Theresultsshowedthatthemodelsconstructedcanprovideestimationstabilityandfavorablepredictiveability.
[Keywords] molecularelectronegativitydistancevector(MEDV);descriptor;quantitativestructureretentionrelationship;Ro
sabanksiaeAit.
[责任编辑 王亚君]
·116·
第33卷第5期
2008年3月
中 国 中 药 杂 志
ChinaJournalofChineseMateriaMedica
Vol33,Issue 5
March,2008