免费文献传递   相关文献

木香花挥发性组分的定量结构-色谱保留关系研究



全 文 :第 29卷第 4期
2009年 8月
林 产 化 学 与 工 业
ChemistryandIndustryofForestProducts
Vol.29 No.4
Aug.2009
木香花挥发性组分的定量结构-色谱保留关系研究
  收稿日期:2008-07-17
  基金项目:国家 863计划资助(2006AA02Z312);宜宾学院生物制药工程创新团队基金资助(2006W35);重庆大学研究生创新团队
项目科技创新基金资助(200711C1A0010260)
  作者简介:杨善彬(1963-),男 ,四川富顺人 ,高级工程师 ,博士 ,主要从事药物研发工作
 *通讯作者:夏之宁 ,教授 ,博士生导师 ,主要从事天然药物分析与开发;E-mail:szhi cqu@126.com。
YANGShan-bin  
杨善彬1 , 2 , 朱万平 1, 2 , 廖立敏3 , 杨 娟 2 , 舒 茂2 , 夏之宁 2*
(1.宜宾学院 化学与化工系 , 四川 宜宾 644000;2.重庆大学 生物医学工程教育部与
重庆市重点实验室 , 重庆 400030;3.内江师范学院化学与生命科学系 , 四川 内江 641112)
摘 要: 采用分子电性距离矢量(MEDV)表征了木香花挥发性成分的分子结构 , 建立了色谱定量结
构-保留关系(QSRR)模型, 同时运用多元线性回归 /逐步回归对模型进行变量筛选 ,建立了 53种木香
花挥发性成分气相色谱保留时间(tR)与 MEDV的定量相关 10变量 、 6变量模型及线性保留指数(ILR)
的 10、 7、 6变量模型。QSRR模型的建模计算值复相关系数(R)分别为 0.949、 0.906、 0.906、 0.949和 0.943。留一法交互
校验复相关系数(RCV)分别为 0.867、 0.904、 0.905、 0.901和 0.904。结果表明所建模型具有良好估计能力与稳定性。
关键词: 分子电性距离矢量;描述子;定量结构-保留关系;线性保留指数
中图分类号:TQ351.0;O641      文献标识码:A      文章编号:0253-2417(2009)04-0067-06
QuantitativeStructure-retentionRelationshipofVolatile
ComponentsfromRosabanksiaeAit.
YANGShan-bin1, 2 , ZHUWan-ping1, 2 , LIAOLi-min3 , YANGJuan2
SHUMao2 , XIAZhi-ning2
(1.DepartmentofChemistryandChemicalEngineering, YibinUniversity, Yibin644000, China;2.KeyLaboratoryof
BiomedicalEngineeringofEducationalMinistryandChongqingCity, ChongqingUniversity, Chongqing400030, China;
3.DepartmentofChemistryandLifeScience, NeijiangTeachersColege, Neijiang641112, China)
Abstract:Molecularelectronegativity-distancevector(MEDV)wasusedtodescribethechemicalstructureof53 componentsof
volatilecomponentsfromRosabanksiaeAit.Variousmultiplelinearregression(MLR)modelswerecreatedwithvariablescreen-
ingbythestepwisemultipleregressiontechniqueandstatistics.Thequantitativestructure-retentionrelationship(QSRR)models
of10 variables, 6variablesandlinearretentionindices(ILR)of10, 7, 6variableswerebuiltbyMLRwiththecorrelationcoefi-
cients(R)ofmolecularmodelingbeing0.949, 0.906, 0.906, 0.949and0.943, respectively.Cross-validationofthemodels,
whichcontainedselectedvectors, wereperformedbyleave-one-outprocedure(LOO)toobtainthesatisfiedresultswithcorrela-
tioncoefficients(RCV)of0.867, 0.904, 0.905, 0.901 and0.904, respectively.Theresultsshowthattheconstructedmodels
possessgoodestimationstabilityandfavorablepredictiveability.
Keywords:molecularelectronegativity-distancevector;descriptor;quantitativestructure-retentionrelationship;linearretentionindex
色谱的定量结构-保留关系(QSRR)的构建 ,需要引入相关化合物的结构描述子。长期以来 ,人们在探
寻有机物的 QSRR[ 1-2] 、预测色谱保留时间 、选择色谱分离条件及探索保留机理[ 3]等方面做了许多有意义
的工作。例如利用分子几何及连接特征 、分子拓扑结构和各种物化参数等对分子进行结构描述 ,然后建立
化合物分子结构与色谱保留之间定量相关模型来预测化合物的色谱保留指数 [ 4] 。对于建立分子结构与色
谱保留的变化规律 ,估计对预测物质的物理化学性质和生物活性 ,选择色谱分离条件及深入探索保留机理
具有重要意义。木香花属蔷薇科 、蔷薇属的花卉 ,是常绿灌木或藤本植物 ,其具有较强的自由基清除活
68  林 产 化 学 与 工 业 第 29卷
性 [ 5] 。作者采用本实验室提出的分子电性距离矢量(MEDV)对刘应媗等[ 6-7]提取的 53种木香花挥发性组
分进行建模研究 ,取得较好结果 , 可望对天然药物及精细化工产品的色谱行为提供有益参考。
1 原理与算法
用分子电性距离矢量(MEDV)对有机物分子结构进行表征时 [ 4, 8] ,考虑到分子中原子间的静电相互
作用 ,忽略非骨架氢原子的影响 ,将 C、N、O、S、F、Cl、Br、I等非氢原子根据与其相连的非氢原子数目分
为 4类 ,这 4类非氢原子之间发生相互作用可以按以下方式组合:m11 、 m12 、m13 、 m14 、 m22 、 m23 、 m24、
m33 、 m34、 m44 ,简写成 x1 、 x2 、x3、 x4 、 x5 、x6、 x7 、 x8 、 x9、 x10。MEDV各元素按下式计算:
xr=mnl= ∑i=n, j=lqi·qj/d2ij(n=1, 2, 3, 4;n≤l≤4)
式中:n、l—原子 i、 j的原子类型;qi、qj—原子 i、 j相对于碳原子的相对电负性;dij—原子 i、 j之间的相
对距离 ,即所经最短路径相对于碳碳单键相对键长之和 。
2 模型建立
多元线性回归是一种经典的建模方法 ,它对自变量和因变量加以线性拟合以得到最小二乘意义下
的最佳结果 。首先计算出报道的 53种木香花挥发性成分的保留时间和线性保留指数(见表 1)及其 10
个 MEDV矢量(见表 2)。
表 1 木香花挥发油中 53种组分及(tR)其在气相色谱-质谱中的保留时间(tR)及线性保留指数(ILR)
Table1 Retentiontime(tR)andlinearretentionindex(ILR)offifty-threecomponentsofR.banksiae
编号
No.
化合物  
compounds  
ILR
(实验值
exp.)
I′LR[ 6]
模型 4 model4
计算值
calculated
value
误差
eror
模型 5 model5
计算值
calculated
value
误差
error
保留
时间 /
min
tR
模型 3 model3
计算值
calculated
value
误差
eror
1 庚烷 heptane 700 700 739.139 0.056 721.031 0.030 2.582 2.810 0.088
2 乙缩醛 acetal 719 719 905.672 0.26 927.275 0.290 3.542 3.401 -0.040
3 辛烷 octane 798 800 829.514 0.039 812.194 0.018 4.961 4.305 -0.132
4 糠醛 furfural 828 828 893.974 0.08 873.768 0.055 6.113 6.178 0.011
5 异戊酸 isovalericacid 833 838 427.605 -0.487 407.524 -0.511 6.308 6.045 -0.042
6 呋喃甲醇 2-furanmethanol 844 845 968.327 0.147 996.703 0.181 6.773 6.474 -0.044
7 苯乙烷 ethylbenzene 849 849 1031.361 0.215 1058.064 0.246 6.954 6.549 -0.058
8 对二甲苯 p-xylene 857 860 1012.997 0.182 1057.357 0.234 7.266 7.256 -0.001
9 戊酸 pentanoicacid 875 875 946.404 0.082 945.091 0.080 7.851 7.973 0.016
10 1-壬烯 1-nonene 881 888.8 921.645 0.046 905.083 0.027 8.224 8.517 0.036
11 壬烯 nonene 900 900 921.639 0.024 905.083 0.006 11.534 11.959 0.037
12 苯甲醛 benzaldehyde 955 957 1058.444 0.108 1088.118 0.139 12.702 12.363 -0.027
13 蘑菇醇 1-octen-3-ol 976 978 922.339 -0.055 932.456 -0.045 13.222 12.864 -0.027
14 癸烷 decane 992 1000 1015.043 0.023 999.241 0.007 15.208 15.940 0.048
15 桉树脑 eucalyptol 1026 1020 1274.354 0.242 1202.458 0.172 16.851 16.346 -0.030
16 苯乙醇 benzylalcohol 1028 1030 1041.159 0.013 1068.282 0.039 16.929 17.036 0.006
17 苯乙醛 benzeneacetaldehyde 1038 1037 1120.289 0.079 1149.893 0.108 18.009 18.044 0.002
18
3, 3, 6-三甲基-1, 5-庚二烯-4-醇
3, 3, 6-trimethyl-1, 5-heptadien-4-ol 1079 1083 1133.815 0.051 1136.901 0.054 19.201 18.886 -0.016
19 氧化里哪醇 linalooloxide 1082 1082 1164.320 0.076 1159.808 0.072 19.349 19.122 -0.012
20 十一烷 undecane 1092 1100 1109.423 0.016 1094.369 0.002 20.211 20.510 0.015
21 苯乙醇 phenylethylalcohol 1106 1104 1118.925 0.012 1148.470 0.038 20.298 21.192 0.044
22 冰片烯 2-bornene 1141 1144 1074.764 -0.058 1023.534 -0.103 21.516 21.584 0.003
23 顺-马鞭草烷醇 cis-verbenol 1158 1131 1227.140 0.06 1178.259 0.017 21.723 21.872 0.007
24 冰片 borneol 1162 1173 1108.255 -0.046 1135.082 -0.023 22.136 21.116 -0.046
25 萜烯醇 terpenol 1173 1174 1439.248 0.227 1260.851 0.075 22.470 22.428 -0.002
26 对艹孟-1, 8-二烯 p-menth-1, 8-diene 1182 1186 1207.850 0.022 1182.705 0.001 22.121 22.615 0.022
第 4期 杨善彬 ,等:木香花挥发性组分的定量结构-色谱保留关系研究 69 
续表 1
编号
No.
化合物  
compounds  
ILR
(实验值
exp.)
I′LR[ 6]
模型 4 model4
计算值
calculated
value
误差
eror
模型 5 model5
计算值
calculated
value
误差
error
保留
时间 /
min
tR
模型 3 model3
计算值
calculated
value
误差
eror
27 十二烷 dodecane 1199 1200 1204.578  0.005 1190.268 -0.007 23.337 20.812 -0.108
28 6-甲基十二烷 6-methyldodecane 1251 1253 1209.719 -0.033 1226.502 -0.02 24.685 23.356 -0.054
29 4-甲基十二烷 4-methyldodecane 1257 1259 1218.999 -0.03 1234.426 -0.018 24.841 24.172 -0.027
30 2-甲基十二烷 2-methyldodecane 1261 1263 1335.394 0.059 1339.816 0.063 24.945 24.986 0.002
31 紫苏醛 perilaaldehyde 1277 1277 1183.688 -0.073 1191.324 -0.067 24.765 24.761 0.000
32 十三烷 tridecane 1295 1300 1300.354 0.004 1286.789 -0.006 25.821 25.817 0.000
33 紫苏醇 perilaalcohol 1298 1295 1171.601 -0.097 1177.541 -0.093 26.445 26.060 -0.015
34 丁香油酚 eugenol 1354 1355 1258.523 -0.071 1270.589 -0.062 26.654 28.906 0.084
35 正十四烷 n-tetradecane 1396 1400 1396.641 0 1383.820 -0.009 27.272 27.177 -0.003
36 丁香酚甲醚 eugenolmethylether 1395 1399 1251.230 -0.103 1315.767 -0.057 28.310 28.338 0.001
37 榄香脂素 elemicin 1555 1554 1414.725 -0.09 1493.395 -0.04 28.336 26.187 -0.076
38 匙叶桉油烯醇 spathulenol 1589 1578 1395.821 -0.122 1353.901 -0.148 28.363 27.564 -0.028
39 氧化石竹烯 caryophylleneoxide 1597 1594 1617.764 0.013 1647.911 0.032 28.843 30.307 0.051
40 绿花白千层醇 viridiforol 1606 1604 1362.452 -0.152 1395.671 -0.131 29.124 30.527 0.048
41 正十五烷 pentadecane 1496 1500 1590.453 0.063 1579.121 0.056 29.729 30.627 0.030
42 韦得醇 widdrol 1616 1606 1779.928 0.101 1777.968 0.100 31.333 31.605 0.009
43 正十六烷 hexadecane 1600 1600 1493.364 -0.067 1481.287 -0.074 32.028 32.552 0.016
44 桉叶油素 cineol 1647 1643 1511.123 -0.082 1578.865 -0.041 33.404 34.733 0.04
45 δ-杜松醇 δ-cadinol 1651 1649 1548.100 -0.062 1555.486 -0.058 33.621 34.171 0.016
46 α-杜松醇 α-cadinol 1659 1654 1548.100 -0.067 1555.486 -0.062 33.659 34.795 0.034
47 桧脑 junipercamphor 1662 1675 1621.658 -0.024 1657.969 -0.002 33.898 34.095 0.006
48 十七烷 heptadecane 1695 1700 1687.859 -0.004 1677.272 -0.01 34.187 34.145 -0.001
49 十八烷 octadecane 1796 1800 1785.539 -0.006 1775.698 -0.011 36.223 36.123 -0.003
50 正十九烷 nonadecane 1890 1900 1883.466 -0.003 1874.372 -0.008 37.735 37.369 -0.010
51 棕榈酸 n-hexadecanoicacid 1955 1957 1970.530 0.008 1980.361 0.013 38.740 38.786 0.001
52 二十烷 eicosane 1995 2000 1981.604 -0.007 1973.258 -0.011 39.365 39.524 0.004
53 二十一烷 heneicosane 2089 2100 2079.934 -0.004 2072.337 -0.008 40.921 41.215 0.007
表 2 53种木香花挥发油组分所得的 MEDV和线性保留指数(ILR)及保留时间(tR)
Table2 MEDV, retentiontimes(tR)andlinearretentionindex(ILR)of53 componentsofR.banksiae
编号
No. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 ILR tR/min
1 0.0278 2.9272 0.0000 0.0000 5.0347 0.0000 0.0000 0.0000 0.0000 0.0000 700 2.582
2 0.1651 3.9740 1.2450 0.0000 4.0766 3.7087 0.0000 0.0000 0.0000 0.0000 719 3.542
3 0.0204 2.9828 0.0000 0.0000 6.4983 0.0000 0.0000 0.0000 0.0000 0.0000 798 4.961
4 0.0863 2.7685 2.8352 0.0000 1.6923 3.6573 0.0000 1.0000 0.0000 0.0000 828 6.113
5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 833 6.308
6 0.0000 2.1465 0.3627 0.0000 6.0201 4.3890 0.0000 0.0000 0.0000 0.0000 844 6.773
7 0.0000 1.4207 0.2500 0.0000 7.2910 4.2058 0.0000 0.0000 0.0000 0.0000 849 6.954
8 0.0451 1.6135 2.1455 0.0000 3.3422 6.1387 0.0000 0.1364 0.0000 0.0000 857 7.266
9 0.7288 2.6553 3.7764 0.0000 2.2500 1.3611 0.0000 0.0000 0.0000 0.0000 875 7.851
10 0.0161 3.3991 0.0000 0.0000 7.9897 0.0000 0.0000 0.0000 0.0000 0.0000 881 8.224
11 0.0156 3.0236 0.0000 0.0000 7.9897 0.0000 0.0000 0.0000 0.0000 0.0000 900 11.534
12 0.0000 2.3513 0.4200 0.0000 7.3750 4.4335 0.0000 0.0000 0.0000 0.0000 955 12.702
13 0.2318 4.0572 1.8904 0.0000 4.0747 2.4236 0.0000 0.0000 0.0000 0.0000 976 13.222
14 0.0123 3.0548 0.0000 0.0000 9.5015 0.0000 0.0000 0.0000 0.0000 0.0000 992 15.208
15 0.5865 1.7964 6.4781 0.0000 1.3950 6.0887 0.0000 2.7531 0.0000 0.0000 1026 16.851
70  林 产 化 学 与 工 业 第 29卷
续表 2
编号
No. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 ILR tR/min
16 0.0000 2.1573 0.3627 0.0000 7.2910 4.2058 0.0000 0.0000 0.0000 0.0000 1028 16.929
17 0.0000 2.9394 0.1730 0.0000 8.7117 4.4558 0.0000 0.0000 0.0000 0.0000 1038 18.009
18 1.5672 3.2860 4.7789 2.7822 0.1111 2.6376 1.2500 0.2859 1.1214 0.0000 1079 19.201
19 1.0810 4.3037 0.6921 5.0549 1.9366 2.8769 4.3029 0.0000 1.1111 0.0625 1082 19.349
20 0.0100 3.0795 0.0000 0.0000 11.0289 0.0000 0.0000 0.0000 0.0000 0.0000 1092 20.211
21 0.0000 2.2738 0.1573 0.0000 8.7117 4.4558 0.0000 0.0000 0.0000 0.0000 1106 20.298
22 0.4722 1.6214 0.0000 2.1111 3.0637 0.0000 5.0719 0.0000 0.0000 0.2500 1141 21.516
23 0.6433 0.7822 4.7226 3.1119 0.0000 2.6923 0.4073 2.9073 4.1214 1.0000 1158 21.723
24 0.3558 1.8614 2.4439 1.6127 1.6944 3.9722 1.7500 0.2500 1.2500 0.0000 1162 22.136
25 0.0000 1.3799 0.5518 0.0000 6.2939 18.3978 0.0000 7.3942 0.0000 0.0000 1173 22.470
26 0.6065 2.5638 3.6407 1.3084 2.4803 2.1921 1.7445 1.0000 1.2500 0.0000 1182 22.121
27 0.0083 3.0995 0.0000 0.0000 12.5687 0.0000 0.0000 0.0000 0.0000 0.0000 1199 23.337
28 0.0565 3.9868 1.0678 0.0000 9.6815 2.8872 0.0000 0.0000 0.0000 0.0000 1251 24.685
29 0.0831 3.8613 1.1267 0.0000 9.8069 2.7618 0.0000 0.0000 0.0000 0.0000 1257 24.841
30 0.2665 2.6393 2.0100 0.0000 11.0289 1.5398 0.0000 0.0000 0.0000 0.0000 1261 24.945
31 0.3473 3.0403 3.4652 0.0000 3.5927 7.3164 0.0000 1.1844 0.0000 0.0000 1277 24.765
32 0.0069 3.1161 0.0000 0.0000 14.1185 0.0000 0.0000 0.0000 0.0000 0.0000 1295 25.821
33 0.3455 2.8577 3.4049 0.0000 3.5472 7.1880 0.0000 1.1882 0.0000 0.0000 1298 26.445
34 0.1523 4.4687 2.7497 0.0000 4.4991 9.9864 0.0000 1.6711 0.0000 0.0000 1354 26.654
35 0.0059 3.1300 0.0000 0.0000 15.6765 0.0000 0.0000 0.0000 0.0000 0.0000 1396 27.272
36 0.0312 3.6566 0.3924 0.0000 8.5401 8.3647 0.0000 0.1020 0.0000 0.0000 1395 28.310
37 0.0655 6.1781 0.7960 0.0000 8.2718 12.9933 0.0000 0.8113 0.0000 0.0000 1555 28.336
38 0.4979 2.4768 5.3299 0.0000 3.2119 9.6126 0.0000 2.8247 0.0000 0.0000 1589 28.363
39 0.2623 3.2467 4.4390 0.5450 4.2528 7.4411 1.7549 1.5576 2.3611 0.0000 1597 28.843
40 0.5073 3.7013 1.4640 2.6444 5.8144 6.0135 2.0347 0.4011 1.1511 0.0000 1606 29.124
41 0.0044 3.1520 0.0000 0.0000 18.8124 0.0000 0.0000 0.0000 0.0000 0.0000 1496 29.729
42 0.9715 4.3944 0.9103 6.2952 5.9661 2.5790 7.6052 0.0000 2.1214 0.4279 1616 31.333
43 0.0051 3.1418 0.0000 0.0000 17.2415 0.0000 0.0000 0.0000 0.0000 0.0000 1600 32.028
44 0.4564 4.4014 4.4024 0.0000 7.1676 8.0739 0.0000 0.1502 0.0000 0.0000 1647 33.404
45 0.9572 3.3213 3.0257 4.9483 2.8592 6.2734 3.4001 1.4073 2.6882 0.1111 1651 33.621
46 0.9572 3.3213 3.0257 4.9483 2.8592 6.2734 3.4001 1.4073 2.6882 0.1111 1659 33.659
47 0.8347 3.2734 3.6547 3.4216 4.1315 5.7139 3.7569 0.2939 1.5407 1.0000 1662 33.898
48 0.0039 3.1609 0.0000 0.0000 20.3884 0.0000 0.0000 0.0000 0.0000 0.0000 1695 34.187
49 0.0035 3.1687 0.0000 0.0000 21.9688 0.0000 0.0000 0.0000 0.0000 0.0000 1796 36.223
50 0.0031 3.1756 0.0000 0.0000 23.5532 0.0000 0.0000 0.0000 0.0000 0.0000 1890 37.735
51 0.6253 3.3108 3.7184 0.0000 18.8124 1.5760 0.0000 0.0000 0.0000 0.0000 1955 38.740
52 0.0028 3.1818 0.0000 0.0000 25.1410 0.0000 0.0000 0.0000 0.0000 0.0000 1995 39.365
53 0.0025 3.1873 0.0000 0.0000 26.7319 0.0000 0.0000 0.0000 0.0000 0.0000 2089 40.921
借助多元线性回归方法对 MEDV矢量和 tR(exp.)及 ILR(exp.)进行相关性研究 ,分别得到 tR及
ILR 10的 10变量的预测模型 ,回归方程见式(1)、(2):
  tR=-2.178 +1.135x1 +0.283x2 +2.288x3 +0.189x4 +1.649x5 +1.108x6 +2.196x7 -
0.725x8 +2.144x9 +0.420x10 (1)
n=53 R=0.949 SD=125.451
n=53 RCV=0.867 SDCV=198.613
  ILR10 =411.514 -49.173x1 -1.720x2 +97.396x3 +18.576x4 +62.419x5 +40.590x6 +
79.428x7 -47.065x8 +74.656x9 -52.493x10 (2)
n=53 R=0.906 SDCV =4.850
n=53 RCV=0.905 SDCV=7.334
式中:n—样本数;R—复相关系数;RCV—交互检验复相关系数;SD—标准偏差;SDCV—交互检验标准
第 4期 杨善彬 ,等:木香花挥发性组分的定量结构-色谱保留关系研究 71 
偏差。
为了进一步考察 MEDV各矢量对 QSRR建模过程的影响和对模型的贡献大小 ,对变量进行了逐步
回归分析 ,结果见图 1。
图 1 逐步回归 R及 SD的变化曲线
Fig.1 PlotsofRandSDversusthestepinSMR
对于 tR模型 ,随着变量的引人 ,回归系数(R)不断增大 ,标准偏差 SD逐渐减少;从 MEDV的 10个
变量中筛选出了 6变量(未引入变量 2, 4, 8和 10)时 , R已经达到最大值 0.906,而交互检验的回归系
数(RCV)近最大值 0.904,交互检验的标准偏差(SDCV)达到最小值 5.596 ,说明 6变量模型为最佳模型 ,
模型回归方程见式 3:
tR=-1.286 +2.064x1 +2.151x3 +1.664x5 +0.976x6 +2.373x7 +1.992x10 (3)
对于 ILR模型 ,引入到 6变量(未引入 2、 4、 8和 10)、7变量(未引入变量 2、 4和 10)时 , R分别为
0.943和 0.949,而 RCV分别为 0.904和 0.901, SDCV达到最小值 ,分别为 126.917和 121.602。说明 6、7
变量的 QSRR模型式(4)、(5),较 10变量的 QSRR模型(2)具有更强的预测能力 。其回归方程分别如
下:
ILR6 =427.605+12.227x1 +86.935x3 +61.810x5 +31.235x6 +89.122x7 +63.259x9 (4)
ILR7 =407.524 -1.626x1 +90.663x3 +62.278x5 +41.325x6 +83.987x7 -47.193x8 +81.369x9 (5)
利用上述 3模型分别对 53种木香花挥发性化合物的气相色谱保留时间和线性保留指数进行了估
计和预测 ,结果见表 1、图 2。
图 2 木香花挥发性有机物色谱保留时间 、线性保留指数实验值与预测值相关图
Fig.2 Plotsofestimatedvsobservedretentiontimeandlinearretentionindex
3 结果与讨论
由于 MEDV可直接从分子结构计算而得 ,经验成分较少 ,且不需要引入其他结构参数 ,因而具有简
72  林 产 化 学 与 工 业 第 29卷
便易用的特点。作者利用 MEDV对 53个化合物进行了结构表征 ,并建立了各化合物同其气相色谱保
留时间的定量关系。对模型进行了留一法交互检验 ,效果良好 ,说明模型具有较好的稳定性和对外部样
本的预测能力。从多元线性回归与逐步多元回归来看 ,作者所建立的模型所采用的参数均为简易计算
获得 ,充分考虑了各原子对色谱保留时间的贡献 。虽然用 10个变量对 ILR和 tR建模得到的 R最高 ,分
别为 0.949和 0.906,但模型的 RCV并没有达到最高 ,说明该模型的变量数过多 、样本数相对太少 ,使得
模型存在过拟合现象 。进行逐步回归表明 ,当对 ILR选用 6或 7个变量时 ,模型的 R、 SD和 RCV值均达到
较好的值 ,说明 6、 7变量模型的稳定性和预测能力更高。而对 tR选用 6变量时模型的 R、 SD和 RCV值
均达到较好的值 。可以看出 , MEDV能较好地描述天然产物的化学结构 、键合状态和电性特征 ,所研究
的样本分子结构跨度大(包括烷烃 、烯烃 、芳烃等),与已有研究[ 8-11]相比 ,本研究突破了 MEDV矢量只
能应用于具有相似结构的同一类化合物的 QSRR研究的范畴 ,同时对保留时间和其线性保留指数进行
了预测和计算 ,都表明 MEDV对天然产物的色谱保留行为都具有较好的估计预测能力 ,证明了 MEDV
矢量在有机物 QSRR研究上有较强的普适性。
4 结 论
本研究采用分子电性距离矢量(MEDV)表征了木香花挥发性成分的分子结构 ,运用多元线性回
归 /逐步回归对模型进行变量筛选 ,建立了 53种木香花挥发性成分气相色谱保留时间(tR)与 MEDV的
定量相关 10变量 、 6变量模型及线性保留指数(ILR)的 10、 7、 6变量模型。定量结构-保留关系(QS-
RR)模型的建模计算值复相关系数(R)分别为 0.949、 0.906、 0.906、 0.949和 0.943。留一法交互校验
复相关系数(RCV)分别为 0.867、 0.904、 0.905、 0.901和 0.904。结果表明所建模型具有良好估计能力
与稳定性。但是 MEDV矢量是一个二维拓扑描述子 ,不能区分顺反异构和旋光异构的化合物结构 ,因
而用化学键相对键长加和的最小值作为两个原子之间的距离尚有一定局限性 ,这些问题有待进一步探
讨 。
参考文献:
[ 1]周丽平 ,夏之宁 ,李伯玉.多环芳烃分子结构的距边矢量表征及其气相色谱保留指数预测 [ J] .色谱 , 2001, 19(1):25-31.
[ 2]刘树深 ,刘堰 ,李志良.一个新的分子电性距离矢量(MEDV)[J] .化学学报 , 2000, 58(11):1353-1357.
[ 3] LIUSS, YINCS, WANGLS.CombinedMEDV-GA-MLRmethodforQSARofthreepanelsofsteroiddipeptides, andCOX-2 inhibitors[ J].
ChemInfComputSci, 2002, 42:749-756.
[ 4] SUNLL, ZHOUY, LIGR, etal.Molecularelectronegativity-distancevector(MEDV-4):Atwo-dimensionalQSARmethodfortheestimation
andpredictionofbiologicalactivitiesofestradiolderivatives[ J].JMollusst, 2004, 679:107-113.
[ 5]陆瑞利 ,胡丰林.亚热带部分常见芳香油树种鲜叶提取物清除自由基的活性研究 [ J] .林产化学与工业 , 2003, 23(2):51-56.
[ 6]刘应媗 ,余爱农.木香花挥发油化学成分分析 [ J].精细化工 , 2007, 24(8):782-785.
[ 7]余爱农 ,刘应媗 ,刘程毅.木香花挥发油化学成分分析 [ C] //中国科学技术协会青年科学家论坛第 122次会议论文集.中国化工学会
精细化工会刊 <精细化工 >编辑部 , 2006.
[ 8]孙立力 ,李志良.分子电性距离矢量(MEDV)用于醇的分子结构表达和物理性质预测 [ J] .化工学报, 2005, 56(2):203-208.
[ 9] SUNLL, ZHOULP, YUY, etal, QSPRstudyofpolychlorinateddiphenylethersbymolecularelectronegativitydistancevector(MEDV-4)
[J].Chemosphere, 2007, 66:1039-1051.
[ 10] ZHOUY, SUNLL, MEIH, etal.EstimationandpredictionofrelativeretentionindicesofpolychlorinatednaphthalenesinGCwithmolecular
electronegativitydistancevector[J].Chromatography, 2006, 64(9 /10):565-570.
[ 11] LIUSS, LIUY, YINDQ, etal.Predictionofchromatographicrelativeretentiontimeofpolychlorinatedbiphenylsfromthemolecularelectron-
egativitydistancevector[ J] .SepSci, 2006, 29:296-301.