免费文献传递   相关文献

分子电距矢量对山矾花中头香成分气相色谱保留时间的估计和预测



全 文 :第21卷第 4期
2 00 4年 4月
精 细 化 工
FINE CHEMICALS
Vol.21 , No.4
Apr.2 0 0 4
香料与香精
分子电距矢量对山矾花中头香成分气相色谱
保留时间的估计和预测
聂金媛 ,廖春阳 ,吴世容 ,李志良*
(重庆大学 化学化工学院 ,重庆 400044)
摘要:用分子电距矢量(MEDV)描述子对 22 个从山矾花中分离出的头香成分的分子进行结构表征 , 对 MEDV
矢量和其气相色谱保留时间之间建立了定量结构-色谱保留值关系。 线性回归 10 参数模型的复相关系数 R
达到了 0.972 , 逐步回归 5 参数模型复相关系数 R 为 0.952 , 交互检验的相关系数 R CV值为 0.882 , 表明模型对
样本具有较好的稳定性能和预测能力。
关键词:分子电距矢量;山矾花;头香成分;定量结构-色谱保留值关系
中图分类号:O652.9  文献标识码:A  文章编号:1003-5214(2004)04-0273-06
Estimation and Prediction of Gas Chromatography Retention Time of
Components Separated from Symplocos Sumunlia through MEDV
NIE Jin-yuan , LIAO Chun-yang ,WU Shi-rong , LI Zhi-liang*
(Department of Applied Chemical Engineering , College of Chemistry and Chemical Engeneering , Chongqing
University , Chongqing 400044 , China)
Abstract:The MEDV (vector of molecular electronegativi ty distance)descriptors are used to
characterize the st ructures of 22 compounds separated from Symplocos sumunlia.The descriptor are
employed to establish the quantitative relationship models w ith respect to the retention time of the
examined 22 compounds in gas chromatog raphy.The co rrelation coefficient of the ten-variable model
obtained from MLR(multiple linear reg ression)is 0.972 , and that of the 5-variable model obtained
from SMR (stepwise multiple reg ression)is 0.952.The value of cross-validation R CV in LOO
(leave-one-out)is 0.882.The results show that the constructed models are provided wi th good
estimation stabili ty and favorable predictive ability.
Key words:vector of molecular elect ronegativity distance;Symplocos sumunlia;vapourable
component;quant itative structure-retention relationship
Foundation item:Fuk Yintung Educational Foundation[ 98] , National Chunhui Pro ject Foundation
[ 99-1-4/38] , Chongqing Applied Science Fund[ 01 -3-6] , Chongqing University Innovation
Academic Fund[ 03-5-8]
  山矾(Symplocos S umunl ia)又名山桂花 、七里
香 ,为山矾科山矾属灌木或小乔木 ,分布在我国浙
江 、江西 、湖南 、湖北 、四川和广东等省[ 1] 。山矾花
在三月开放 ,由于具有浓烈的芳香 ,提取其精油可用
于开发天然香料 。
余爱农[ 2] 等将新鲜采摘的山矾花中的香气成
分放置于密闭容器 ,加入适当吸附剂吸附其散发的
香气成分 ,再用适当溶剂洗脱 ,洗脱液用高纯氮吹去
溶剂浓缩 ,用 GC-MS法分离并分析鉴定其成分及
质量分数 ,最后鉴定出 22个挥发性化学成分。
收稿日期:2003-09-15
基金项目:霍英东基金[ 98] ;国家“春晖计划”教育部启动基金[ 99-1-4/ 38] ;重庆应用基础[ 01-3-6] ;重庆大学创新基金[ 03-5-8]
资助项目
作者简介:聂金媛(1979-),女 ,广西贺州富川县人 ,现为重庆大学化学化工学院分析化学专业研究生 , 主要从事中草药的提取 、分离和
相关化学计量学的研究 ,电话:023-65106677 , E-mail:lucknjy@163.com , zlli2662@163.com , zlli6216@hotmail.com。
DOI :10.13550/j.jxhg.2004.04.009
定量结构 -色谱保留 值关系(quat itative
structure-retention relationship , QSRR)的研究对预
测保留值 、选择分离条件及探索色谱保留机理都具
有重 要 意 义[ 3] 。 作 者 利 用 分 子 电 距 矢 量
(MEDV)[ 4]对山矾花中分离出的 22个化合物进行
了结构表征 ,借助多元线性回归 、逐步回归和留一法
(leave-one-out ,LOO)交互检验建立了分子电距矢量
和22个化合物的气相色谱保留值之间的相关模型
(QSRR),取得较好的结果 ,可望对天然药物及精细
化工产品的色谱行为提供有益参考 。
1 QSRR研究方法和对化合物分子结构表征
1.1 MEDV方法原理
本实验中 MEDV 矢量是可由化学分子图理论
方法衍生得到结构参数的一种矢量 。
分子由各种不同属性的原子按不同连接方式
(化学键)构成。而原子之间的相互作用与原子电性
及相隔距离密切相关 。一般而言 ,依据库仑定律 ,电
性越大 ,距离越小 ,相互作用就越大 。另一方面 ,不
同原子类型之间的相互作用方式也不同 。原子间相
互作用取决于各原子的电负性和它们之间的距离 。
本实验中 MEDV 矢量的提出[ 5]即基于这一原理。
1.2 相对电负性和相对键长
MEDV 方法提出了原子的相对电负性 q
(relative electronegat ivity)和化学键(A —B)的相对
键长 d(relative bond leng th), q 定义为以 A 原子的
鲍林电负性 X A 比上 C 原子的鲍林电负性 X C ,即
qA=X A/ X C;d 定义为以 A —B 键的键长 BLA—B比
上C —C 单键的键长(BLC—C),即 dA—B=BLA—B/
BLC —C。
1.3 原子类型和原子属性
“原子类型”用于间接地描绘不同分子的拓扑结
构特征 。绝大多数有机和/或药物分子中包含的非
氢原子通常为 C 、O 、N 、P 、S 和卤素原子(F 、Cl 、Br 和
I)。分子内的碳原子依据其所连接的非氢原子数可
分为 C1 、C2 、C3 、C4四类 ,分别表示与 1 、2 、3 、4个非
氢原子相连 。而其他非氢原子包括 O 、N 、P 、S 、F 、
Cl 、Br与 I 则视为拟碳原子 ,依据其所连接的非氢原
子数 ,它们同样也分为以上 4种类型。
为表征分子结构 ,也需要对分子中不同原子之
间相连的化学键类型进行区分 ,这里将某一个原子
的“原子属性”用于表达该原子键连的化学键类型 。
原子属性用两个大写的英文字母来表示 ,第一个字
母代表该原子所属元素类型 ,第二个代表与其他原
子和/或基团连接的化学键类型。例如 ,原子属性
“CC”指一个以单键或双键与其他原子连接形成共
轭体系的 C原子 ,而原子属性“N1”指仅以单键与其
他原子相连的 N 原子 。
1.4 MEDV矢量的计算方法
依据以上原子类型与原子属性的定义 ,化合物
分子中四类非氢原子发生相互作用可以组合出以下
几种方式:M1 j(j≥1), M2 j(j≥2), M3 j(j≥3), M4 j
(j=4),(其中 j≤4)。M ij可由下式计算:
  M ij=∑n
i=1∑
n
j≥i
qkql
d2ik , jl (i , j=1 , 2 , 3 , 4;n=4)  
(1)
式中:d ik , , j l表示第 i 类非氢原子的第 k 个非氢原子
A ik与第 j 类非氢原子的第 l 个非氢原子 A jl之间的
相对距离(即原子 i 到原子 j 的各个路径中化学键
相对键长加和的最小值), n ij是 i类和 j类非氢原子
相互作用的项数 。qk 和q l 分别是第 k 个非氢原子
和第 l 个非氢原子的相对电性 。相对电性与相对键
长的计算参考文献[ 6] 得到。显然 ,由(1)式定义的
M ij共有 10 个元素:M 11 , M 12 , M 13 , M 14 , M 22 ,
M 23 , M24 , M 33 , M 34 , M 44 。这 10个元素就构成了
描述分子结构的分子电距矢量(vector of molecular
elect ronegativity distance , MEDV),简称 μ矢量 ,其
元素对应为 μ1 , μ2 , μ3 , μ4 , μ5 , μ6 , μ7 , μ8 , μ9 , μ10 。
以紫丁香醇(表 2 中的第 9 个化合物)为例 ,
MEDV 矢量的计算可用图 1的分子图来说明。首
先对化合物分子中的各个非氢原子进行编号(见图
1),然后判断各个非氢原子的原子类型和原子属性
(见表 1)。对于紫丁香醇 ,分子内有 12 个非氢原
子 ,其原子类型分别为 2 , 3 , 3 , 2 , 2 , 4 ,2 ,2 ,1 , 1 , 1和
1;其相应的原子属性分别为 C1 、C1 、C1 、C1 、C1 、C1 、
O1 、C2 、C2 、O1 、C1和 C1。
图 1 紫丁香醇的分子结构
Fig.1 Molecular matrix skele ton of liliac alcohol
表 1 紫丁香醇分子中各个非氢原子类型及属性表
Table 1 Types and attributes of atoms in liliac alcohol molecules
原子 1(C) 2(C) 3(C) 4(C) 5(C) 6(C) 7(O) 8(C) 9(C) 10(O) 11(C) 12(C)
原子类型 2 3 3 2 2 4 2 2 1 1 1 1
原子属性 C1 C1 C1 C1 C1 C1 O1 C2 C2 O1 C1 C1
  对紫丁香醇分子 ,其第 1个 MEDV 元素为 μ1 ,
μ1 是 4个第一类原子之间的相互作用。其中每两
个原子间的最短路径分别为:
C9 C12:C9 C8 C6 C 12
C9 C11:C9 C8 C6 O 7 C3 C2 C 11
C9 O10:C9 C 8 C6 O 7 C 3 C2 C1 O 10
C12 C11:C12 C6 O 7 C3 C2 C11
·274· 精 细 化 工 FINE CHEM ICALS              第 21卷 
C12 O10:C12 C6 O 7 C3 C2 C1 O10
C11 O10:C11 C2 C1 O10
于是
d(C9—C12)=0.8701+1.0000+1.0000=2.8701;
d(C9—C11)=0.8701+1.0000+0.9286+0.9286+1.0000+
      1.0000=5.7273
d(C9—O10)=0.8701+1.0000+0.9286+0.9286+1.0000+
      1.0000+0.9286=6.6559
d(C12—C11)=1+0.9286+0.9286+1+1=4.8572
d(C12—O 10)=1+0.9286+0.9286+1+1+0.9286=5.7858
d(C11—O 10)=1+1+0.9286=2.9286
另外 ,根据相对电负性的定义[ 6] , qO1=1.3490 ,
qC1=1.0000 ,因此 μ1数值计算如下:
μ1=M 11= 1×1
2.87012 +
1×1
5.72732+
1×1.3490
6.65592 +
1×1
4.85722 +
   1×1.3490
5.78582 +
1×1.3490
2.92862 =0.4223
同样 ,第 2 、第 3 、第 4 、第 5 、第 6 、第 7 、第 8 、第 9
和第 10个元素的计算值分别为:μ2 =5.2213 , μ3=
2.0764 , μ4 =1.412 , μ5 =2.8225 , μ6 =4.9781 , μ7
=3.8818 , μ8=1 , μ9=0.4124 , μ10=0。因此 ,紫
丁香醇的分子距边矢量为 μ=(0.4223 , 5.2213 ,
2.0764 , 1.412 , 2.8225 , 4.9781 , 3.8818 , 1 , 0.4124 ,
0)。以此类推 ,可得到 22个化合物的每个 MEDV
元素值(详见表 2 , 表中数据为实验室自编 True
Basic程序 Imp Vmed在 PC 机上运行而得)。
表 2 山矾花中分离出的 22 个化合物的 MEDV参量和气相色谱保留时间
Table 2 MEDV variables and retention time for 22 compounds separa ted from Shanfan
No. 分离出的组分              MEDV 参量μ1 μ2 μ3 μ4 μ5 μ6 μ7 μ8 μ9 μ10
保留时间[ 2]/ min
1 乙苯 0 1.409 0.25 0 6.8187 3.9864 0 0 0 0 4.22
2 2 ,2 ,4 ,6 ,6-五甲基庚烷 2.125 2.375 1.6667 6.4622 0.25 2 2.2222 0 0.5 0.0625 6.09
3 顺式氧化芳樟醇 0.751 2.7286 2.7715 2.6489 4.3284 4.7854 1.9738 0.0422 1.0668 0 7.30
4 反式氧化芳樟醇 0.751 2.7286 2.7715 2.6489 4.3284 4.7854 1.9738 0.0422 1.0668 0 7.51
5 L-芳樟醇 1.0886 4.201 2.1311 2.9348 2.6736 1.7703 2.3611 0 0.0668 0 7.66
6 紫丁香醛 0.4413 5.8269 2.1495 1.4156 2.8225 4.9781 3.8818 1 0.4124 0 8.35
7 双花醇 1.011 4.6733 2.1765 4.1822 2.2438 1.6799 5.8741 0 1.1225 0.2899 8.68
8
2 , 6-二甲基-3 , 7-辛二烯-
2 ,6-二醇 1.94 4.8104 0 6.689 3.0346 0 3.8209 0 0 0.0668 8.87
9 紫丁香醇 0.4223 5.2213 2.0764 1.412 2.8225 4.9781 3.8818 1 0.4124 0 9.14
10 氧化橙花醇 0.4969 4.3319 2.8712 1.8062 3.4337 4.8039 3.1757 0.0422 1.0668 0 9.72
11 3 ,4 ,5-三甲氧基甲苯 0.2453 6.4817 3.0287 0 2.1986 12.4338 0 3.2723 0 0 11.29
12
4-甲基-2 ,6-二叔丁基-4-羟
基-2 , 5-环己二烯-1-酮 3.4081 2.536 5.8335 9.9485 0.25 3.1134 2.6722 2.5734 3.4324 0.2989 11.95
13 2 ,6-二叔丁基对苯醌 2.7584 2.121 7.7691 6.782 0.2859 5.4009 0.6722 3.2723 3.0197 0.0668 12.03
14 月桂醇 0.0095 3.9154 0 0 14.1185 0 0 0 0 0 12.13
15 1 ,3 ,5 ,7-四甲基金刚烷 0.375 3.75 0 5.3333 3.1875 0 13.3333 0 0 1.5 12.22
16 十五烷 0.0051 3.1418 0 0 17.2415 0 0 0 0 0 12.34
17 2 ,6-二叔丁基对甲苯酚 2.6166 1.8349 6.7477 6.7155 0.2859 5.4009 0.6722 3.2723 3.0197 0.0668 12.43
18 十六烷 0.0044 3.152 0 0 18.8124 0 0 0 0 0 13.36
19 十七烷 0.0039 3.1609 0 0 20.3884 0 0 0 0 0 14.32
20 3 ,5-二叔丁基-4-羟基苄醇 2.5116 3.9324 5.7554 6.6207 0.5287 7.004 0.9044 3.2723 3.0197 0.0668 14.93
21 十八烷 0.0035 3.1687 0 0 21.9688 0 0 0 0 0 15.23
22 2-甲基十七烷 0.2578 2.7369 2.0044 0 18.8124 1.576 0 0 0 0 15.28
2 线性回归模型的建立
2.1 多元线性回归模型
对22个化合物编码后 ,采用自编的 Ture Basic
程序算出用于表征化合物分子结构的 μ矢量 10个
元素。以这 10个变量作为自变量 ,以 22个化合物
的气相色谱保留时间作为因变量 ,运用多元线性回
归方法(MLR),建立了 22个化合物气相色谱保留
时间与 10个 μ矢量之间的多元线性回归模型:
Y(1)=-1.727+1.712μ1+1.186μ2+0.618μ3-0.108μ4+
0.610μ5+0.111μ6-0.095μ7+0.243μ8+0.389μ9+5.604μ10 (方程 1)
该模型的复相关系数 R 较高 ,达到 0.972 ,标
准偏差 SD 为 1.004 , 统计量 F 、U 和 Q 分别为
19.127 、192.762和 11.086。以多元线性回归建立
的模型对各系列化合物气相色谱保留时间的估计
值 、误差和相对误差分别见表 4的 Est.、Err.、Err.
(%)栏 。
为了说明模型的稳定性和对外部样本的预测能
力 ,对模型进行了留一法(leave-one-out , LOO)交互
检验。留一法交互检验是评价模型稳定性和对外部
样本预测能力最重要也最有效的一种方法[ 5] 。其
过程是从样本集 n 个样本中每次抽取一个样本作
为外部预测集 ,以其余所有的(n -1)个样本作为训
·275·第 4 期 聂金媛 ,等:分子电距矢量对山矾花中头香成分气相色谱保留时间的估计和预测
练集建立线性回归模型 ,并以这个模型预测所抽出
的那个外部预测集样本 ,连续作 n 次不重复抽样直
到每一个样本均被抽出检验一次也仅一次为止。最
后是计算样本集交互检验的预测值与所观测的实验
值的复相关系数等统计量 ,以对模型稳定性和预测
能力进行评价 。留一法交互检验结果见表 4 的
Pre.CV 、Err.CV和 Err.CV(%)栏。交互检验的结果
并不理想 ,其 R 2cv值为负值(-0.215),说明该 10参
数模型并不稳定 。原因可能是由于只有 22个样本 ,
而自变量数有 10个 ,样本数太少而自变量数过多造
成多元线性回归模型有着显著的过拟合现象 。因此
对之采用逐步回归(SMR)分析。
2.2 逐步回归模型
在上述的多元回归分析中 10 个自变量全部是
同时进入方程的 。由于自变量之间关系复杂 ,各个
自变量对因变量的作用是不相同的。有的自变量对
因变量影响显著 ,有的则不显著 ,或者有的自变量单
独看来与因变量关系密切 ,但与其他几个变量合起
来求回归方程 ,该变量在回归方程中的作用又变得
无足轻重了 ,如果还把这样的变量留在回归方程中
将增加方程的不稳定性 。为了减少上述多元线性回
归模型中有可能存在的过拟合现象 ,运用了逐步回
归方法对 MEDV矢量与化合物保留时间进行建模。
逐步回归的结果见表 3 ,图 2和图 3。
表 3 逐步回归变量分析
Table 3 Analy sis of variables by SMR
Virables R R 2 SD F U Q R2CV R CV SDCV FCV U CV QCV
μ5 0.529 0.280 3.653 0.427 57.033 146.815 0.166 0.407 2.916 3.977 33.812 170.036
μ5μ8 0.822 0.676 2.451 2.293 137.754 66.094 0.590 0.768 2.098 13.645 120.178 83.670
μ5μ8μ7 0.913 0.834 1.761 5.474 169.738 34.110 0.728 0.853 1.756 16.048 148.375 55.473
μ5μ8μ7μ1 0.938 0.880 1.494 8.036 179.305 24.543 0.814 0.902 1.494 18.583 165.905 37.943
μ5μ8μ7μ1μ2 0.951 0.904 1.335 10.339 184.245 19.603 0.779 0.882 1.680 11.253 158.715 45.133
μ5μ8μ7μ1μ2μ3 0.964 0.929 1.146 14.422 189.402 14.446 0.513 0.716 2.572 2.635 104.605 99.243
μ5μ8μ7μ1μ2μ3μ10 0.971 0.942 1.023 18.379 192.336 11.512 0.513 0.716 2.662 2.110 104.660 99.188
μ5μ8μ7μ1μ2μ3μ10μ9 0.972 0.944 1.012 18.801 192.580 11.268 0.681 0.825 2.235 3.475 138.900 64.948
图 2 逐步回归结果 SD 随变量个数 m 的变曲线
Fig.2 Plot of SD versus the number parameters with SMR
图 3 逐步回归结果 R 随变量个数 m 的变曲线
Fig.3 Plo t o f R versus the number parameters with SMR
从表 3 和图 2 、3 可以看出 ,随变量个数 m 增
加 ,复相关系数 R 逐渐增加 ,标准偏差 SD 逐渐降
低;但在交互检验预测过程中 ,随变量个数 m 增加 ,
R CV先增加 ,SD减小 ,当变量数 m 为 4时 R CV达到
最大值(0.902),但此时对应的多元线性回归模型的
SD仍然较大;而后变量个数 m 继续增加后 , R CV开
始减小 , 而 SDCV增加 。综合考虑 R 、SD 、RCV和
SDCV ,采用 5个变量(μ5 , μ8 , μ7 , μ1和 μ2)对化合物
保留时间建立多元线性回归模型:
Y(1)= 0.978+1.394μ1 +0.467μ2+0.600μ5 +0.508μ7 +
1.843μ8  (方程 2)
该五变量模型的复相关系数 R 为 0.951 ,标准
偏差 SD 为 1.335 , 统计量 F 、U 和 Q 分别为
10.339 、184.245和 19.603。交互检验预测的 R CV
为 0.882。参数 10模型(方程 1)和参数 5 模型(方
程 2)对保留时间的估计和误差见表 4。其中1Est.
表示方程 1对保留时间的估计值 , 1Err.是方程 1的
估计误差 , 1Pre.CV是模型 1 交互检验的预测值 ,其
他依此类推 。
以多元线性回归和逐步回归建立的模型对化合
物保留时间的预测对实验值作图 ,分别得到图 4和
图 5。
·276· 精 细 化 工 FINE CHEM ICALS              第 21卷 
表 4 以多元线性回归和逐步回归建立的两个模型对体系保留时间估计与误差
Table 4 Estimations and errors fo r liliac alcohol by MLR and SMR
No. Obs. 1Est. 1Err. 1Err.(%) 1Pre.CV 1Err.CV 1Err.(%) 2Est. 2E rr. 2Err.(%) 2Pre.CV 2Err.CV 2E rr.CV(%)
1 4.22 4.701 0.481 11.40 6.478 2.258 53.52 5.729 1.509 35.77 7.361 3.141 74.43
2 6.09 5.768 -0.322 -5.28 5.418 -0.672 -11.04 6.328 0.238 3.91 6.246 0.156 2.56
3 7.30 7.632 0.332 4.55 7.850 0.550 7.54 6.977 -0.323 -4.42 7.308 0.008 0.11
4 7.51 7.632 0.122 1.62 7.712 0.202 2.69 6.977 -0.533 -7.09 7.280 -0.230 -3.06
5 7.66 7.749 0.089 1.16 7.854 0.194 2.53 7.261 -0.399 -5.21 6.676 -0.984 -12.85
6 8.35 9.424 1.074 12.86 10.089 1.739 20.83 9.822 1.472 17.63 9.791 1.441 17.25
7 8.68 9.497 0.817 9.41 9.840 1.160 13.36 8.899 0.219 2.52 9.142 0.462 5.32
8 8.87 8.439 -0.431 -4.86 7.322 -1.548 -17.45 9.691 0.821 9.25 8.867 -0.003 -0.03
9 9.14 8.628 -0.512 -5.60 8.156 -0.984 -10.76 9.512 0.372 4.08 9.647 0.507 5.54
10 9.72 8.593 -1.127 -11.60 8.000 -1.720 -17.70 7.445 -2.275 -23.41 7.122 -2.598 -26.73
1111.29 11.771 0.481 4.26 17.625 6.335 56.11 11.696 0.406 3.60 10.864 -0.426 -3.77
1211.95 13.527 1.577 13.20 15.134 3.184 26.64 13.163 1.213 10.15 13.906 1.956 16.37
1312.03 12.637 0.607 5.04 13.374 1.344 11.17 12.358 0.328 2.72 12.921 0.891 7.41
1412.13 11.545 -0.585 -4.82 10.756 -1.374 -11.33 11.295 -0.835 -6.88 10.799 -1.331 -10.97
1512.22 11.864 -0.356 -2.91 -0.525 -12.74 -104.3 11.934 -0.286 -2.34 11.781 -0.439 -3.59
1612.34 12.525 0.185 1.50 12.573 0.233 1.88 12.803 0.463 3.75 12.886 0.546 4.42
1712.43 11.430 -1.000 -8.04 10.499 -1.931 -15.53 12.026 -0.404 -3.25 12.626 0.196 1.58
1813.36 13.495 0.135 1.01 13.526 0.166 1.24 13.750 0.390 2.92 13.826 0.466 3.49
1914.32 14.466 0.146 1.02 14.508 0.188 1.32 14.699 0.379 2.65 14.787 0.467 3.26
2014.93 13.439 -1.491 -9.99 11.966 -2.964 -19.86 13.123 -1.807 -12.10 12.207 -2.723 -18.24
2115.23 15.438 0.208 1.37 15.538 0.308 2.02 15.651 0.421 2.77 15.776 0.546 3.59
2215.28 14.851 -0.429 -2.81 13.908 -1.372 -8.98 13.909 -1.371 -8.97 13.702 -1.578 -10.33
图 4 22 个化合物模型估计保留值与实验值相关(方程 1)
Fig.4 P lot of est.vs.obsd.RBA(eq.1)
图 5 22 个化合物模型估计保留值与实验值相关(方程 2)
Fig.5 P lot of est.vs.obsd.RBA(eq.2)
3 结果与讨论
用 MEDV 描述子对 22个从山矾花中分离出的
头香成分的分子结构进行表征 ,编码方法简便易行 ,
虽然需要计算 10个参量 ,但由于是在微机上进行 ,
可以快速准确地计算得到 。以所得到的 MEDV 参
量为输入变量 ,以 22个化合物的气相色谱保留时间
为输出变量 ,进行多元线性回归分析 ,所得到的模型
虽然其复相关系数较高(0.972),但模型的交互检验
预测的复相关系数却为负 ,说明该模型的变量数过
多(10 个),而样本数相对太少 ,从而使得模型存在
显著的过拟合现象。进行的逐步回归表明 ,选用 5
个变量时 ,模型的复相关系数 、标准偏差和交互检验
的 R CV值均达到较好的值(分别为 R =0.951 、SD=
1.107和 R CV =0.882),说明模型具有一定的稳定
性和预测性 。
由于 MEDV矢量是一个二维拓扑描述子 ,暂时
还不能区分顺反异构和旋光异构的化合物结构;并
且由于化合物分子的实际结构是立体的 ,因而用化
学键相对键长加和的最小值作为两个原子之间的距
离尚有一定局限性。这些问题还有待进一步的探
讨 。另外 ,作为输出变量的实验值 ,必定也有一定的
误差 ,从而可能会影响计算的结果 。尽管如此 ,用
MEDV 矢量进行分子建模和预测 , 能获得较好结
果 ,本文提供了又一尝试。
·277·第 4 期 聂金媛 ,等:分子电距矢量对山矾花中头香成分气相色谱保留时间的估计和预测
4 结论
本实验室提出的 MEDV矢量由于其具有直观 、
简单易行的优点 ,将其应用于烃类的某些物化性质 ,
如沸点 、密度 、热容量焓和色谱保留指数等的
QSAR/QSPR研究[ 7~ 9]等都得到了满意的结果。本
文用 MEDV 矢量对山矾花的 22个头香成分进行了
结构表征 ,借助多元线性回归分析和逐步回归分析 ,
对其气相色谱保留时间建立了一个 5参数的定量结
构-色谱保留值关系 。交互检验预测的结果表明模
型对样本具有一定的稳定性和预测能力 。
参考文献:
[ 1]  中国科学院北京植物研究所.中国高等植物图鉴[M ] .第 3册 ,
北京:科学出版社 , 1974.311-312.
[ 2]  余爱农 ,谭志斗 ,甘华兵.新鲜山矾花头香成分的研究[ J] .精细
化工 , 2003 , 20(1):26-28.
[ 3]  杨学谨 ,李延东 ,王善伟,等.二茂铁衍生物疏水参数的测定及其
保留值与结构定量关系的研究[ J] .色谱 , 1996 ,14(2):86-90.
[ 4]  Liu S S , Cao C-Z , Li Z-L.Approach to estimation and
pridiction for normal boiling point(NBP)of alkanes based on a
novel molecular distance-edge(MDE)vector [ J ] .J Chem Inf
Comput S ci , 1998 , 38(3):387-389.
[ 5]  刘树深 , 刘 堰 , 李志良 , 等.一个新的分子电性距离矢量
(MEDV)[ J] .化学学报 , 2000 , 58(11):1353-1357.
[ 6]  周润琦 ,陈石根.生物化学教程[ M ] .北京:化学工业出版社 ,
1992.196-197.
[ 7]  Liu S S , Liu H L , Xia Z L , et al.Molecular distance-edge vector:
an extension f rom alkanes to alkohols[ J] .J Chem Inf Compu t Sci ,
1999 , 39(6):951-953.
[ 8]  Liu S S , Yin C S , Cai S X , et al.QSAR study of steroid
benchmark and dipeptides based on MEDV-13[ J] .J Chem Inf
Comput S ci , 2001 , 41(2):321-329.
[ 9]  周丽平 ,夏之宁 ,李伯玉 ,等.多环芳烃分子结构的距边矢量表
征及其气相色谱保留指数预测[ J] .色谱 , 2001 , 19(1):25-31.
(上接第 264 页)
  在较大的浓度范围内形成微乳状液 ,进一步实
验证明配方 6可与水以任意比例混合而形成稳定微
乳液 。比较而言 ,由于大豆色拉油 EFO中聚氧乙烯
链的存在导致其亲水亲油能力发生质的提高 ,并且
由于其与乳化剂 C12EFME 、AEO 分子结构的相似
性 ,在与乳化剂复配时表现出了较佳的配伍性 ,所以
EFO不但能够形成微乳状液 ,而且含 EFO 的微乳
油剂具有含油率较高的特点 。
表 3 含大豆色拉油衍生 EFO的油剂配方
Tab.3 Formulation containing ethoxylated soybean oil
No. w(EFO1)/ % w(EFO2)/ % w(C12EFME6)/ % w(C12EFM E8)/ % w(C12EFM E9)/ % w(AEO3)/ % w(AEO7)/ % w(AES)/ % w(NPE4)/ %
1 15 65 20
2 20 65 15
3 15 50 7 28
4 15 50 10 25
5 30 43 7 10 10
6 37 37 20 5 1
表 4 表 3 中配方的水分散液稳定性
Tab.4 S tability of formulation in table 3 spreading in wa ter
No. w(油剂)
1% 5% 10% 25%
1 均匀透明 均匀透明 均匀透明 均匀透明
2 均匀透明 ,蓝光 均匀透明 ,蓝光 均匀透明 ,蓝光 均匀透明 ,蓝光
3
均匀透明 ,微蓝

均匀透明 , 久置
浑浊
4 均匀透明 均匀透明 ,蓝光 均匀透明 ,蓝光 均匀透明 ,蓝光
5
透明蓝光 ,放置
浑浊
透明蓝光 , 放置
浑浊
6 均匀透明 均匀透明 均匀透明 ,蓝光 均匀透明
3 结论
(1)采用本实验室特制的催化剂 FY 能够实现
油脂的一步法烷氧基化 ,合成得到 EFO和 PFO 。
(2)与天然油脂相比 ,烷氧基化油脂的自乳化性
能及乳化性能均得到较大改善 ,其中 EFO 的自乳化
和乳化性有了质的提高。
(3)大豆色拉油衍生 EFO代替大豆色拉油作为
油脂成分可以配制稳定的油剂 ,此类油剂可以与水
在较大浓度范围内形成微乳状液 ,优选的配方可与
水以任意比例混合形成微乳状液 。
参考文献:
[ 1]  Nakamura M.Recent developmen ts and future t rends in
oleochemist ry[ J] .JJOCS , 1997 , 46(9):957-967.
[ 2]  Cox M F ,Weerasooriya U.Part ially saponified t riglyceride
ethoxylates[ J] .J Surfactants and Detergents , 2000 , 3(2):213-
220.
[ 3]  Hama I , Sakaki M ,S asamoto H.Ef fect s of ethoxylate st ructu re on
surfactant properties of ethoxylated fat ty methyl esters [ J ] .
JAOCS , 1997 , 74(7):823-827.
[ 4]  Hama I , Sakaki M ,S asamoto H.Properties of polyoxyethylene/
polyoxyp ropylene-t ype nonionic surfactan t w ith narrow adduct
distribution[ J] .JJOCS , 1996 , 45(11):21-28.
[ 5]  贝 雷.油脂化学与工艺学[ M ] .北京:中国轻工业出版社 ,
2001.602-604.
[ 6]  Solans C , Kunieda H.Industrial applicat ions of microemulsions
[ M] .New York:Marcel Dekker Inc , 1997.
[ 7]  崔正刚 ,殷福珊.微乳化技术及应用[ M ] .北京:中国轻工业出
版社 , 1999.341-345.
[ 8]  毛培坤.合成洗涤剂工业分析[ M] .北京:轻工业出版社 ,
1988.471.
·278· 精 细 化 工 FINE CHEM ICALS              第 21卷