全 文 :野茉莉花香气成分的定量构效关系研究
收稿日期:2013 - 07 - 05; 修稿日期:2013 - 09 - 02
基金项目:江苏省高校自然科学基金项目(09KJD150012)
作者简介:秦正龙(1963 -) ,男,教授,研究方向为物质的定量效构关系,通信地址:221116 江苏徐州市铜山新区上海路 101 号 江苏师
范大学化学化工学院,E-mail:hxxqzl@ jsnu. edu. cn。
秦正龙,陈茂繁
(江苏师范大学化学化工学院,江苏 徐州 221116)
摘要:计算了从野茉莉花中分离出的 37 种香气成分的两类分子拓扑指数(mX t
v、En) ,采用最佳子
集回归方法建立这些拓扑指数与 37 种香气成分色谱保留时间(RT)的定量构效关系模型。该模型的相
关系数(R2)为 0. 951,逐一剔除法交叉验证系数(R2cv)为 0. 920。通过 R
2、F、R2Adj、R
2
cv、VIF、FIT 等检验,
上述模型具有令人满意的稳健性和预测能力。
关键词:野茉莉花;挥发性成分;分子拓扑指数;定量结构-保留关系
中图分类号:TS201. 2 文献标识码:A 文章编号:1005 - 1295(2013)06 - 0011 - 04
doi:10. 3969 / j. issn. 1005 - 1295. 2013. 06. 003
Relationship Between Quantitative Structure and Chromatographic Retention Time of
Volatile Component from Styrax japonicus Sieb
QIN Zheng-long,CHEN Mao-fan
(School of Chemistry & Chemical Engineering,Jiangsu Normal University,Xuzhou 221116,China)
Abstract:Based on the molecular topological theory,the electrotopological state index (En)and Kiers
molecular valence connectivity index (mX t
V)of 37 volatile components from Styrax japonicus Sieb were calcu-
lated. A six-variable model of the quantitative structure-retention relationship between En,
mX t
V and gas chrom-
atographic retention time (RT)of volatile components from Styrax japonicus Sieb was established by Leaps-
and-Bounds regression (LBR). Multiple correlation coefficient (R2)and cross-validation correlation coeffi-
cient (R2cv)of leave-one-out(LOO)were 0. 951 and 0. 920 respectively. The QSRR models have both favora-
ble estimation stability and good prediction capability by R2,F,R2Adj,R
2
cv,VIF,FIT tests.
Key words:Styrax japonicus Sieb;volatile component;molecular topological index;QSRR
0 引言
野茉莉也叫野百果树、茉莉苞、安息香等[1],
常年生长在海拔 200 ~ 1500m 的低山丘陵、阴坡
谷地,具有生长速度快、繁殖能力强、生态适应广
等特点,主要分布于我国安徽、云南、江苏、广东、
广西、贵州、福建和四川等地。野茉莉树形优美,
花色洁白,散发出浓郁的香气,是一种优良的绿化
树种。紫茉莉的花、叶、根和种子均可入药[2 - 3],
是一种重要的药用植物,具有清热解毒、祛风除
湿、活血散淤之功效,主治肺痨吐血、疥疮创伤、急
性关节炎、糖尿病、慢性气管炎等症[4]。目前,有
关野茉莉的研究报道主要集中在它的药理作用,
而作为天然香料资源的开发报道则较少。为了探
索野茉莉花香料的主要成分,陈青等采用固相微
萃取技术提取了野茉莉花的香气成分,并通过气
相色谱-质谱分析[5 - 7],确认了 37 种挥发性物质。
作者利用两类分子拓扑指数对从野茉莉花中分离
出的 37 种化合物进行结构表征,并将它们与色谱
保留时间(RT)进行回归分析,得到了良好的预测
模型。结果表明,该模型较好地揭示了野茉莉花
11
野茉莉花香气成分的定量构效关系研究———秦正龙,陈茂繁
香气成分保留时间的递变规律,为野茉莉花挥发
油的质量检验、生理活性研究及进一步开发利用
提供依据。
1 试验材料与方法
1. 1 试验材料
V9680 计算机(同方股份有限公司) ;Chemof-
fice 2005、SPSS 13. 0、MATLAB 7. 01 软件;从野茉
莉花中分离出的 37 种香气成分的色谱保留时间
来自文献[5],具体数据见表 1。
表 1 野茉莉花香气成分的拓扑指数和色谱保留时间
序号 化合物 0Xt
v E1 E6 E7 E13 E16
RT
Exp. Cal.
1 3-甲基-正丁醛 4. 27 4. 04 0. 95 0. 00 0. 00 9. 62 2. 04 1. 91
2 己醛 4. 81 2. 13 0. 98 0. 00 0. 00 9. 68 3. 34 3. 78
3 反式-2-己烯醛 4. 55 2. 08 4. 20 0. 00 0. 00 9. 59 4. 11 3. 82
4 (Z)-3-己烯-1-醇 4. 72 2. 08 4. 04 0. 00 8. 24 0. 00 4. 16 3. 86
5 α-蒎烯 7. 15 7. 13 2. 43 0. 00 0. 00 0. 00 5. 45 6. 65
6 苯甲醛 4. 37 0. 00 0. 83 9. 10 0. 00 10. 01 5. 95 7. 47
7 香桧烯 6. 98 4. 72 0. 00 0. 00 0. 00 0. 00 6. 15 6. 53
8 β-蒎烯 6. 98 4. 80 0. 00 0. 00 0. 00 0. 00 6. 22 6. 51
9 β-香叶烯 6. 98 4. 22 4. 04 0. 00 0. 00 0. 00 6. 45 7. 48
10 辛醛 6. 23 2. 19 1. 01 0. 00 0. 00 9. 84 6. 67 7. 08
11 (Z )-乙酸叶酯 6. 59 3. 49 4. 08 0. 00 0. 00 10. 23 6. 74 8. 19
12 1-甲氧基-4-甲基苯 5. 72 3. 73 0. 00 7. 96 0. 00 0. 00 7. 02 7. 43
13 1-柠檬烯 6. 98 4. 35 2. 35 0. 00 0. 00 0. 00 7. 17 7. 11
14 顺式-罗勒烯 7. 15 6. 28 6. 24 0. 00 0. 00 0. 00 7. 31 7. 66
15 反式-B-罗勒烯 7. 15 6. 28 6. 24 0. 00 0. 00 0. 00 7. 51 7. 66
16 1,2,3,4-四甲基苯 7. 15 8. 67 0. 00 4. 36 0. 00 0. 00 8. 11 7. 65
17 4-乙基-1,2-二甲基苯 6. 94 6. 49 0. 00 6. 64 0. 00 0. 00 8. 33 8. 84
18 芳樟醇 L 7. 72 5. 89 3. 71 0. 00 9. 49 0. 00 8. 49 9. 75
19 壬醛 6. 94 2. 21 1. 01 0. 00 0. 00 9. 89 8. 56 8. 73
20 (E)-4,8-二甲基-1,3,7-壬三烯 7. 85 6. 40 6. 18 0. 00 0. 00 0. 00 8. 78 9. 25
21 对-孟烷-1,5,8-三烯 6. 72 4. 22 6. 67 0. 00 0. 00 0. 00 8. 89 7. 39
22 α-异松香烯 7. 20 6. 65 2. 35 0. 00 0. 00 0. 00 9. 06 6. 90
23 小蠹二烯醇 7. 51 4. 19 1. 70 0. 00 9. 41 0. 00 9. 35 9. 37
24 1-甲氧基-4-
(2-丙烯基)苯 6. 71 1. 67 1. 89 8. 00 0. 00 0. 00 10. 33 10. 76
25 4,6,6-三甲基-二环
[3. 1. 1]庚-3-烯-2-酮 7. 35 6. 50 1. 84 0. 00 0. 00 11. 38 10. 59 8. 73
26 3-苯基-丙醇 5. 96 0. 00 0. 00 10. 20 8. 53 0. 00 10. 95 11. 14
27 α-柠檬醛 7. 55 6. 14 4. 65 0. 00 0. 00 10. 02 11. 59 9. 69
28 桂皮醛 5. 53 0. 00 4. 02 9. 70 0. 00 9. 89 11. 65 11. 04
29 茴香烯 6. 87 3. 68 4. 07 7. 96 0. 00 0. 00 11. 88 10. 93
30 3-苯基-丙烯醇 5. 70 0. 00 3. 61 9. 89 8. 44 0. 00 12. 28 11. 10
31 丁香酚 7. 08 1. 53 1. 81 5. 27 9. 25 0. 00 13. 10 11. 53
32 肉桂酸甲酯 6. 86 1. 36 3. 11 9. 59 0. 00 10. 68 13. 54 13. 59
33 反式-乙酸桂酯 7. 57 1. 40 3. 74 9. 87 0. 00 10. 40 14. 52 15. 44
34 6,10-二甲基-5,9-
十一碳烯-2-酮 9. 89 8. 02 4. 43 0. 00 0. 00 10. 69 14. 59 14. 60
35 反式-β-金合欢烯 10. 48 6. 50 6. 44 0. 00 0. 00 0. 00 14. 63 15. 38
36 橙花叔醇 11. 22 8. 20 6. 09 0. 00 9. 73 0. 00 16. 30 17. 66
37 二十碳烷 14. 73 4. 59 0. 00 0. 00 0. 00 0. 00 25. 38 24. 60
1. 2 两类分子拓扑指数的计算
电拓扑状态指数(En)是根据分子中每一个
非氢原子的拓扑环境及其成键电子信息进行计算
得到的一组数学不变量[8]。En 主要由两部分组
21
包装与食品机械 2013 年第 31 卷第 6 期
成:一是分子中每个非氢原子类型(n)的微观结
构及局部化学环境,从而决定原子的本征值,用
“In”表示;二是反映该原子在分子中被其他非氢
原子作用所产生的本征值的增量,用“ΔIn”表示。
对于原子类型为 n 的电拓扑状态指数(En)可由
下式计算:
En =∑(In + ΔIn)j (1)
式中 j———分子中所含原子类型 n的数目
分子价连接性指数(mX t
v)是由 Kier 等根据
数学图论[9],在分子隐氢图的邻接矩阵基础上提
出的一种分子结构描述符,其核心概念是成键原
子(i)的点价 (δi
v) :
δi
v = (zi - hi)/(Zi - zi - 1) (2)
式中 Z i———非氢原子 i的电子总数
zi———非氢原子 i的价电子数
hi———与非氢原子 i直接键合的氢原子数
定义分子的价连接性指数(mX t
v)为:
mX t
V =∑(δi
vδj
vδk
v…)- 0. 5 (3)
式中 m———相应指数的阶数
t———子图的类型,主要的 4 种子图,即链、
星、星-链、环,对应的 t依次为 p、c、pc
及 ch,具体见图 1
应用经修正的程序计算了从野茉莉花中分离
出的 37 种化合物的上述两类分子拓扑指数[10]。
图 1 分子结构的基本子图类型
1. 3 试验方法
将野茉莉花香气成分中每种化合物的两类分
子拓扑指数作为自变量,相应的色谱保留时间作
为因变量构建数据集,应用最佳变量子集回归
(Leaps-and-Bounds regression)进行变量压缩并
选择最佳的变量组合,建立定量结构-保留相关性
(quantitative structure-retention relationship,QS-
RR)模型,采用逐一剔除法(leave-one-out,LOO)
对模型的预测能力及鲁棒性进行检验,以交叉验
证相关系数(R2cv)予以评价。一般认为如果 R
2
cv≥
0. 5,则所建立的数学模型具有良好的鲁棒性及
预测能力[11 - 12]。同时引入 Kubinyi 函数 (Kubi-
nyi function,FIT)[13],其定义式为:
FIT = R
2(N -M - 1)
(N +M2) (1 - R2)
(4)
式中 N———化合物的样本数目
M———回归模型中自变量的数目
如果 FIT值越大,则说明所建模型的稳定性
越高,预测能力越强。
2 试验结果与分析
2. 1 野茉莉花香气成分的 QSRR模型及 LOO 交
叉验证
将野茉莉花香气成分中的 37 种化合物的色
谱保留时间试验值及两类拓扑指数一起输入
SPSS 13. 0 软件,在 95% 的置信区间内进行多元
线性回归分析,经最佳变量子集回归及留一法交
叉验证所有建的 QSRR 模型见表 2。其中 R2,
R2Adj,R
2
cv,S,F和 FIT分别为判定系数、校正判定系
数(用来消除模型中自变量的个数以及样本容量对
判定系数的影响) ,逐一剔除法的交叉验证相关系
数、估计标准误差、Fischer检验值、Kubinyi函数。
表 2 拓扑指数和色谱保留时间最佳变量子集回归结果
序号 R2 R2Adj R
2
cv S F FIT Variable
1 0. 673 0. 664 0. 409 2. 527 72. 197 1. 913 1Xt
v
2 0. 893 0. 886 0. 738 1. 469 141. 451 6. 921 1Xt
v,E7
3 0. 923 0. 916 0. 903 1. 267 131. 028 8. 599 1Xt
v,E1,E7
4 0. 933 0. 925 0. 908 1. 194 111. 890 8. 041 1Xt
v,E1,E6,E7
5 0. 944 0. 935 0. 910 1. 111 88. 368 8. 429 1Xt
v,E1,E6,E7,E16
6 0. 951 0. 941 0. 920 1. 057 97. 126 7. 976 1Xt
v,E1,E6,E7,E13,E16
7 0. 950 0. 940 0. 905 1. 066 82. 248 6. 407 1Xt
v,E1,E2,E6,E7,E13,E16
由表 2 可见,随着模型中变量数目的增多,其
R2cv先是逐渐增大至 0. 920,而后又下降,FIT 呈锯
齿状变化,R2cv的最大值与 FIT 的最大值在不同位
置出现转折,在多元回归分析中,为了使所建立的
预测模型具有较好的可信度,化合物的样本数目
(N )与变量数目(M)之比是有要求的[14],需要
31
野茉莉花香气成分的定量构效关系研究———秦正龙,陈茂繁
满足如下规则[15]:N /M≥5。本研究的化合物样
本容量 N = 37,按规则其 M≤7。综合考虑,确定
6 元最佳 QSRR模型如下式所示。
RT = - 8. 268 + 2. 3280X t
v - 0. 308E1 + 0. 196E6
+ 0. 445E7 + 0. 119E13 + 0. 135E16 (5)
n = 37,R2 = 0. 951,R2Adj = 0. 941,
R2cv = 0. 920,S = 1. 057,F = 97. 126
由上式给出的计算值与试验值有较好吻合
(见表 1)。
2. 2 模型中变量自相关性的检验
回归模型中各个变量之间是否存在共线性是
衡量回归方程可靠性的重要指标。变量之间的共
线性一般可以采用变量间的自相关系数矩阵及变
异膨胀因子(Variance Inflation Factors,VIF)来进
行判定[16 - 17]。
VIF = 1 /(1 - r2) (6)
式中 r2是自变量集中某一变量与剩余变量的
判定系数。如 VIF = 1,说明变量之间无自相关性;
如 1 < VIF <5,说明变量之间不存在显著的自相关
性;如 VIF > 5,说明变量之间具有显著的共线性,
所建模型就不能用于化合物性质的估算和预测。
此外,共线性还可以采用各变量的容忍度 To
来进行检验,当 To 均大于 0. 1 时,则表明模型中
的各个变量之间没有明显的共线性现象。QSRR
模型(5)的自相关矩阵、To 和 VIF值见表 3。由表
3 可知,各变量间的相关系数远小于0. 50,VIF 均
小于 5,To 均大于 0. 1,表明该模型中的变量之间
不存在明显的自相关性。
表 3 模型中各描述符的自相关矩阵与 VIF、T0 值
变量 E1 E6 E7 E13 E16 0Xp
V T0 VIF
E1 1. 000 0. 714 1. 401
E6 0. 596 1. 000 0. 432 2. 321
E7 0. 163 0. 231 1. 000 0. 920 1. 087
E13 0. 300 0. 044 0. 098 1. 000 0. 617 1. 622
E16 0. 265 0. 046 0. 057 0. 354 1. 000 0. 776 1. 289
0Xp
V 0. 413 0. 170 0. 276 0. 037 0. 261 1. 000 0. 715 1. 400
2. 3 QSRR模型的鲁棒性检验
表 4 模型(5)的稳健性检验
剔除序号 1 2 3 4 5 6 7 8 9 0
R2 0. 958 0. 955 0. 948 0. 947 0. 958 0. 955 0. 945 0. 954 0. 953 0. 953
F 98. 062 91. 763 79. 518 77. 658 98. 325 91. 383 60. 879 93. 081 91. 669 91. 794
S 0. 995 1. 041 1. 115 1. 127 1. 017 1. 039 1. 224 1. 068 1. 077 1. 076
为了检验方程(5)中是否存在机会相关及
“异常值”,采用 Jackknife法来进行验证。由于所
研究的是大样本(N > 30) ,故采用逐组剔除
法[18],即依次剔除 1、11、21、31 号,2、12、22、32
号,…,依次类推,用余下的化合物分子作为训练
集,按模型(5)的形式进行回归,重复 10 次,它们
的 R2、F值及 S见表 4。由表 4 可见,10 个方程的
R2 在 0. 945 ~ 0. 958 之间,即在 0. 951 附近上下
波动,呈良好的正态分布,它们的平均值为0. 952,
与模型(5)的 R2 颇为一致。从表 1 可以看出,本
文计算值(Cal.)与试验值(Exp.)的差值均在 3S
(S为标准偏差)以内,没有异常值。这就表明,模
型(5)具有总体可接受的稳健性及良好的预测能
力。另外,式(5)的 R2Adj与 R
2
cv相差 0. 021,小于
0. 3,说明该模型没有过拟合,不存在不相关的其
它变量。
3 结束语
Kier价连接性指数、电拓扑状态指数能够较
好地表征野茉莉花香气组分的分子结构特征,前
者用于揭示分子的大小、分支、形状和表面积等结
构特征,反映了分子间的色散力的大小;后者用于
揭示分子中各成键原子的电子状态和电性作用,
反映了取向力和诱导力的大小,有效地揭示了影
响野茉莉花香气成分气相色谱保留时间的本质因
素,所建的 QSRR 模型具有较强的稳健性及预测
能力,获得了满意的估算与预测结果,为进一步阐
明其香气成分,探索色谱保留机理,选择试验分离
条件,建立有效的 GC-MS定性方法等提供依据。
参考文献:
[1]王丽,王奎玲,刘庆超,等.赤霉素处理及层积处理对
野茉莉种子萌发的影响[J].江西农业学报,2010,22
(3) :77 - 79.
[2]王育英,秦官属,仲世奇,等.花卉[M].西安:陕西科
学技术出版社,1981:35 - 36.
[3]福建省医药研究所.福建药物志[M].福州:福建人
民出版社,1973:90.
(下转第 32 页)
41
包装与食品机械 2013 年第 31 卷第 6 期
3 结束语
与平压性能、侧压性能和弯曲性能相同,剪切
性能也是夹层结构的基本性能指标之一,按照国
家标准的压缩剪切试验方法,应用改造的组合压
缩剪切夹具,对夹层结构纸板———蜂窝纸板和高
强纸板进行了压缩剪切测试。测试结果表明:对
于夹层结构纸板纵向样品的抗剪切能力大于横向
样品;在用纸相同时,相同方向的蜂窝和高强纸板
抗剪切能力随厚度的增加而降低,相同厚度和方
向蜂窝纸板的抗剪切能力大于高强纸板,蜂窝纸
板的抗剪切性能比高强纸板更好。
参考文献:
[1]王兴业,杨孚标,曾竟成,等.夹层结构复合材料设计
原理及其应用[M].北京:化学工业出版社,2006.
[2]温时宝,薛蕾,刘翠. 纸板托盘的发展及其结构概
述[J].包装与食品机械,2011,29(2) :56 - 59.
[3]刘鸿文.材料力学(I) [M]. 4 版.北京:高等教育出版
社,2004.
[4] GB /T 1455—2005 夹层结构或芯子剪切性能试验方
法[S].北京:中国标准出版社,2005.
[5] ASTM 273—2000 Test method for shear properties of
sandwich constructions or cores [S]. West Consho-
hocken:American Society for Testing and Materials,
2000.
[6] 单杭英,肖军,尚伟,等. X-cor 夹层结构的剪切性能
[J].航空动力学报,2013,28(3) :541 - 549.
[7]李真,周仕刚,薛元德.剪切对泡沫夹层结构梁弯曲
性能的影响[J].玻璃钢 /复合材料,2011,38(2) :20
- 24.
[8] Paik Jeom Kee,Thayamballi Anil K,Kim Gyu Sung. The
strength characteristics of aluminum honeycomb sand-
wich panels[J]. Thin-Walled Structures,1999,35:205
- 231.
[9]邵文全,计宏伟,李砚明,等.蜂窝纸板剪切强度实验
研究[J].包装工程,2008,29(2) :10 - 11.
[10]温时宝,曹开化,王斌,等.高强瓦楞蜂窝复合纸板及
其力学性能研究[J].包装与食品机械,2012,30(3) :
32 - 35.
[11]温时宝.夹层结构纸板压缩剪切夹具的改进及其验
证[J].包装工程,2013,34(11) :72 - 76.
[12]温时宝.一种快速更换试样的夹层结构压缩剪切测
试夹具:中国,201120160447. 7[P]. 2011 - 05 - 11.
(上接第 14 页)
[4]贵州省中医研究所.贵州中草药名录[M]. 贵阳:贵
州人民出版社,1988:74 - 75.
[5]陈青,姚蓉君,张前军.固相微萃取气质联用分析野
茉莉花的香气成分[J].精细化工,2007,24(2) :159
- 161.
[6]刘涛,谢功昀.柑橘类精油的提取及应用现状[J].包
装与食品机械,2009,27(1) :44 - 48.
[7]席雪梅,陆宁.铜陵白姜精油分析研究[J].包装与食
品机械,2011,29(1) :13 - 18.
[8] Hall L H,Kier L B,Brown B B. Molecular similarity
based on novel atom-type electrotopological state indices
[J]. Journal Chemical Information and Computer Sci-
ences,1995,35(6) :1074 - 1080.
[9] Kier L B,Hall L H. Molecular Connectivity in Structure-
Activity Analysis [M]. England:Research Studies
Press,1986:82.
[10]黔南,梁逸曾,王亚丽.直观队列命名法的基本原理
及其在矩阵与拓扑指数计算中的应用[J].计算机与
应用化学,2003,20(4) :386 - 389.
[11]Douglas M H,Subhash C B,Denise M. Assessing model
fit by cross-validation[J]. Journal of Chemical Informa-
tion and Computer Sciences,2003,43(2) :579 - 586.
[12]Winkler D A,Burden F R. Holographic QSAR of benzo-
diazepines[J]. Quantitative Structure-Activity Relation-
ships,1998,17(3) :224 - 231.
[13]Urra L S,Gonzalez M P,Teijeira M. 2D-autocorrelation
descriptors for predicting cytotoxicity of naphthoquinone
ester derivatives against oral human epidermoid carcino-
ma[J]. Bioorganic and Medicinal Chemistry,2007,15
(10) :3565 - 3571.
[14]许禄,吴亚平,胡昌玉,等. 苯胺类化合物结构-毒性
定量构效关系研究[J]. 中国科学(B 辑) ,2000,30
(1) :1 - 7.
[15]刘东,章文军,许禄.手性羟酸和氨基酸类化合物的
构效关系研究[J]. 化学学报,2009,67(2) :145 -
150.
[16]冯长君. 3-取代硫基-5-(2-羟基苯基)-4H-1,2,4-三唑
类化合物抑菌活性的定量构效关系和结构修饰的理
论研究[J].化学学报,2012,70(4) :512 - 518.
[17]李吉来,杭烨超,耿彩云,等.苯砜基羧酸酯类急性毒
性的 QSAR 研究[J]. 高等学校化学学报,2007,28
(1) :117 - 120.
[18]堵锡华.香梨酒香气成分保留时间的定量构效关系
研究[J].食品科学,2011,32(2) :218 - 221.
23
包装与食品机械 2013 年第 31 卷第 6 期