全 文 :基金项目:湖北省教育厅科学研究青年项目(Q20141704)
第一作者简介:金健,武汉轻工大学生物与制药工程学院在读硕士研究生,主要研究方向:药物植物的功能基因组研究
通信作者:张绍鹏,Email:zsp0106@ qq. com
·论 著·
人参属植物鲨烯环氧酶编码基因的生物信息学分析
金健,吴亚运,晏旋,黄勋,张绍鹏
武汉轻工大学,武汉 430023
摘要:目的 对人参属植物的三萜皂苷生物合成途径中的鲨烯环氧酶及其编码基因进行分子层面的分析研究。方法 从
Genbank中找到目前已公布的所有人参属植物的鲨烯环氧酶基因序列信息,利用生物信息学方法对这些序列进行开放阅读
框、编码氨基酸和进化关系树进行了初步的预测和分析。结果 不同物种间的鲨烯环氧酶基因在核苷酸和氨基酸平均相似
性以及结构分析表明 14 种鲨烯环氧酶编码基因在人参属植物中是稳定的。对人参属的 14 种鲨烯环氧酶进行聚类分析发现
可以将其分为 3 类。结论 通过生物信息学方法对人参属植物鲨烯环氧酶及其编码基因进行分析,可以为鲨烯环氧酶基因
以及三萜皂苷途径的分子生物学研究提供理论上的依据和指导资料。
关键词:人参属;鲨烯环氧酶;理化性质;生物信息学分析
中图分类号:R282. 62 文献标识码:A 文章编号:1006-2483(2016)03-0009-04
Bioinformatics analysis of squalene epoxidase coding gene in Panax genus
JIN Jian,WU Ya-yun,YAN Xuan,HUANG Xun,ZHANG Shao-peng
Wuhan Polytechnic University,Wuhan 430023,China
Corresponding author:ZHANG Shao-peng,Email:zsp0106@ qq. com
Abstract: Objective To investigate squalene epoxidase gene intriterpene saponins biosynthesis pathway of Panax plants by
bioinformatics analysis. Methods Fourteen squalene epoxidase genes of Panax plants published on Genbank were analyzed in this
study. Squalene epoxidase cDNA sequence and its amino acid sequence,ORF and evolutional relationship were respectively analyzed
using bioinformatics methods. Results The different species of squalene epoxidase gene in nucleotides and amino acids of average
similarity and structural analysis showed that 14 kinds of squalene epoxidase gene encoding in ginseng genus were stable. All these
Panax species could be divided into three groups by phylogenetic tree analysis. Conclusion By analyzing the bioinformatical
characteristics of Panax squalene epoxidase genes,the present study could provide theoretical basis for the future squalene epoxidase
gene cloning and related genetic manipulation.
Key words:Panax genus;Squalene epoxidase (SE);Physical and chemical properties;Bioinformatics methods
三萜皂苷是广泛存在人参属植物中的一类化合
物[1],其成分具有调节免疫系统、降低胆固醇、抗
炎、抗氧化 、抗癌等生理功效,临床应用前景十分诱
人[2]。三萜皂苷的合成途径现已明确[3],主要分为
三步:首先是 3-异戊烯焦磷酸酯(isopentenyl diphos-
phate,IPP)和 γ,γ-二 甲 基 烯 丙 焦 磷 酸 酯
(dimethylally diphosphate,DMAPP)的合成;其次是
三萜碳环骨架的合成;最后经过一系列的氧化还原
反应实现环上复杂的官能化反应,形成完整的三萜
皂苷分子。甲羟戊酸途径是合成的必由途径。鲨烯
环氧酶是三萜皂苷的生物合成途径中一种重要的
酶,属于单加氧酶,主要作用是催化鲨烯合成为 2,
3-氧化鲨烯。在鲨烯环氧酶的作用下,单氧态的氧
化鲨烯生成 2,3-氧化鲨烯[4],这一物质是甾体、皂
苷、倍半萜、橡胶等许多的萜类衍生物的合成前体,
也是植物在生长发育过程中一个很重要的物质,具
有帮助植物抗病的功效。然后 2,3-氧化鲨烯经过
糖基化、羟基化以及环化作用等修饰后形成三萜
类[5]。从三萜皂苷的合成通路发现,鲨烯环氧酶是
其合成通路中的关键酶[4],也是重要的限速酶。为
了进一步从分子水平上研究药用植物的三萜皂苷合
成通路,用生物信息学方法对 GeneBank 中人参属
植物的所有 14 种鲨烯环氧酶基因的 cDNA 序列及
其编码的氨基酸序列进行预测分析,为鲨烯环氧酶
·9·公共卫生与预防医学 2016 年第 27 卷第 3 期 J of Pub Health and Prev Med,Jun. 2016,Vol. 27 No. 3
基因的分子生物学研究提供理论基础。
1 材料与方法
1. 1 材料来源 实验研究的人参属植物的 14 种鲨
烯环氧酶(2,3-oxidosqualene)的 cDNA 序列及其编
码的氨基酸序列从美国国家生物信息中心(National
Center for Biotechnology Information,NCBI)中获得[6]
(表 1)。
表 1 14 种人参属植物鲨烯环氧酶基本信息
物种名称 序列长度 核苷酸登陆号 蛋白质登陆号
Panax notoginseng squalene epoxidase mRNA,complete cds 1 648bp linear mRNA DQ457054. 1 GI:92122626
Panax notoginseng squalene epoxidase mRNA,complete cds 1 623 bp linear mRNA DQ386734. 1 GI:91771691
Panax ginseng squalene epoxidasemRNA,complete cds 1 969 bp linear mRNA FJ393274. 2 GI:226320342
Panax ginseng mRNA for squalene epoxidase,complete cds 2 005 bp linear mRNA AB122078. 1 GI:46359650
Panax ginseng mRNA for squalene epoxidase,complete cds 1 845 bp linear mRNA AB003516. 1 GI:2804277
Panax vietnamensis var. SE3 mRNA,complete cds 1 611 bp linear mRNA KJ946469. 1 GI:672941314
Panax vietnamensis var. SE2 mRNA,complete cds 1 635 bp linear mRNA KJ946468. 1 GI:672941312
Panax vietnamensis var. SE1 mRNA,complete cds 1 581 bp linear mRNA KJ946467. 1 GI:672941310
Panax notoginseng squalene epoxidase mRNA,complete cds 1 620 bp linear mRNA KC953033. 1 GI:529276254
Panax notoginseng squalene epoxidase mRNA,complete cds 1 642 bp linear mRNA KC422651. 1 GI:471845143
Panax notoginseng isolate SE2 mRNA,complete cds 1 638 bp linear mRNA JX625132. 1 GI:410832501
Panax notoginseng isolate SE mRNA,complete cds 2 054 bp linear mRNA KJ804171. 1 GI:672930580
Panax quinquefolius squalene synthase 1 mRNA,complete cds 1 629 bp linear mRNA KC524471. 1 GI:484847900
Panax quinquefolius squalene synthase mRNA,complete cds 1 629 bp linear mRNA KC524469. 1 GI:484847893
1. 2 方法 鲨烯环氧酶编码基因及其编码的氨基
酸理化性质的分析借助软件 ProtParam查询得到;开
放阅读框利用 ORF Finder软件完成,蛋白质的亲水
性分析采用分析工具 portscale 查询;人参属植物的
14 种鲨烯环氧酶编码基因编码的氨基酸序列的跨
膜结构域分析可以用 TMHMM 分析工具完成[7];氨
基酸序列系统进化树的构建是利用 ClustalX 1. 8[8]
比对后再利用 MEGA4[9]完成。
2 结 果
2. 1 鲨烯环氧酶基因理化性质预测分析 对 14 种
基因的理化性质进行统计(表 2),在人参属植物中,
鲨烯环氧酶的 cDNA 序列长度总体变化趋势不大,
平均值在 1 723bp 左右;编码的鲨烯环氧酶氨基酸
长度在 526 aa 到 545 aa 之间变化,平均值在 538 aa
左右,说明编码的鲨烯环氧酶的大小在不同人参属
植物中总体接近;而分子量变化范围在 57 580 到
60 263,对于大分子来说并没有很大的变化,同时结
合 cDNA长度的变化范围来分析,说明鲨烯环氧酶
编码基因在人参属植物中总体变化不大,编码的鲨
烯环氧酶也属于比较保守且稳定的酶类[10]。14 种
鲨烯环氧酶理论等电点平均在 8. 83,正负电荷残基
数相差 9 个单位,表明编码的氨基酸属于比较稳定
的酶类,也与其平均不稳定系数 44. 92 相一致,说明
鲨烯环氧酶是相对保守并在生物的代谢中保持着比
较稳定的生理作用。
表 2 14 种人参属植物鲨烯合酶的 cDNA序列及其编码的氨基酸序列的结构和理化性质
核苷酸登录号 KC524469 KC524471 KJ804171 KC422651 KC953033 KJ946467 KJ946468 KJ946469 AB003516 AB122078 FJ393274 JX625132 DQ457054 DQ386734
基因全长 /bp 1 629 59 738. 3 8. 86 53 62 8 452 0. 65 30 45. 57 93. 04 - 0. 01 1 ATG 1 629 1 629
分子量 1 629 59 738. 3 8. 86 53 62 8 452 0. 65 30 45. 57 93. 04 - 0. 01 1 ATG 1 629 1 629
理论等电点 2 054 59 529 8. 84 49 57 8 429 0. 67 30 42. 3 95. 35 0. 03 104 ATG 1 623 1 623
正电荷残基数 1 642 59 202. 6 8. 89 47 56 8 389 0. 68 30 43. 36 97. 52 0. 04 10 ATG 1 614 1 614
负电荷残基数 1 620 59 202. 6 8. 89 47 56 8 389 0. 68 30 43. 36 97. 52 0. 04 1 ATG 1 614 1 614
总原子数 1 581 57 580. 7 8. 5 50 55 8 144 0. 62 30 42. 98 94. 54 0. 05 1 ATG 1 580 1 581
消光系数 1 635 60 069. 6 9. 08 52 64 8 501 0. 62 30 48. 7 93. 42 - 0. 03 1 ATG 1 634 1 635
半衰期 /h 1 611 59 102. 3 8. 55 49 54 8 363 0. 67 30 45. 39 97. 16 0. 03 1 ATG 1 610 1 611
不稳定系数 1 845 59 374. 7 8. 73 48 55 8 405 0. 67 30 43. 06 97. 16 0. 04 43 ATG 1 662 1 620
脂肪系数 2 005 59 103. 4 8. 81 48 56 8 369 0. 68 30 43. 1 96. 79 0. 03 113 ATG 1 723 1 611
总平均亲水性 1 969 60 208. 9 9. 06 53 65 8 519 0. 62 30 48. 68 93. 53 - 0. 04 428 ATG 859 432
起始位点及密码子 1 638 60 263. 1 9. 13 51 64 8 535 0. 62 30 47. 14 93. 78 - 0. 001 1 ATG 1 637 1 638
终止位点及密码子 1 648 59 130. 5 8. 63 48 54 8 374 0. 68 30 45. 5 98. 25 0. 05 14 ATG 1 627 1 614
开放阅读框全长/bp 1 623 59 139. 5 8. 81 47 55 8 377 0. 68 30 44. 24 97. 52 0. 05 9 ATG 1 622 1 614
·01· 公共卫生与预防医学 2016 年第 27 卷第 3 期 J of Pub Health and Prev Med,Jun. 2016,Vol. 27 No. 3
在 14 个编码基因中,起始密码子都是 ATC,但
是在不同种植物中起始密码子对应的起始位点不
同,这是由于在不同的酶中,对应的开放阅读框长度
不同;开放阅读框的长度变化范围较大,其中开放阅
读框最长的是 JX625132,长度是 1 638 bp,最短的是
FJ393274,长度为 432 bp,但是编码的蛋白质功能并
没有太大的变化,而且正负电荷的残基数变化基本
一致,14种鲨烯环氧酶编码基因的半衰期都是 30 h,
这表明不同人参属植物的鲨烯环氧酶的功能稳定性
和保守性。对人参属植物的 14种鲨烯环氧酶编码基
因两两进行了相似性比对分析后得知,这 14 种鲨烯
环氧酶编码基因的核苷酸平均相似性为 86. 51%,其
中,核苷酸的匹配率为 90. 32%,在 80. 51%的相似性
中有 90. 32%的完全匹配度,说明鲨烯环氧酶的编码
基因在人参属植物中是比较稳定的。
2. 2 鲨烯环氧酶亲水性预测分析 蛋白质二级结
构预测以及功能域的划分可以通过其疏水性和吸水
性来体现。蛋白质登陆号为 ABE60738 的鲨烯环氧
酶,位于第 50 位的氨基酸具有最低的亲水性分值 -
3. 5,表明其亲水性最强;在其紧邻的 49 位的氨基酸
具有最高的亲水性分值 3,表明其疏水性最强。对
其亲水性和疏水性分析得知,登陆号为 ABE60738
蛋白质的亲水性和疏水性并不均匀分布,这主要对
蛋白质在细胞内分布有一定的影响。与登陆号为
ABE60738 的蛋白质具有类似特性的蛋白质还有
ABE73759、ACJ24907、AFV92748、AGI19257 等几个
蛋白质。这几个蛋白质的亲水性基团和疏水性基团
在蛋白上的分布并不均匀,大多集中在蛋白的一个
端点处,这对该蛋白的整体平衡系数会产生影响。
其中,蛋白质登陆号为 AGK62446 的鲨烯环氧酶的
亲水性基团位于蛋白的氮端(N 端),亲水性最大值
的 - 4. 0;亲水性数值最小的基团位于蛋白的碳端
(C端),亲水性数值为 4. 5,是疏水性最强的作用位
点。其亲水性基团和疏水性基团在蛋白质上的分布
比较均匀,对于蛋白质整体的稳定性、蛋白在细胞内
的分布、蛋白质在该植物细胞内进行稳定的催化作用
都比较有利。其他几个与其具有相似的特性的蛋白
序列为:AGK62448、AGS79227、AIK21785、AIK23028。
2. 3 鲨烯环氧酶跨膜结构域预测分析 对实验所采
集的人参属植物的 14种鲨烯环氧酶的编码的氨基酸
序列进行了跨膜结构域的分析(表 3)。对数据进行
分析可知,14 种鲨烯环氧酶的 α 螺旋所占比例大概
在 64%左右,拓展链结构的比例大概是 7%左右,无
规则卷曲的比例大概在 28%左右,相对比较平均。
表 3 跨膜结构域的分析结果
蛋白质登录号
α螺旋
比例 /%
扩展链结构
比例 /%
无规则卷曲
比例 /%
ABE60738 63. 86 6. 88 26. 54
ABE73759 61. 86 7. 55 27. 56
ACJ24907 69. 89 8. 44 25. 68
AFV92748 64. 54 5. 66 25. 66
AGI19257 63. 36 7. 54 27. 45
AGK62446 67. 57 8. 65 29. 56
AGK62448 65. 47 4. 56 28. 54
AGS79227 68. 47 7. 54 27. 48
AIK21785 62. 54 5. 67 26. 52
AIK23028 66. 35 7. 86 25. 66
AIK23029 67. 35 6. 54 28. 54
AIK23030 68. 52 5. 43 29. 45
BAA24448 62. 55 5. 76 25. 63
BAD15330 66. 34 6. 52 27. 54
2. 4 鲨烯环氧酶系统进化树分析 对人参属植物
的 14 种鲨烯环氧酶系统进化树进行分析(图 1),树
图中分支点表示在该处物种可能发生了分化,分支
之后的短横线长短表示物种之间的进化距离,分支
处的数值为置信度,即根据提交分析的材料来判断
得到后面进化分析的可靠程度,树图中的数值基本
在 70 左右,因而提交的序列分析得到的树图结果比
较可靠。从树图中可以看出,这 14 种鲨烯环氧酶在
分化过程中可能有 3 个分支。除 KJ946467 之外,其
他 13 种鲨烯环氧酶主要分化成 2 个分支,其中
DQ457054、KC953033、DQ386734、KC422651 4 种亲
缘关系比较接近,4 者之间的遗传距离较短。在第 2
大分支中,KJ804171 虽与 DQ457054、KC953033、
DQ386734、 KC422651、 AB003516、 AB122078、
KJ946469 同属一个分支,但又独为一支,所以在亲
缘关系上,KJ804171 与上述七种鲨烯环氧酶的亲缘
关系较远。在第 3 大分支中,主要有 JX625132 、
KJ946468 、FJ393274 、KC524469 、KC524471 这 5
种,其中 KC524469 、KC524471 亲缘关系较接近。
图 1 人参属植物 14 种鲨烯环氧酶系统进化分析
·11·公共卫生与预防医学 2016 年第 27 卷第 3 期 J of Pub Health and Prev Med,Jun. 2016,Vol. 27 No. 3
3 讨 论
人参属植物三萜皂苷合成路径的骨干通路已经
比较明确,但是具体的合成分支尚不明晰,有待进一
步研究。实验对人参属植物的 14 种鲨烯环氧酶的
编码基因及其编码的氨基酸序列的理化性质和对应
的鲨烯环氧酶的亲水性、跨膜结构域进行了全面的
生物信息分析,发现鲨烯环氧酶的编码基因在不同
物种之间相对保守,虽然三萜皂苷结构复杂,但由此
可以大胆推断其上游合成途径中的关键基因在进化
中趋于保守和稳定。因此对理解三萜皂苷的生物合
成路径中的关键基因的进化历史和种间变异关系有
积极的指导意义[11-13]。人参属植物中,珠子参与人
参、三七、西洋参等药用植物的亲缘关系极其相近,
它也是竹节参的变种。关于竹节参和珠子参的转录
组信息至今尚未公布,因此发掘竹节参和珠子参的
SNP显得尤为重要[14],不仅能获得大量的 SNP 位
点,还能得到亲缘关系较近的物种之间的差异,包括
突变所造成的功能及代谢通路的差异等,也为后续
三萜皂苷有关基因的种间变异提供了有利的研究基
础。对物种之间鲨烯环氧酶的生物信息学分析可以
为鲨烯环氧酶克隆及高通量测序提供有利资料,进
而对鲨烯环氧酶与三萜皂苷的产量之间具体关系作
进一步的研究与探索。近年来,生物信息学在病理
方面也有新的研究进展。国内各省份艾滋病感染趋
势不断爬升,感染人群范围也慢慢扩大[15-17],而患
者只能靠药物维持,并没有完全治愈的方法。治疗
艾滋病是全球性问题,现已进行多个艾滋病全基因
组关联分析(GWAS)并发掘了许多和艾滋病有关的
疾病易感位点[18-19],同时也发现大量的 SNP 位点,
这对 HIV的治疗进展提供了新的思路。随着中药
的分子层面研究,中医药也逐渐被利用在艾滋病的
治疗中,尤其是五环三萜皂苷在治疗艾滋病的研究
中取得了很大的发展,近年来研究发现,五环三萜皂
苷是一种能与市面上有效抗 HIV 主导药物想媲美
的药物[20],其潜力巨大,将三萜皂苷应用在临床医
学上,生物信息学为辅,两者相结合为今后艾滋病的
治疗奠定基础。
参考文献
[1] 牛云云,朱孝轩,罗红梅,等.三萜皂苷合成生物学元件的初
步开发及鲨烯环氧酶编码基因克隆及表达模式分析[J]. 药
学学报,2013,48(2):211-218.
[2] 白玫,胡生福,刘婧,等.中药续断的研究进展[J].中外医疗,
2014,(22) :197-198.
[3] 黄壮嘉,刘迪秋,葛锋,等.植物三萜皂苷合成中关键后修饰
酶研究进展[J].西北植物学报,2014,34(10):2137-2144.
[4] 邢朝斌,王一曼,陈正恒,等. 三萜皂苷的生物合成[J]. 生命
的化学,2005,25(5):420-422.
[5] GEPSTEIN S, SABEHI G, CARP MJ, et al. Large-
scaleidentification of leaf senescence-associated genes[J]. Plant
J,2003,36(5) :629-642.
[6] BAXEVANIS AD,OUELLETTE BF. S.生物信息学:基因和蛋
白质分析的实用指南[M]. 北京:清华大学出版社,2000,
231-159.
[7] IKEDA M, ARAL M, LAO DM, et al. Transmembrane
topologyprediction methods:A reassessment and improvement by
aconsensus method using a dataset of experimentally-
characterizedtransmembrane topologies[J]. In Silico Biology,
2002,2(1):19-33.
[8] THOMPSON JD,GIBSON TJ,PLEWNIAK F, et al. The
CLUSTAL-Xwindows interface:flexible strategies for multiple
sequencealignment aided by quality analysis tools[J]. Nucleic
Acids Research,1997,25(24) :4876-4882.
[9] TAMURA K,DUDLEY J,NEI M,et al. S. MEGA4:Molecular
Evolutionary Genetics Analysis (MEGA)Software Version 4. 0.
Mol Biol Evol,2007,24(8) :1596-1599.
[10] 张召宝,侯林,崔清华,等. 中药三萜皂苷合成通路的生物信
息学分析[J].中成药,2015,37(6):1255-1261.
[11] 许晓双,张福生,秦雪梅.三萜皂苷生物合成途径及关键酶的
研究进展[J]. 世界科学技术-中医药现代化,2014,(11) :
2440-2448.
[12] 吴琼,孙超,陈士林.西洋参 β -香树脂合成酶基因的克隆和
生物信息学分析[J].中草药,2013,44(11):1476-1480.
[13] 郑夏生,罗秀秀,徐晖,等. 岗梅转录组及其乌索烷型三萜皂
苷生物合成相关酶基因的发掘[J].世界科学技术-中医药现
代化,2014(7):1505-1512.
[14] AHMAD RIAZ,PARFITT DAN E,FASS JOSEPH,et al. Whole
genome sequencing of peach (Prunus persica L.)for SNP
identification and selection[J]. BMC Genomics,2011(1) :1471
- 2164.
[15] 李丽娜,彭国平,戴涌,等.湖北省 2011—2013 年艾滋病 VCT
结果分析[J].公共卫生与预防医学,2015,26(3):33-35.
[16] 肖波,俸卫东,刘固国,等.柳州市 2010—2013 年艾滋病疫情
分析[J].公共卫生与预防医学,2015,26(1):91.
[17] 李晓霞,刘锦花,王开亮,等.截止 2014 年底深圳市龙岗区现
存活艾滋病病例流行特征分析[J]. 公共卫生与预防医学,
2015,26(6):94-86.
[18] FELLAY J,SHIANNA KV,GE D,et al. A whole-genome
association study of major determinants for host control of HIV-1
[J]. Science,2007,317(5840) :944-947.
[19] DALMASSO C,CARPENTIER W,MEYER L,et al. Distinct
genetic loci control plasma HIV-RNA and cellular HIV-DNA
levels in HIV-1 infection:the ANRS Genome Wide Association
01 study[J]. PLoS One,2008,3(12) :e3907.
[20] 程晓华,熊玉卿.五环三萜皂苷的药理作用研究进展[J]. 中
草药,2007,38(5):792-795.
(收稿日期:2016-03-24)
(本文编辑:吴海平)
·21· 公共卫生与预防医学 2016 年第 27 卷第 3 期 J of Pub Health and Prev Med,Jun. 2016,Vol. 27 No. 3