全 文 :研究报告
生物技术通报
BIOTECHNOLOGY BULLETIN 2009年第 5期
葡萄乙醇脱氢酶基因的电子
克隆及生物信息学分析
武雪 黄晓丽 王喆之
(陕西师范大学生命科学学院药用植物资源与天然药物化学教育部重点实验室,西安 710062)
摘 要: 利用电子克隆方法获得葡萄乙醇脱氢酶基因 (ADH ),并采用生物信息学方法对该基因编码蛋白从氨基酸
组成、理化性质、跨膜结构域、疏水性 /亲水性、亚细胞定位、高级结构以及功能域等方面进行了预测和分析。结果表明, 葡萄
ADH 基因全长 1 602 bp,包含 1 140 bp的 ORF,编码 379个氨基酸,该蛋白不具有明显的疏水区域,也无跨膜结构域, 螺旋
和不规则卷曲是其二级结构的主要构件。葡萄 ADH包含有 ADH 功能域, 和其他植物的 ADH在序列组成、高级结构及活
性位点等方面均具有高度的相似性。
关键词: 乙醇脱氢酶 电子克隆 生物信息学
Electronic Cloning and Characterizations ofADH Gene from Vitis
vinifera Using Bioinformatics Tools
W uXue Huang X iao li W ang Zhezhi
(K ey Laboratory of M inistry of Education forM edicinalP lant Resources and NaturalPharmaceutical
Chem istry, Co llege of Life Sciences, Shanx iN ormal University, X ian 710062)
Abstrac:t An alcoho l dehydrogenase ( ADH ) gene from V itis vinifera w as c loned by e lectronic cloning based on the EST se
quences from Unigene of NCBI Som e characters of theADH that can encode am ino ac id were ana ly zed and pred icted by the too ls of
b io info rm atics in the fo llow ing aspec ts, including the composition o f am ino acid sequences, hydrophobic ity o r hydrophilic ity, secondary
and tertia ry struc ture of prote in and functionResu lts show ed that the fu llleng th of ADH from Vv inifera w as 1 602 bp long and it
conta ined a com plete ORF wh ich encoded 379 am ino acid The encoded pro tein had no t obv ious hydrophob ic ity reg ion and transm em
brane structurew as not conta ined Them a in m o tif o f pred icted secondary structu re o f ADH w ere a lpha helix and random co il The
sequence, advanced structure and ac tiv ity sites o f ADH that conta ined an ADH doma in w ere high ly conserved com pa red w ith other
p lant ADH
Key words: A lcohol dehydrogenas ( ADH ) E lectronic c lone B io in fo rm atics
收稿日期: 20081106
作者简介:武雪 ( 1983) ,女,硕士研究生,研究方向:植物生物技术
通讯作者:王喆之, Te:l ( 029) 85310260, Em ai:l zzw ang@ snnu edu cn
乙醇脱氢酶 (A lcoho l dehydrogenas, ADH )是中长
链乳酸脱氢 /还原酶 ( mediumcha in dehydrogenase / re
ductase)超家族的成员。是参与乙醇代谢的重要
酶 [ 1, 2]。ADH人类 ADH主要分为 5大类, 其中类
是原始祖先,其余的 ADH ( ADH、、、、 ), 包括
植物 P类 ADH,都是由 ADH演化而来 [ 3~ 13 ]。以往
对植物 ADH的研究多集中在缺氧条件下该基因的表
达和酶活等方面 [ 14, 15] ,也有证据表明许多植物如马
铃薯 ( Solanum tuberosum )、水稻 (Oryza sativa )、棉花
(G ossyp ium hirsu tum )等,在脱水、低温或化学处理下
均可诱导 ADH基因的表达 [ 16~ 18]。可见, ADH在植
物应答胁迫诱导时具有重要作用。葡萄 ADH由一个
小的多基因家族编码 [ 19, 20] ,相关研究已经克隆了葡
萄中 3个 ADH 基因 ( VvAdh1, VvAdh2和 VvAdh3), 并
阐述了其在果实发育过程中的重要作用及其作用机
理 [ 21]。本研究以 NCBI数据库为基础,电子克隆得到
生物技术通报 B iotechnology Bulletin 2009年第 5期
葡萄中编码 ADH的 cDNA序列,利用生物信息学方
法对其推导的氨基酸序列从氨基酸组成、理化性质、
疏水性、亚细胞定位及结构功能等方面进行预测和分
析,为植物 ADH 基因的进一步深入研究奠定基础。
1 材料与方法
数据资料来源于 NCBI核酸及蛋白质数据库中已注
册的乙醇脱氢酶的核酸序列及其对应的氨基酸序列。
葡萄 (Vitis vinif era)EST序列来自于 NCB I的 UniGene数
据库, 其序列号为 CB001624、CB001889、CD712737、
CF404612、DT027241、EC939006、EC940780、EE071362、
EE081249。利用 CAP3程序 ( http: / /b iowebpasteurfr/
seqana l/ interfaces/cap3htm l)对 EST序列进行拼接。依
据该序列采用 Prmi er Prem ier 50设计了 RTPCR扩增引
物, ADHS: 5TCCAATCTCTATCATTCTTCTTCTG3和
ADHA: 5ACAGGGTCTGCTTATTATGGC3。
葡萄材料采自陕西师范大学校园。总 RNA提
取试剂盒 ( BIOZOL )购自于 B ioFlux公司; R evertA id
F irst Strand cDNA Synthesis试剂盒购自 Fermentas公
司,葡萄总 RNA提取和第一链 cDNA合成严格按照
试剂盒说明书完成。PCR反应程序: 95 预变性 5
m in; 95 变性 30 s, 52 退火 30 s, 72 延伸 80 s, 30
个循环; 72 延伸 10 m in。扩增片段经凝胶回收
(试剂盒购自安徽优晶生物工程有限公司 )插入 T
载体 (购自 Prom ega公司 )后转入大肠杆菌 DH5后
送上海捷瑞生物公司测序。
依据 DNA star软件及网站 ( http: / /www. ncb.i nlm.
nih. gov /、http: / /www. eb.i ac. uk /、http: / /www. cbs.
dtu. dk /、http: / /cn. expasy. org /等 )提供的各类生物信
息学软件进行在线分析。核酸及氨基酸序列的组成成
分分析、理化性质分析、开放阅读框 ( open reading
frame, ORF)的查找和翻译利用 DNAstar软件及 Prot
Param、pI /Mw、ORF Finder在线工具进行;核酸及氨基
酸序列的同源性比对和多序列比对利用 Blast和 Clust
alW在线工具完成;蛋白质跨膜结构域及亲水性 /疏水
性的分析利用在线工具 TMHMM和 ProtSca le完成;蛋
白质二级及三级结构的预测利用 SOPMA和 SW ISS
MODEL在线工具完成, 三维视图利用 MoMl o l 2k2软
件完成。
2 结果与讨论
21 葡萄 ADH 基因 cDNA序列的电子克隆及 RT
PCR验证
采用 Letondal[ 22 ]的方法, 电子克隆出一条长 1
602 bp的葡萄 ADH 基因序列, 该序列包含一个 1
140 bp的 ORF,编码 379个氨基酸 (图 1),序列符合
典型的 Kozak序列规则 (将起始密码子 ATG的 A记
为 + 1, + 4位核苷酸为 G, 1位核苷酸为 A ), 此外
在 3UTR区有典型的 polyA尾, 由此可判定该序列
符合一个真核基因全长 cDNA的基本特征 [ 23 ]。
提取葡萄总 RNA经 RTPCR反应扩增出一特
异性条带 (图 2)。经测序验证该片段 1 216 bp包含
该基因完整 ORF框, 与拼接序列吻合。
图 1 葡萄 ADH 基因及其推导氨基酸序列
M. DL2000; 1、2扩增出的葡萄 ADH cDNA条带
图 2 葡萄 ADH cDNA的 RTPCR扩增
72
2009年第 5期 武雪等:葡萄乙醇脱氢酶基因 的电子克隆及生物信息学分析
22 葡萄 ADH核酸及氨基酸序列相似性比对分析
* 、 : 、 分别表示完全相同、保守和半保守 3种情况
图 3 葡萄 ADH与其他几种植物多序列比对结果
用 B lastn程序对葡萄与其他植物ADH 的核酸序
列进行比对,结果表明葡萄 ADH 的核酸序列与马铃薯
(Stuberosum, DQ268847),拟南芥 (Athaliana, AK226412)
的相似性较高,分别为 82%、81%。利用 B lastp程序对氨
基酸序列进行比对, 葡萄 ADH与水稻 (Osativa,
AAB19117)、拟南芥 (Athaliana, CAA57973)、马铃薯
(Stuberosum, ABB72806)的同源性分别为 91%、91%、
90%。另外,用本文电子克隆的 cDNA序列与 Tesn ire
等 [ 21]克隆的 VvAdh1, VvAdh2和 VvAdh3分别比对发现它
们的相似度很低,说明 VvAdh1, VvAdh2和 VvAdh3不属于
类ADH基因。
将葡萄 ADH与其他几种植物 ADH氨基酸
序列利用 C lustalW进行多序列比对分析,结果表明
(图 3 )植物 ADH 是高度保守的, 与文献报道
相符 [ 12]。
23 葡萄 ADH氨基酸序列的组成成分及理化性
质分析
用 DNAStar软件及 ExPA sy在线工具对葡萄
ADH氨基酸序列的组分及理化性质进行分析。
结果显示 (表 1 ), 葡萄与拟南芥、水稻和马铃薯
ADH在序列长度、等电点、各类氨基酸所占的比
例等都基本一致, 而且均属于稳定类蛋白质。说明
植物中 ADH在初级结构上的相似性是很高的, 与
多序列比对的结果相一致。
表 1 不同植物 ADH 基因对应氨基酸序列的组成成分及理化性质分析
注册号 氨基酸残基数
分子量 /
( kD)
理论等
电点 ( pI)
碱性 /酸性氨
基酸比例 (% )
极性氨基酸
比例 (% )
疏水性氨基
酸比例 (% )
蛋白不稳
定性指数
葡萄 379 405 648 950 /1055 2296 3747 3076稳定蛋白
水稻
AAB19117 381 4083 703 997 /1024 2493 3622 2499稳定蛋白
拟南芥
CAA57973 379 4068 678 1029 /1082 2480 3536 2320稳定蛋白
马铃薯
ABB72806 379 4072 659 1003 /1082 2269 3720 2579稳定蛋白
24 葡萄 ADH氨基酸序列的亲水性 /疏水性及
跨膜结构域的预测和分析
氨基酸是蛋白质的构件分子, 其亲 /疏水性在形
成和保持蛋白质的三级结构上起作用。通过了解肽
链中不同肽段的疏水性,还可以对蛋白的跨膜结构域
进行预测。因此,疏水性 /亲水性的预测和分析,可以
为蛋白质次级结构的预测及功能分析提供理论参考。
采用 ProtScale程序对葡萄 ADH亲水性 /疏水性分
析,结果表明 (图 4)第 251位赖氨酸 ( Lys)亲水性最
强 (分值为2456), 第 201位酪氨酸 ( Tyr)疏水性最
强 (分值为 2200), 总体来看,氨基酸分值分布比较
均匀,氨基酸序列没有明显的疏水性或亲水性区域。
73
生物技术通报 B iotechnology Bulletin 2009年第 5期
跨膜结构域是膜内在蛋白与膜脂相结合的主要
部位,一般由 20个左右的疏水氨基酸组成,形成 螺
旋,它固着于细胞膜上起 锚定作用 [ 24]。跨膜结构域
的预测和分析,对正确认识蛋白质的功能有着重要的
指示意义。用 TMHMM 20 Server对葡萄 ADH氨基
酸序列的跨膜结构域进行预测,结果表明葡萄 ADH
整条肽链基本都位于膜外,不存在跨膜结构域,与其不
存在明显的疏水区域这一预测结果相一致。
图 4 葡萄 ADH氨基酸序列的疏水性 /亲水性预测
25 葡萄 ADH 基因编码蛋白亚细胞定位的预测
和分析
蛋白质在细胞中的定位与蛋白执行的功能密切
相关。采用 PSROT程序对葡萄 ADH 基因编码产
物进行定位,结果显示 (表 2)葡萄 ADH 基因编码
产物可能定位于叶绿体类囊体膜上。
表 2 葡萄 ADH亚细胞定位预测结果
叶绿体类囊体膜 细胞质膜 线粒体内膜 叶绿体基质
可信度 0510 0440 0423 0341
结论 叶绿体类囊体膜蛋白
26 葡萄 ADH二级及三级结构的预测与分析
蛋白质的生物学功能是蛋白质分子的天然构象
所具有的性质。蛋白质的高级结构由氨基酸排列顺
序所决定。氨基酸多肽链借助氢键排列成沿一维方
向有规则的重复构象的二级结构, 它是氨基酸顺序与
三维构象之间的桥梁。二级结构借助范德华力、氢
键、静电和疏水等相互作用形成蛋白的三级结构,从
而发挥正常的生物学功能 [ 25]。因此,蛋白质高级结
构的预测和分析,对理解蛋白质结构与功能之间的相
关性有着极其重要的意义。利用 SOPMA程序对葡萄
ADH氨基酸序列的二级结构进行预测, 结果表明,
葡萄 ADH由 248%的 螺旋、2559%的延伸链、
4037%的不规则卷曲和 923%的 转角组成。
采用 SW ISSMODEL在线同源建模方法对葡萄
ADH进行分析, 并利用 MoMl ol 2k2软件视图, 结
果 (图 5)显示,葡萄 ADH单体主要由 15个螺旋、
16个大小不同的折叠和一些转角构成。与拟南芥、
马铃薯、水稻等植物 ADH三维结构基本类似。
图 5 基于同源性建模获得的葡萄 ADH三维结构模型
27 葡萄 ADH功能域的预测和分析
蛋白酶由多个模体组成, 组成这些模体的氨基
酸区段行使特异的功能。利用 B lastConserved Do
mains Search分析葡萄 ADH功能域。结果 (图 6)
显示, 34 ~ 117位是该酶的 ADH _N结构域, 含有
G roESlike结构,是酶促反应的结合位点。在 195 ~
337位有一个 Zn结合的脱氢酶位点。8~ 377位是
Zn依赖的乙醇脱氢酶 功能域, 参与能量产生和转
换。利用 pfam网站对葡萄 ADH基序 ( motif)进行
搜索,同样发现上述 3个基序。
图 6 葡萄 ADH氨基酸序列功能结构域分析
74
2009年第 5期 武雪等:葡萄乙醇脱氢酶基因 的电子克隆及生物信息学分析
采用 CAP3程序将葡萄 EST序列进行拼接得到
葡萄 ADH 基因全长, 并利用生物信息学的方法对
其编码氨基酸序列从结构组成、基本理化性质、疏水
性 /亲水性、亚细胞定位、蛋白质高级结构以及功能域
等方面进行了预测和分析, 结果显示:葡萄 ADH 基
因全长 1 602 bp,包含 1 140 bp的开放读码框,编码
379个氨基酸,与拟南芥等植物的分析结果相似。葡
萄 ADH与其他植物无论是在核酸水平还是在氨基
酸水平上都有很高的同源性,与多序列比对的结果相
一致,说明植物ADH 基因在进化过程中是高度保守
的,可能与其重要功能相关。葡萄 ADH蛋白整体没
有明显的亲水或疏水性区域,也无跨膜结构域,可能
定位在叶绿体类囊体膜上, 在肝细胞中 ADH在细胞
质中参与醇脱氢酶途径分解乙醇 [ 26] , ADH在植物和
动物细胞中的定位可能是不同的,而且生物信息学的
分析也需要具体的实验数据来支持。功能位点分析
显示,葡萄 ADH具有 ADH功能域, 与其他植物在
功能活性位点上是一致的。葡萄 ADH在高级结构
上与其他植物表现出一致性。
参 考 文 献
1 Sm ith M, H opkinson DA, H arris H Ann H um Genet, 1973, 37
( 1) : 49~ 67
2 Persson B, Z igler JS Jr, JrnvallH E ur J B iochem, 1994, 226
( 1 ) : 15~ 22
3 Edenb erg H J Prog Nucleic A cid Res M ol B io,l 2000, 64: 295
~ 341
4 Kaiser R, H olm qu ist B, H empel J, et alB iochem istry, 1988, 27
( 4) : 1132~ 40
5 K aiser R, H olm qu ist B, V allee BL, Jornvall HB ioch em istry, 1989,
28( 21) : 8432~ 8
6 Dan ielsson O, Jorn vallHProc Natl Acad SciUSA, 1992, 89 ( 19 ) :
9247~ 51
7 Dan ielsson O, Ek lund H, Jornvall HB iochem istry, 1992, 31 ( 15 ) :
3751~ 9
8 Gu the ilWG, H o lmqu ist B, Va llee BLB iochem istry, 1992, 31 ( 2 ):
475~ 81
9 Rosario FernndezM, JornvallH, Moren oA, et alFEBS Lett, 1993,
328( 3 ): 235~ 8
10 Luque T, Atrian S, Dan ielsson O, et alEur J B iochem, 1994, 225
( 3) : 985~ 93
11 Martn ezMC, A chkorH, Persson B, et alEu r J B ioch em, 1996, 241
( 3) : 849~ 57
12 Sh afqat J, E lAhm ad M, Dan ielsson O, et a lP roc Natl Acad S ci
U SA, 1996, 93 ( 11) : 5595~ 9
13 Do lferus R, Osterm an JC, Peacock W J, Denn is ES Genetics,
1997, 146( 3 ) : 1131~ 41
14 K adow ak iH I, M atsuokaM, Mu raiN, H arada K Plant S c,i 1988,
54: 29~ 36
15 M illar AA, Ol iveMR, Denn is ES B iochem G enet, 1994, 32 ( 7
8) : 279~ 300
16 Matton DP, Con stabel P, B risson N P lan t Mo l B io,l 1990, 14
( 5) : 775~ 83
17 Christ ie PJ, H ahnM, Walb ot V Plan tPhysio,l 1991, 95( 3) : 699
~ 706
18 M illarAA, Denn is ES PlantM ol B io,l 1996, 31( 4) : 897~ 904
19 Sarn iM anch ado P, Verris C, Tesn ire C P lan t S c,i 1997, 125:
177~ 87
20 VerrisC, Bs C, ThisP, Tesn ire C Genom e, 2000, 43( 2) : 366
~ 6
21 Tesn ire C, Verris C P lant S c,i 2000, 157: 77~ 8
22 Letondal CA W eb In terface Generator for M olecu lar B iolgy Pro
gram s in Un ix B ioin form atics, 2001, 17: 73~ 2
23 李桂源, 钱骏,基于 WWW的生物信息学应用指南 长沙:中南
大学出版社, 2004, 143~ 146
24 翟中和,王喜忠,丁明孝,细胞生物学 北京:高等教育出版社,
2000, 79~ 240
25 王镜岩,朱圣庚,徐长发,生物化学 (上册 ) (第 3版 ) 北京:高
等教育出版社, 2002, 157~ 181
26 杨波, 王萍 河南医学研究, 1998, 7 ( 1) : 78~ 83
75