全 文 :·研究报告·
生物技术通报
B IO TECHNOLOGY BULL ETIN 2009年第 11期
番茄 L eAB I3基因的生物信息学分析
范晶 黄明远 李仲芳 梁梓 伏秦超 雷常安
(乐山师范学院化学与生命科学学院 ,乐山 614004)
摘 要 : 对所克隆到的番茄 LeAB I3基因测序结果进行序列分析 ,发现得到 LeAB I3基因的 2种转录本。应用生物信息学
的方法和工具对 LeAB I3蛋白质的理化性质、跨膜区域、疏水性 /亲水性、二级结构、结构功能域和同源树进行分析 ,结果表明
此蛋白是包含一个保守 B3结构功能域的亲水性不稳定蛋白 ,相对分子量为 65. 4 kD,等电点为 6. 54,可能存在 2个跨膜区域。
蛋白质二级结构中的主要构成元件是α2螺旋和不规则卷曲 ,蛋白质同源分析发现番茄 LeAB I3和马铃薯 vp12AB I3 类蛋白相
似度最高 ,同源性为 89%。
关键词 : 番茄 L eAB I3基因 生物信息学
Bioinformatics Analysis of L eAB I3 Gene in Tomato
Fan J ing Huang M ingyuan L i Zhongfang L iang Zi Fu Q inchao Lei Changan
( College of Chem istry and L ife Science, Leshan N orm al University, Leshan 614004)
Abs trac t: Two kinds of L eAB I3 gene transcrip ts were found after tomato L eAB I3 cDNA sequence was analyzed. The physical and
chem ical p roperties, transmembrane region, hydrophobicity/hydrophilicity, secondary structure, functional domain and homology tree of
LeAB I3 p rotein were analyzed by using bioinformatics methods. Results showed that the calculated molecular mass was 65. 4 kD, and
theoretical isoelectric point was 6. 54. There may be two transmembrane regions, and the main components in the p rotein secondary
structure were α2helix and Random coil. Protein homology analysis showed that tomato LeAB I3 and potato vp12AB I3 like p rotein
have the highest homology with the sequence identity of 89%.
Key wo rds: Tomato LeAB I3 gene B ioinformatics
收稿日期 : 2009206229
基金项目 :四川省教育厅基金 (08zb051) ,乐山师范学院科研启动项目 ( Z0858) ,峨眉山生物多样性保护与利用研究所科研项目 (08S04)
作者简介 :范晶 (19772) ,男 ,讲师 ,博士 ,研究方向 :植物分子生物学 ; E2mail: fanjing972001@ sohu. com 脱落酸 ( abscisic acid, ABA )在种子的成熟和休眠以及应对外界环境胁迫的过程中起重要的作用 ,ABA诱导胚细胞成熟的过程需要好几种 ABA感应蛋白 ,其中包括同源蛋白 AB I3 ( abscisic acid - insen2sitive 3)和 VP1 (V iviparous 1 ) ,该类基因发生突变时 ,种子的成熟过程将受到阻碍 ,成熟种子的胚胎不能进入休眠阶段而是进入一个类似种子发芽的发育阶段 [ 1, 2 ]。此外该类基因还可以参与质体的分化过程和激活其它基因的表达 [ 3, 4 ]。目前 ,研究者已对番茄 L eAB I3基因的时空转录谱进行了相关研究 [ 5 ] ,但对于番茄 L eAB I3基因的生物学功能研究还未见报道。本研究在对所克隆到的番茄 L eAB I3基因 cDNA测序结果进行分析的基础上分析了番茄 L eAB I3基 因的转录本结构 ,并应用生物信息学的方法和工具对 L eAB I3基因编码蛋白的理化性质、跨膜区域、疏水性 /亲水性、二级结构、结构功能域和同源树进行分析和预测 ,为进一步研究该基因的功能提供理论参考。1 材料与方法1. 1 材料联有 Internet的 PC机 (装有 W indows XP操作系统 )。分析用的 LeAB I3基因的 cDNA序列是从番茄品种 AC+种子中克隆的 LeAB I3基因测序结果 ,氨基酸序列采用生物分析软件 sequencher翻译而来。其它物种的核酸及蛋白质序列数据来源于 NCB I中已注册的核酸序列及对应的氨基酸序列。玉米 VP1序列 :M60214和 AAA33506. 1,小麦 VP1序列 : AB047554、
© 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2009年第 11期 范晶等 :番茄 L eAB I3基因的生物信息学分析
BAB40614. 1,大麦 VP1序列 :AJ431703、CAD24413. 1,水
稻 VP1 序列 : D16640、BAA04066. 1,马铃薯 VP12
AB I32like 序列 : AJ309218、CAC84597. 2, 拟南芥
AB I3序列 : X68141、CAA48241. 1。
1. 2 方法
L eAB I3基因编码蛋白的理化性质采用 Prot2
param预测 ;跨膜区域使用 TMPRED进行预测 ;疏水
性 /亲水性采用 ProtScale进行预测 ;二级结构采用
SOPMA进行分析 ;结构功能域采用 SMART预测 ;多
序列比对及同源性分析采用 PC 机本地安装的
DNAMAN软件进行 ,各分析软件的网站见表 1。
表 1 生物信息学研究的数据库和软件网址
软件 网 址
p rotparam http: / / au. expasy. org/ tools/p rotparam. htm l
TMPRED
http: / /www. ch. embnet. org/ software /TMPRED _
form. htm l
ProtScale http: / /www. expasy. org/cgi2bin /p rotscale. p l
SOPMA
http: / /np sa2pbil. ibcp. fr/ cgi2bin /np sa _ automat. p l?
page = /NPSA /np sa_sopma. htm l
SMART http: / / smart. embl2heidelberg. de /
2 结果和分析
2. 1 L eAB I3基因转录本结构
对所克隆到的番茄 L eAB I3基因 cDNA 测序结
果进行分析 ,发现该基因包含 2种转录本结构 ,命名
为转录本 1和转录本 2,两者编码区序列均比 Gen2
Bank中注册的该基因编码区序列多出 30 bp (图
12B , 12C, 12D )。
转录本 1含一个 1 740 bp的开放阅读框 ,可编
码 579个氨基酸 ,同时转录本 2在编码区内的另一
位置因剪接而缺失了 122 bp的核苷酸序列 (图 12C,
12E) ,导致开放阅读框被改变。
2. 2 L eAB I3基因编码蛋白的理化性质
应用 Protparam软件预测 L eAB I3基因编码蛋白
的理化性质 ,推测该蛋白的分子式为 C2850 H4453 N815
O893 S31 ,相对分子量为 65. 4 kD,等电点为 6. 54,不
稳定参数 49. 60,根据不稳定参数数值在 40以下才
是稳定蛋白的标准 [ 6 ] ,可推定 LeAB I3为不稳定蛋
白 ,其氨基酸残基的组成相对含量较多的氨基酸有
A la、A rg、A sn、A sp等 ,相对含量较少的氨基酸有 Cys
和 H is,带负电荷的残基 (A sp + Glu)总数为 67个 ,
带正电荷的残基 (A rg +Lys)总数为 65个 ,亲水性平
均系数为 0. 672,预测该蛋白为亲水性蛋白。
2. 3 L eAB I3基因跨膜区域分析
采用 TMPRED对 LeAB I3跨膜区域进行预测 ,
参数均为默认值 ,预测结果表明该基因最有可能存
在 2个跨膜区域 ,其 N端和 C端均在膜内 ,膜外的
氨基酸序列共有 139个氨基酸 ,占 24%。第一个跨
膜区位于第 225~247氨基酸位置 ,跨膜区长度为
23个氨基酸 ,方向由内向外 ;第二个跨膜区位于第
387~405氨基酸位置处 ,跨膜区长度为 19个氨基
酸 ,方向由外向内。
2. 4 疏水性 /亲水性预测和分析
疏水性和亲水性分析对于预测蛋白质的二级结
构和功能域具有重要的生物学意义 ,采用 ProtScale
软件进行疏水性 /亲水性预测。结果表明多肽链氨
基酸最低分值为 - 3. 378,最高为 1. 922,依据氨基
酸分值越低亲水性越强的规律 ,可推测 LeAB I3属
于亲水性蛋白 ,从整体来看 ,亲水性氨基酸均匀分布
在整个肽链中且多于疏水性氨基酸 (图 2)。
2. 5 二级结构预测与分析
二级结构主要指多肽链依赖氢键排列成在一维
方向上具有周期性结构的构象 ,对其进行预测与分
析有助于认识蛋白的空间结构。采用 SOPMA预测
番茄 LeAB I3蛋白的二级结构 ,结果表明番茄 LeA2
B I3蛋白由 23. 14%α2螺旋 (A lpha helix) , 13. 64%
延伸链 ( Extended strand ) , 4. 84%β2转角 ( Beta
turn) , 58. 38%无规则卷曲 (Random coil)所组成 ,α2
螺旋和无规则卷曲是主要的构成元件 ,β2转角和延
伸链则散布于整个蛋白质中 (图 3)。
2. 6 结构功能域的预测
结构功能域是蛋白质亚基结构中介于二级与三
级结构之间的一种独立结构和功能单位 ,用 SMART
预测番茄 LeAB I3的结构功能域。由图 4可看出 ,
LeAB I3氨基酸 444~547区域含有一个 B3结构域 ,
B3结构域是来源于高等植物 AB I3 /VP1转录因子
中特有的一个高度保守的碱性结构域 ,通过此结构
功能域可和许多种子特异性启动子中的保守 RY元
件结合 ,从而调节其他基因的表达。
39
© 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
生物技术通报 B iotechnology B u lle tin 2009年第 11期49
© 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2009年第 11期 范晶等 :番茄 L eAB I3基因的生物信息学分析
2. 7 多序列比对及其同源性分析
蛋白质能够行使独特的功能主要是通过特定的
结构功能域起作用 ,采用 DNAMAN软件 ,将番茄品
种 AC +成熟种子中 L eAB I3基因转录本 1编码的氨
基酸序列和来自于大麦、小麦、水稻、玉米、马铃薯、
拟南芥的 AB I3 /VP1蛋白氨基酸序列进行比对。结
果显示 : LeAB I3与其它作物 VP12AB I32like蛋白在
结构功能域上具有很高同源性 ,尤其表现在高度保
守的碱性结构域 B3 domain (图 5) ,同源性分析显示
LeAB I3与马铃薯 VP12AB I32like的同源性高达 89%
(图 6)。
3 讨论
RNA的剪接方式包括组成性剪接和选择性剪
接 [ 7 ] , RNA选择性剪接可使一个基因通过不同的剪
接方式产生多种 mRNA转录产物 ,主要表现为剪接
位置发生改变。在剪接过程中 ,外显子区域的序列
可被保留下来并成为 mRNA的一部分 ,也可被当作
内含子的一部分从而被剪接掉 ,这种机制可以增加
基因的多样性 [ 8, 9 ]。
McKibbin等 [ 10 ]发现小麦 VP1转录加工后产物
中存在外显子的删除 ,这种基因异常导致小麦穗萌
抗性减弱 ,番茄品种 AC +成熟种子中 L eAB I3基因
cDNA测序结果也显示 L eAB I3基因含有 2个转录
本 ,且转录本 2编码区发生序列缺失。
随着生物技术和计算机技术的飞速发展 ,利用生
物信息学对基因编码蛋白进行物理特性、序列结构和
功能预测的可信度越来越高 ,本研究应用生物信息学
的方法和工具对 LeAB I3基因编码蛋白的理化性质、
跨膜区域、疏水性 /亲水性、二级结构、结构功能域和
同源树进行分析 ,发现其具有 AB I3 /VP1转录因子中
特有的高度保守 B3结构功能域 ,同源树分析发现番
茄品种 AC+ LeAB I3和马铃薯 vp12AB I3 类蛋白同源
性高达 89% , BLASTn比对发现 LeAB I3基因转录本
1和转录本 2中比 NCB I中已注册的 LeAB I3基因增加
的 30 bp核苷酸和马铃薯 VP12AB I32like第一外显子
中相应的序列同源性为 90% ,可推测此 30 bp核苷酸
应来源于番茄品种 AC+ LeAB I3基因的外显子序列 ,
这就意味着番茄品种 AC+和 Glamour的 LeAB I3基因
59
© 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
生物技术通报 B iotechnology B u lle tin 2009年第 11期
由于品种的不同而存在着差异。上述结果可表明番
茄 LeAB I3转录本 1属于典型的 AB I3 /VP1类转录因
子 ,这些工作的开展可为人们通过试验研究 LeAB I3
基因的功能奠定基础。
图 5 番茄 L eAB I3转录本 1与其他植物 AB I3 /VP1氨基酸序列比较
69
© 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2009年第 11期 范晶等 :番茄 L eAB I3基因的生物信息学分析
H ordeum vu lga re. 大麦 ; T riticum aestivum. 小麦 ; O ryza sa tiva. 水稻 ; Zea m ays. 玉米 ;
Solanum tuberosum. 马铃薯 ; L ycopersicon escu len tum. 番茄 ; A rabidopsis tha liana. 拟南芥
图 6 不同植物 AB I3 /VP1的氨基酸序列同源树分析
参 考 文 献
1 Nambara E, et al. Development, 1995, 121: 629~636.
2 McCarty DR, et al. The Plant Cell, 1989, 1: 523~532.
3 Rohde A, et al. The Plant Cell, 2000, 12: 35~52.
4 Hattori T, et al. Genes and Development, 1992, 6: 609~618.
5 Bassel GW , et al. J Exp Bot, 2006, 57 (6) : 1291~1297.
6 张雨良 ,等. 中国生物工程杂志 , 2009, 29 (1) : 27~33.
7 万敬员 ,等. 国外医学分子生物学分册 , 2003, 25 (6) : 342~345.
8 Graveley BR. Trends Genet, 2001, 17: 99~108.
9 Gagete AP, et al. J Exp Bot, 2009, 60 (6) : 1703~1714.
10 McKibbin RS, W ilkinson MD, Bailey PC, et al. Proceedings of the
National Academy of Sciences USA, 2002, 99: 10203~10208.
(上接第 91页 )
使编码的目的蛋白在真核细胞膜上表达 ,并能筛选
出高表达的锚定蛋白细胞株 [ 7 ]。
本研究中 ,将 GP I锚定序列克隆到 pEGFP2C1
质粒 EGFP基因的下游 ,旨在转染细胞内表达 EG2
FP2GP I融合蛋白。EGFP作为与目的蛋白融合的报
告基因 ,具有低毒、无需任何辅助因子或底物参与、
无需裂解细胞、在普通的激光激发下就能产生荧光 ,
从而在细胞或亚细胞水平上成像 ,达到对目的蛋白
的跟踪、定位的目的。分别将 pEGFP2C12GP I与
pEGFP2C1质粒转染 A549 细胞后 , pEGFP2C12GP I
质粒转染细胞观察到围绕胞膜、且呈非均匀分布的
强绿色荧光 ;而对照 pEGFP2C1质粒转染细胞观察
到均匀分布于整个胞浆的强绿色荧光。初步证实 ,
构建的重组 pEGFP2C12GP I真核表达质粒在肺腺癌
A549细胞中表达了 EGFP2GP I融合蛋白 ,且位于
EGFP羧基端的 GP I在 A549细胞中介导了“锚定 ”
作用。pEGFP2C12GP I真核表达载体的构建为进一
步开发锚定表达型肿瘤疫苗奠定了基础。
参 考 文 献
1 Ikezawa H. B iol Pharm Bull, 2002, 25 (4) : 409~417.
2 Nagarajan S, Selvaraj P. Vaccine, 2006, 24 (13) : 264~274.
3 刘煜 ,等. 南方医科大学学报 , 2007, 27 (4) : 558~559.
4 Sangiorgio V, et a1. Ital J B iochem, 2004, 53 (2) : 98~111.
5 钱莉玲. 国外医学分子生物学分册 , 2002, 24 (2) : 100~103.
6 熊茂林. 国外医学免疫学分册 , 2003, 26 (5) : 230~233.
7 于继云 ,沈倍奋. 免疫学杂志 , 2003, 19 (6) : 478~479, 481.
79
© 1994-2011 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net