免费文献传递   相关文献

烟草T-phylloplanin基因编码蛋白结构与功能的生物信息分析



全 文 :生物技术通报
BIOTECHNOLOGY BULLETIN·研究报告· 2009年第 1期
收稿日期:2008-06-11
基金项目:贵州省烟草专卖局项目(黔烟科 2007-03)
作者简介:蔡刘体(1974-),男,从事烟草育种工作;E-mail:cailiuti01@163.com
大多数陆生植物叶片表面覆盖着一层腺毛,称
为香毛簇。腺毛作为叶片表面的简单附属物在大多
数植物上都存在,在维管植物中,大约有 30%具有
有分泌功能的腺毛 [1,2],有些成分如生物碱对昆虫
具有趋避、拒食或毒害作用,使烟草具有一定的自
我防卫能力 [3]。 已有报道番茄和马铃薯长柄腺毛分
泌的糖脂类,烟草长柄腺毛分泌的二萜类化合物能
抑制蚜虫的侵染 [4,5]。 但是鲜见以烟草叶片腺毛为
抗性系统的研究。 通过 cDNA 文库筛选和末端快速
扩增 (Rapid Amplification of cDNA End,RACE)技术
从烟草叶片中克隆出 T-phylloplanin 基因 [6],对 T-
phylloplanin 基因编码蛋白的结构和功能进行生物
信息学分析和预测, 并对该基因编码蛋白的分子
量、等电点等分析 ,及其磷酸化位点、信号肽、结构
域等进行分析,以期为烟草叶片抗性相关研究提供
抗性基因信息和参考依据。
1 材料与方法
1.1 材料
通过 cDNA 文库筛选和末端快速扩增 (Rapid
Amplification of cDNA End,RACE)技术从烟草叶片
中克隆的 T-phylloplanin 基因 GenBank 登录号为 A
Y705384,编码蛋白 GenBank 登录号为 ABE03627。
烟草 T-phylloplanin基因编码蛋白结构与
功能的生物信息分析
蔡刘体 胡重怡 叶定勇 郑少青
(贵州省烟草科学研究所,贵阳 550003)
摘 要: 利用美国国家生物技术信息中心(NCBI)网站所提供的相关信息,分析 T-phylloplanin基因编码蛋白。该基
因全长 861 hp,有一个完整的 330 hp的开放读框,编码 110 个氨基酸。 该基因编码蛋白分子量为 11.31 kD,理论等电点
为 7.74。 其氨基酸残基的不同区域分布有多 N-糖基化位点、酪蛋白激酶Ⅱ磷酸化位点和 N-肉豆蔻酰化位点,还有一个跨
膜信号肽。 T-phylloplanin基因编码蛋白与烟草叶片短柄腺毛分泌的抗性蛋白具有高度的同源性(93%),显示它在烟草抗
性系统研究中有潜在价值。
关键词: 烟草 基因 序列分析 蛋白结构
Analysis of Structure and Function of the Protein Encoded by
T-phylloplanin Gene from Nicotiana tabacum
Cai Liuti Hu Zhongyi Ye Dingyong Zheng Shaoqing
(Tobacco Science Research Institute of Guizhou Province,Guiyang 550003)
Abstract: The T-phylloplanin encoding protein was analysed by informatics tools provided on internet. The
entirely T-phylloplanin gene has 861 bp containing a complete open reading frame that encodes 111 amino acids with a
transmembrane signal peptide,several N-glycosylation and casein kinase II phosphorylation sites. The molecular weight
of the protein encoded by T-phy lloplhin gene is 11.30 kD,and iso-electric point is 7.74. The T-phylloplanin encoding
protein has highest similarity with the protein featuring defensive function secreted by short stalk glandular hair,thus
indicating the worth for further study in tobacco resistance system.
Key words: Nicotiana tabacum Gene Sequence analysis Protien structure
2009年第 1期
1.2 方法
利用网站 NCBI 提供的 ORF finder 软件找出基
因的读码框, 再利用瑞士生物信息学研究所(http:
//cn.expasy.org/)提供的 ProtParam 软件进行氨基酸
残基数目、组成、蛋白质相对分子质量、理论等电点
及平均可塑性、疏水性等参数的在线分析。
利用 ExPASy 提供的 ProtScale 软件、HNN 软件
等在线分析 α-螺旋(alpha-hclix)、β-转角(beta turn)、
无规卷曲 (random coil)以及延伸链 (extend strand)
等。
通过蛋白质数据库 (protein data bank,PDB)同
源建模(homology modeling)测 T-phylloplanin 基因编
码蛋白的三维结构。
利用 NCBI 提供的 BLASTp 进行同源性分析 。
利用 ExPASy 提供的 PROSITE 软件进行蛋白特定
位点分析。
2 结果与分析
2.1 T-phylloplanin 基因编码蛋白一级结构分析
T-phylloplanin 编码蛋白的氨基酸序列通过 ORF
finder 软件分析,可得到完整的 ORF 位于核苷酸序
列的 1~333 区域,编码蛋白包含 110 个氨基酸残基
(图 1),分子量为 11.31 kD,理论等电点为 7.74。 酸
性氨基酸残基总数 (Asp+Glu)为 3,碱性氨基酸残
基总数 (Arg+Lys )共为 4 。 原子总数是 1 613,分
子式为 C502H820N134O153S4。平均疏水性分析显示约有 5
个峰值 , 分布于氨基酸残基的 10~14,36~39,47~
55,59~62,89~106 区域(图 2);可塑性分析显示约
有 4 个峰值,分布于氨基酸残基的 19~27,30~36,
70~75,85~93 区域(图 3)。
2.2 T-phylloplanin 基因编码蛋白二级结构分析
图 4 表明该蛋白富含延伸链 (Extended strand)
和无规卷曲(Random coil),分别是 36.36%,49.09%,
分布于氨基酸序列的多个区域 。 α-螺旋主要分布
于氨基酸残基的 9~18,70~77 相对集中的 2 个区
域,占氨基酸残基总数的 14.55%。 无 β-转角分布
区域。

          
           
             
 
          
。。。 。。。。。。。。。 
。              
。。。。 。。。。。。
。            
 。。。。。。。。。。。。
            
。 。。。。。。。。。。。
              
 。。。 。 。。。。。
          
。。 。。。。。 。。。
。          
。。。。。。。 。。。。
    
。。。。。。
。                
。。             
。。。      。。。
图 1 T-Phylloplanin cDNA 全长序列及其推导的
蛋白质序列
注:起始密码子以下画线标注 ,终止密码子以斜体标注 ,
翻译终止以 * 标注
图 2 T-Phylloplanin 基因推导的编码蛋白质疏水性分析
图 3 T-Phylloplanin 基因推导的编码蛋白质可塑性分析
蔡刘体等:烟草 T-phylloplanin基因编码蛋白结构与功能的生物信息分析 101
生物技术通报 Biotechnology Bulletin 2009年第 1期
2.3 T-phylloplanin 基因编码蛋白三级结构分析
在各蛋白质结构数据库中尚未搜索到该基因
编码蛋白的同源模型 [7]。
2.4 T-phylloplanin 基因编码蛋白功能分析
特定位点分析结果 T-phylloplanin 基因编码蛋
白有含 3 个 N-肉豆蔻酰化 (N-myristoylation)位点 ,
分别位于第 23~28 (GNVVSS),88~93(GGVGGL),
和 91~96(GGLINV)氨基酸残基之间;2 个酪蛋白激
酶 Ⅱ磷酸化位点 (casein kinase Ⅱ phosphorylation
site),分别位于 2~5(SSTD)和 6~9(PPEF)氨基酸残
基之间 ;4 个 N-糖基化位点 (N-glycosylation site),
分别 13~16(NATV),32~35(NGSG),67~70(NATL)
和 84~87(NTSI)位于氨基酸残基之间(图 5)。
BLASTp 比对分析发现 ,T-Phylloplanin 基因编
码的蛋白与 Shepherd 等 [8]报道的烟草叶片短柄腺
毛分泌的抗性蛋白具有高度的同源性 , 信号肽
(sigml peptide)序列分析显示 T-phylloplanin 基因编
码蛋白的 87~109 氨基酸残基间有一段跨膜肽序列
(ASTLNVVNTSIGGVGGLINVVLGPTSFILNFNL)。
3 讨论
利用生物信息学分析软件如 ORF finder,ProtP&
ram,Protscale,等对烟草 T-Phylloplanin 基因编码蛋
白的结构进行了分析和预测。 T-Phylloplanin 基因全
长 861 bp,有完整的开放读框,编码 110 个氨基酸。
该基因编码蛋白与烟草叶片短柄腺毛分泌的抗性
蛋白具有高度的同源性(93%),在氨基酸残基的不
同区域分布有多 N-糖基化位点、 酪蛋白激酶 Ⅱ磷
酸化位点和 N-肉豆蔻酰化位点, 还有一个跨膜信
号肽。
Dixon 等 [9]研究报道具有 31 个 N-糖基化位点
番茄 cf-2 基因编码的蛋白, 它对携带 avr2 基因的
病原(Cladosporillm fulvum)有抗性 ;De Vries 等 [10]研
究表明番茄的抗性 Pro 基因编码的 N-肉豆蔻酰化
功能元件在抗性信号转导中是必需的;另外磷酸化
位点可能为翻译后的修饰和在抗逆反应中发挥作
用所必须 [11]。这些信息表明烟草 T-Phylloplanin 基因
编码的蛋白具有抗性蛋白的一些特征。
T-Phylloplanin 基因编码的蛋白具有一个跨膜
信号肽, 说明它具有跨膜运输到叶片表面的可能,
而且与 Shepherd 等 [8]等报道烟草叶片短柄腺毛分泌
的抗性蛋白具有高度的同源性具有高度的同源性,
表明它们可能是同一个抗性家族蛋白。本试验通过
生物信息学分析了 T-Phylloplanin 基因编码蛋白的
结构和功能,其在抗性系统中的潜在价值需要进一
步验证。
参考文献
1 Fahn A. Adv Bot Res,2000,31:37~75.
2 Wagner GJ,WangE,Shepherd RW. Ann Bot(Lond),2004,93:3~11.
3 苏德成,中国烟草栽培学[M].上海:上海科学技术出版社,2005,
49~53.
4 Goffreda JC,Szymkowiak EJ,Sussex IM,et al. Plant Cell,1990,2:
643~649.
5 Wang E,Wang R,DeParasis J,et al. Nat Biotechnol,2001,19:371~
374.
6 蔡刘体,胡重怡,郑少清,等.烟草科技,2008,7:48~51.
7 Lambert C,Leonard N,De Bolle X,Depiereux E. Bioinformatics,
2002,18:1250~1256.
8 Shepherd RW,Bass WT,Houtz RL,et al. Plant Cell,2005,17:
1851~1861.
9 Dixon MS,Jones DA,et al. Cell,1996,84:451~459.
10 De Vries JS,Andriotis VM,Wu AJ,et al. Plant J,2006,45(1):
31~45.
11 Novillo F,Alonso JM,Ecker JR,et al. Proc Natl Acad Sci USA,
2004,16(101):3985~3990.

Sequence length.110;Alpha helix (Hh).14.55% (16/110) (最长
竖线 );Extended strand (Ee).36.36% (40/110) (中长竖线 );
Random coil(Cc).49.09% (54/110) (最短竖线 );Beta turn (Tt).
0.00%(0/110)(无)
1 MSSTDSPPEF FFNATVQLRC GTGNVVSSAI TNGSGVFSLV
50 VDPRVNTLPL LLSNCRLVVA TPLSTCNATL PSVGRLASTL
90 NVVNTSIGGV GGLINVVLGP TSFILNFNLI
图 5 T-phylloplanin 基因推测的编码蛋白特定位
图 4 T-phylloplanim 基因编码蛋白的三级结构分析
102