全 文 :·研究报告·
生物技术通报
BIOTECHNOLOGY BULLETIN 2011 年第 7 期
烤烟 SNARE蛋白基因 T-NTGP2 全长
cDNA克隆与生物信息学分析
胡重怡 蔡刘体
(贵州烟草科学研究所,贵阳 550081)
摘 要: 从烤烟品种南江 3 号(Nicotiana tobacum cv. Nanjiang-3)均一化 cDNA文库中克隆获得一个 SNARE蛋白同源性
较高的 cDNA全长序列,命名为 T-NTGP2,GenBank中的登录号为 HO663897。利用 ORF finder和 ProtParam软件分析显示,它
包含一个长度为 597 bp的完整开放读码框,编码一个含有 199 个氨基酸、等电点为 6. 96、分子量为 22. 59 kD的蛋白。Blast搜
索结果及进化分析结果表明,烤烟 T-NTGP2 基因编码的蛋白与烤烟、杨树和蓖麻的 Ykt6 蛋白具有较高的同源性,其一致性分
别为 99%、91%和 91%。该基因编码的蛋白具有一个典型的 VAMP基元,同源分析表明该蛋白属于 SNAREs中特殊 longins中
的 Ykt6 蛋白。
关键词: 烤烟 SNARE 克隆 生物信息学分析
Cloning and Bioinformatics Analysis of a SNARE Protein
T-NTGP2 cDNA from Flue-cured Tobacco
Hu Zhongyi Cai Liuti
(Guizhou Tobacco Research Institute,Guiyang 550081)
Abstract: From the normalized DNA library of the flue-cured tobacco cultivar Nanjiang-3,the full length cDNA sequence of to-
bacco which is highly homologous to the gene SNAREs was isolated,(named as T-NTGP2)cloned and its sequence was analysed,with
GenBank accession number HO663897. Analysis by the software ORF finder and ProtParam showed that the T-NTGP2 with a 597 bp
open reading frame(ORF)which encode a protein of 199 amino acids,with a calculated molecular weight(Mw)of 22. 59 kD and a isoe-
lectric point(pI)value of 6. 96. The results of Blast and phylogenetic analysis showed that T-NTGP2 gene had homology with the
SNARE protein Ykt6 gene of some plants,and T-NTGP2 encoded protein had high identity with the Ykt6 protein of Nicotiana tabacum,
Populus trichocarpa and Ricinus communis,with identity of 99%,91%,91%,respectively. The result of the conserved domains analysis
indicated that T-NTGP2 has a signature motif for vesicle-associated membrane proteins(VAMP) ,which implied that T-NTGP2 would be
a YKT-like SNAREs longins.
Key words: Flue-cured tobacco SNARE Clone Bioinformatics
收稿日期:2010-12-27
基金项目:中国烟草总公司资助项目(110200701021) ,贵州省烟草专卖局资助项目(黔烟科 2009-15,黔烟科 2010-12)
作者简介:胡重怡,硕士,助理研究员,研究方向:烟草分子生物学;E-mail:rebeccahu0801@ 126. com
通讯作者:蔡刘体,E-mail:cailiuti01@ 163. com
高等植物中,膜泡运输对于完成细胞器及细胞
膜之间的蛋白运输功能至关重要,可溶性 N-乙基马
来亚酰胺敏感因子附着蛋白的受体(soluble-N-ethyl-
maleimide-sensitive fusion protein attachment protein
receptor,SNAREs)蛋白专一性介导真核生物囊泡的
定位与融合[1]。比较人和酵母的多个 SNARE 蛋白
序列,发现不同 SNARE 蛋白尽管在氨基酸长度和
结构上有所区别,但有一段序列(长度为 55 个氨基
酸)是高度保守的,称之为 SNARE结构域(SNARE-do-
main),是 SNARE核心复合体(core complex)形成时各
个成分相互作用的部位,由 synaptobrevin /VAMP、syn-
taxin及 SNAP-25 以1∶ 1∶ 1的比例聚合成 SNARE 核
生物技术通报 Biotechnology Bulletin 2011 年第 7 期
心复合体[2]。根据位于 SNARE 结构域中间的氨基
酸残基是精氨酸或是谷氨酰胺,将 SNAREs 家族成
员分为 R-SNAREs 和 Q-SNAREs 两类。根据 longin
结构域序列的长短 R-SNAREs 被划分为 VAMPs(小
突触囊泡蛋白或称 brevins)和 longins(突触囊泡蛋
白或称 long VAMPs)两类,其中 Longins 又分为 T1-
VAMP[3]、Sec22[4] 和 Ykt6[5]。迄 今 为 止,植 物
SNAREs 蛋白基因已被广泛报道[1],本研究从烤烟
品种南江 3 号均一化全长 cDNA文库中克隆了 1 个
Ykt6 蛋白基因,与之前报道的烟草 Ykt6 蛋白 T-NT-
GP1(登录号:AAD00116)在编码蛋白上有两个氨基
酸差异,通过烟草 SNAREs蛋白基因的克隆,以期为
更深入地了解烟草 SNAREs蛋白家族基因功能和膜
泡运输的机制奠定了基础。
1 材料与方法
1. 1 材料
从烤烟品种南江 3 号的均一化 cDNA 文库中筛
选克隆到 1个 SNARE蛋白基因,命名为(T-NTGP2) ,
其 GenBank登录号为 HO663897。其他植物的 SNARE
蛋白序列信息从 NCBI 数据库(www. ncbi. nlm. nih.
gov)中获取。
1. 2 方法
均一化 cDNA 文库的构建采用 SMART cDNA
Library Construction 试剂盒(QIANGEN 公司)完成,
序列测定由上海生工生物公司完成。
用网站 http:/ /www. ncbi. nlm. nih. gov 中提供
的 ORF finder软件找出基因的开放读码框,用 NCBI
提供的 BLASTp 程序搜索进行同源性分析;采用
MEGA4. 1 进行进化关系分析。利用瑞士生物信息
学研究所(http:/ / cn. expasy. org /)提供的 ProtParam
软件在线分析氨基酸残基数目、组成、蛋白质相对分
子质量、理论等电点及平均可塑性、疏水性等参数。
利用 ExPASy 提供的 HNN[6]软件等在线分析 α-螺
旋(alpha-helix)、β-转角(beta turn)、无规卷曲(ran-
dom coil)以及延伸链(extend strand)蛋白质一级结
构。利用 http:/ / swissmodel. expasy. org /workspace /
网站提供 Sequence Feature Scan[7]和 Modeling[8 - 10]
程序对蛋白质的二级和三级结构进行预测。利用
http:/ /www. cbs. dtu. dk /网站提供的软件进行跨膜
结构和信号肽[11]的预测,利用瑞士生物信息学研究
所(http:/ / cn. expasy. org /)提供的 Prosite 软件对蛋
白质功能位点进行预测[12]。
2 结果与分析
2. 1 烤烟 SNARE蛋白基因克隆
用 ORF finder软件分析烟草 SNARE 蛋白基因
(T-NTGP2)编码氨基酸序列,可得到完整的 ORF
框,其 5非编码区为 140 bp,编码区位于核苷酸序
列的 1 - 597 区域,编码蛋白包含 199 个氨基酸
(图 1)。
2. 2 T-NTGP2 同源性分析
SNAREs基因在多种植物中均存在,通过序列
比对 http:/ /www. expasy. org /cgi-bin /blast) ,烤烟 T-
NTGP2 基因编码的蛋白与烤烟(Nicotiana tabacum)
(登录号:AAD00116)Ykt6 蛋白高度同源,其一致性
为 99%,两者编码氨基酸序列相差两个氨基酸,与
杨树(Populus trichocarpa)、蓖麻(Ricinus communis)、
葡萄(Vitis vinifera) (登录号分别为 XP002309328、
XP002523504、CAN67944)Ykt6 编码序列同源性较
高,其一致性分别为 91%、91%和 90%。这说明该
基因在植物进化过程中具有保守性。
用 MEAG4. 1 软件对烟草 T-NTGP2 基因编码
氨基酸序列和其他植物的 Ykt6 蛋白进行进化分
析,结果(图 2)显示,烤烟 T-NTGP2 基因编码氨基
酸序列与烤烟、拟南芥、葡萄的 Ykt6 蛋白(登录号
分别为 AAD00116、AAD00112、CAN67944)的同源
性较高。
2. 3 蛋白质一级结构分析
通过 ProtParam 软件分析表明,T-NTGP2 蛋白
相对分子量为 22587. 6,理论等电点为 6. 96,酸性氨
基酸残基总数(Asp + Glu)为 25 个,碱性氨基酸残
基总数(Arg + Lys)25 个,原子总数是 3 163 个,分子
式为 C1005H1574 N272 O304 S8。烟草 T-NTGP2 蛋白平均
疏水性分析显示大致有 4 个峰值,分布于氨基酸
残基的 60 - 71,81 - 88,134 - 155,159 - 173 区域
(图 3) ;可塑性分析显示有 4 个峰值,分布于氨基
酸残基的 14 - 17,50 - 60,146 - 149,161 - 163 区
域(图 4)。
2. 4 蛋白质二级结构分析
图 5 表明 T-NTGP2 蛋白富含 α-螺旋(alpha he-
lix)和无规则卷曲(random coil) ,分别是 32. 66%和
87
2011 年第 7 期 胡重怡等:烤烟 SNARE蛋白基因 T-NTGP2全长 cDNA克隆与生物信息学分析
下划线标注起始密码子,斜体标注终止密码子,* 标注翻译终止
图 1 T-NTGP2 cDNA全长序列及其推导的氨基酸序列
Populus trichocarpa. 杨树;Glycine max.大豆;Gossypium bar-
badense.海岛棉;Ricinus communis. 蓖麻;Arabidopsis thali-
ana.拟南芥;Nicotiana tobacum. 烟草;Vitis vinifera. 葡萄;
Hevea brasiliensis.橡胶;Triticum aestivum.小麦;Oryza sativa.
水稻;Selaginella moellendorffii.卷柏
图 2 NTGP-2与部分植物 SNARE蛋白Kyt6进化关系分析
47. 74%,分布于氨基酸序列的多个区域。延伸链
(extended strand)主要分布于氨基酸残基的 2 - 10、
41 - 46、151 - 156 相对集中的 3 个区域,占氨基酸
残基总数的 19. 60%;无 β-转角分布区域。
图 3 T-NTGP2 基因推导的编码蛋白疏水性分析
图 4 T-NTGP2基因推导的编码蛋白可塑性分析
97
生物技术通报 Biotechnology Bulletin 2011 年第 7 期
序列全长含 199 个氨基酸;竖线由长及短分别为 α-螺旋(32. 66%) ,延伸链(19. 60%) ,无规则卷曲(47. 74%) ,无 β-转角
图 5 T-NTGP2 蛋白的二级结构分析
2. 5 蛋白质三级结构分析
登录 http:/ / swissmodel. expasy. org /workspace /
中的 MODELING,对 T-NTGP2 蛋白进行三级结构预
测分析,结果(图 6)表明其与 SNARE蛋白家族中的
Ykt6 的三级结构非常相似。
A. T-NTGP2 三级结构预测;B. Ykt6 三级结构
图 6 T-NTGP2 蛋白质三级结构预测
2. 6 蛋白质跨膜结构和信号肽的预测分析
登录 http:/ /www. cbs. dtu. dk /services /TMHMM/,
对 T-NTGP2 蛋白进行蛋白质跨膜结构预测,结果表
明该蛋白不具有跨膜结构域。登录 http:/ /www. cbs.
dtu. dk /services /SignalP /,运用神经网络(neural net-
works,NN)分析模型对 T-NTGP2 蛋白进行信号肽结
构分析,结果表明 T-NTGP2 不具有信号肽。登录
http:/ /www. expasy. org /cgi-bin /prosite /PSScan. cgi,
对 T-NTGP2 蛋白进行功能位点预测,该基因编码的
氨基酸序列中包含 3 个功能位点,1 个 Longin 结构
域(7 - 123 bp) ,1 个 v-SNARE 结构域(139 - 199
bp) ,1 个小突触囊泡蛋白(VAMP)典型基元(157 -
176 bp)。虽然 T-NTGP2 不含跨膜区,但其羧基端
有一个异戊烯基结合位点,可以把法尼基或牻牛儿
牻牛儿基加到该位点的半胱氨酸残基上进行转录后
修饰,从而将其锚于胞膜上。
3 讨论
从烤烟品种南江 3 号均一化 cDNA文库中筛选
到一条烤烟 SNAREs 蛋白基因的 cDNA,通过 Blast
比对,其与其他植物的 SNAREs 蛋白 Ykt6 高度同
源,并于以前报道的烤烟 Ykt6 编码氨基酸序列只相
差两个氨基酸,基于生物信息学方法,基本可以认定
其编码烤烟 SNAREs 蛋白 Ykt6 蛋白,属于烤烟
SNAREs蛋白家族。
植物 SNAREs蛋白除了参与囊泡运输的基本功
能,还可以促进植物细胞板形成,与离子通道蛋白相
互作用,提高植物的抗病性及参与植物的向重力性
作用。植物 SNAREs蛋白不仅对植物生长发育起作
用,在抵御生物与非生物胁迫过程中也起重要的作
用[1]。虽然蛋白序列基本性质分析发现,T-NTGP2
基因编码的蛋白没有疏水区域、不含跨膜区,但其
羧基端有一个异戊烯基结合位点,可以把法尼基
或牻牛儿牻牛儿基加到该位点的半胱氨酸残基上
进行转录后修饰,从而将其锚于胞膜上。从功能
位点及 motif 分析,T-NTGP2 与 Ykt6 很相似,属于
一种特殊的 Longins。本研究通过烟草 SNAREs 蛋
白基因的克隆,对更深入地了解烟草 SNAREs蛋白
08
2011 年第 7 期 胡重怡等:烤烟 SNARE蛋白基因 T-NTGP2全长 cDNA克隆与生物信息学分析
家族基因功能和膜泡运输的机制奠定了基础。
参 考 文 献
[1]鲍永美,王州飞,张红生.植物 SNRAE 蛋白的结构与功能.植物
学通报,2005,22(6) :715-722.
[2]Fasshauer D,Sutton RB,Brunger AT,et al. Conserved structural fea-
tures of the synaptic fusion complex:SNARE proteins reclassified as
Q-and R-SNAREs. Proce Natl Acad Sci USA,1998,95(26) :15781-
15786.
[3]Galli T,Zahraoui A,Vaidyanathan V,et al. A novel tetanus neurotox-
in-insensitive vesicle associated membrane protein in SNARE com-
plexes of the apical plasma membrane of epithelial cells. Mol Biol
Cell,1998,9(6) :1437-1448.
[4] Saeher M,Stone S,Ferro-Novick S. The synaptobrevin-related do-
mains of BoslP and Sec22p bind to the syntaxin-like region of
Sed5p. J Biol Chem,1997,272:17134-17138.
[5] McNew JA,Sogaard M,Lampen NM,et al. Ykt6p,a prenylated
SNARE essential for endoplasmic reticulum-Golgi transport. J Biol
Chem,1997,272:17776-17783.
[6] Combet C,Blanchet C,Geourjon C,et al. NPS@:Network protein
sequence analysis. TIBS,2000,291(25) :147-150.
[7] Jones DT. Protein secondary structure prediction based on position-
specific scoring matrices. Journal of Molecular Biology,1999,292
(2) :195-202.
[8]Arnold K,Bordoli L,Kopp J,et al. The SWISS-MODEL Workspace:
A web-based environment for protein structure homology modelling.
Bioinformatics,2006,22(2) :195-201.
[9]Schwede T,Kopp J,Guex N,et al. SWISS-MODEL:an automated
protein homology-modeling server. Nucleic Acids Research,2003,31
(3) :3381-3385.
[10]Guex N,Peitsch MC. SWISS-MODEL and the Swiss-PdbViewer:An
environment for comparative protein modelling. Electrophoresis,
1997,18(15) :2714-2723.
[11]Henrik N,Jacob E,Sren B,et al. Identification of prokaryotic and
eukaryotic signal peptides and prediction of their cleavage sites.
Protein Engineering,1997,10(1) :1-6.
[12]Sigrist CJA,Cerutti L,de Castro E,et al. PROSITE,a protein do-
main database for functional characterization and annotation. Nucle-
ic Acids Res,2010,38(suppl. 1) :161-166.
(责任编辑 李楠)
18