免费文献传递   相关文献

烟草ovate 同源基因的全长cDNA 克隆与序列分析



全 文 :植物生理学通讯 第 43卷 第 6期,2007年 12月1050
烟草 ovate同源基因的全长 cDNA克隆与序列分析
桂蓓 1,2,王瑛 1,*
1中国科学院武汉植物园,武汉 430074;2中国科学院研究生院,北京 100049
提要:根据番茄中控制果实形状的主效数量性状基因 ovate的序列,用生物信息学方法从茄科植物烟草中获得直系同源
ovate基因(NTovate)的特异片段,经鉴定,此基因在烟草中至少有2个拷贝。在此基础上用 cDNA末端快速扩增(RACE)方
法,获得其中 1个拷贝的 1 059 bp NTovate全长 cDNA序列。序列分析表明,NTovate cDNA序列编码 352个氨基酸,其
蛋白序列与番茄 ovate蛋白序列和拟南芥ovate蛋白家族AtOFP7蛋白分别为70%和 36%的序列一致率,而与此家族中其
他蛋白以及水稻 ovate蛋白仅在保守的 ovate结构域有较低的同源性。此基因已在GenBank中登录(EU043369)。
关键词:烟草;ovate同源基因;全长 cDNA;序列分析
Cloning and Sequence Analysis of ovate Orthologous Gene in Tobacco
(Nicotiana tabacum L.)
GUI Bei1,2, WANG Ying1,*
1Wuhan Botanical Garden, Chinese Academy of Sciences, Wuhan 430074, China; 2Graduate School of Chinese Academy
of Sciences, Beijing 100049, China
Abstract: Tomato ovate gene has been cloned and proved to control the fruit shape development. In this study,
ovate orthologous gene in tobacco (Nicotiana tabacum), which belongs to Solanaceae and doesn’t have fruit
development, was cloned and compared with homologs in tomato and other model species. Two sequence
fragments with 90% identity were identified using bioinformatics methods. Two copies of tobacco ovate ortholog
(NTovate) were then confirmed by sequence specific PCR. A 1 059 bp full length cDNA of NTovate1 was
obtained using rapid amplification of cDNA ends (RACE). Further analysis on NTovate1 cDNA indicated that it
encoded a peptide containing 352 amino acids. The amino acid sequence comparison with tomato ovate protein
and AtOFP7 (Arabidopsis thaliana ovate family protein 7) showed that the sequence identity was 70% and
36%, respectively. Other AtOFPs and ovate family protein-like in rice only showed homolog in the ovate
domain with much lower sequence identity. The full length cDNA sequence of NTovate1 was registered in
GenBank with accession number EU043369.
Key words: tobacco (Nicotiana tabacum); ovate orthologous gene; full-length cDNA; sequence analysis
收稿 2007-08-28 修定 2007-11-16
资助 国家自然科学基金 ( 3 0 5 7 0 1 7 2 )和武汉市晨光项目
(2 004 5006 071 -34 )。
* 通讯作者(E-mail:yingwang@wbgcas.cn;Tel:027-
8 7 5 1 0 6 7 5 )。
茄科(Solanaceae)植物约有 3 000种,它包括
番茄(Solanum lycopersicum)、茄子(Solanum
melongena)、马铃薯(Solanum tuberosum)、辣椒
(Capsicum annuum)、粘果酸浆(Physalis ixocarpa)
等食用蔬菜和烟草(Nicotiana tabacum)等经济植物
以及花烟草(Nicotiana alata)和矮牵牛(Petunia
hybrida)等观赏植物(Knapp 2002)。迄今,有关烟
草的基因组结构和核苷酸组成的研究仍十分不足,
它的基因组是茄科模式植物番茄的 5倍,约含 45
亿对碱基,是人类基因组的 1.5倍;与人类基因
组类似,绝大部分烟草基因组的碱基对以重复非
编码序列的形式存在(Opperman 2003)。鉴定一些
重要的与烟草品质相关的基因(包括产量和质量
等),有利于提高不同环境下生长的烟草质量,以
及用于传统和分子的良种培育。
目前,在番茄中已发现了 5 00 多个与花发
育、果实发育、果实大小及产量以及次生代谢产
物等有关的数量性状(E shed 和 Za mi r 1 99 5;
Bernacchi和 Tanksley 1997;Grandillo等 1999;
Frary等 2004;www.sgn.cornell.edu)。多个控制
果实发育的质量性状和数量性状的相关基因已得到
植物生理学通讯 第 43卷 第 6期,2007年 12月 1051
克隆和深入的研究,例如,显性突变基因 n r
(never-ripe)通过切断乙烯受体途径而导致果实不能
成熟(Wilkinson等 1995;Yen等 1995);主效数
量性状基因fw2.2是一个果实发育前期的负调节基
因,它的表达能显著增加果实大小( C o n g 等
2002;Nesbitt和 Tanksley 2002)。另一个主效数
量性状基因ovate则为果实形状的调节基因,此基
因的一个点突变会导致功能缺失,番茄形状即由
圆形变为梨形,过量表达的ovate还影响叶片和花
的生长和发育。据推测,ovate蛋白质本身并不
控制果实的形状差异,可能是一种植物生长抑制
调节蛋白(Liu等 2002)。基因组学研究表明,ovate
同源基因在水稻和拟南芥基因组中也存在(Ku等
2000,2001),拟南芥中 ovate基因的过量表达,
也会抑制叶片、花和角果的生长发育,显示出发
育迟缓和不对称宽纹理叶片、卵形的花瓣萼片以
及短角果等表型变化(Hackbusch等 2005)。近缘
和远缘植物的同源基因序列、结构和功能的比较
研究,可为模式植物信息应用到经济作物中的基
因改良和新品种培育提供参考。基于此,本文根
据茄科模式植物番茄的ovate序列,克隆了同科近
缘的烟草中ovate同源基因(Nicotiana tabacum ovate
ortholog,NTovate),并分析比较浆果发育和非浆
果发育的物种中ovate同源基因的序列特征,以期
能为研究近缘物种中控制果实发育基因的功能进化
提供参考。
材料与方法
烟草(Nicotiana tabacum L.‘Petite Havana’)
种子发芽后于温室培养 2周左右,取其幼嫩子叶
作为实验材料。大肠杆菌菌株DH5α为本实验室
保存,克隆载体质粒pMD18-T购自TaKaRa公司,
DNA纯化回收试剂盒购自OMEGA公司,Trizol
Reagent购自 Invitrogen公司,BD SMARTTM RACE
cDNA合成试剂盒和BD PowerScript反转录酶购自
TaKaRa公司。引物采用 Prime 5.0设计,由上海
生物工程有限公司合成。
用番茄ovate蛋白序列(AAN17752) tblastn烟草
基因组数据库(Tobacco Genome Initiative,TGI,
http://tgi.ncsu.edu,由美国北卡州立大学(NCSU)
农业与生命科学学院植物病理学系所构建)。从中
选取序列一致率高于 60%和E值低于 1×10-10以上
的序列,用序列拼接软件 Cap3进行组装,获得
烟草ovate同源基因片段,参数设置为重叠片段长
度大于 20,序列相似度大于 95%。
用CTAB法(Rogers和Bendich 1985)提取烟草
嫩叶总DNA,根据上述所得序列设计基因特异引
物对相应片段进行 PCR扩增,验证 NTovate序列
预测结果。PCR反应条件:94 ℃预变性 5 min;
94 ℃变性 20 s,55 ℃退火 20 s,72 ℃延伸 35
s,扩增 35个循环;72 ℃延伸 7 min。PCR产
物连接到 pMD-18T载体上,转化大肠杆菌DH5α
感受态细胞,挑选阳性克隆经 PCR验证后测序。
根据已经获得的Ntovate一个片段序列,在序
列保守区设计基因特异引物。根据RNA提取试剂
盒Trizol Reagent的说明提取烟草叶片总RNA,用
分光光度法和琼脂糖凝胶电泳检测RNA质量。采
用BD SMARTTM RACE cDNA 合成试剂盒(TaKaRa
公司),在使用说明书的基础上,根据改良后的
方法进行两轮 5与 3 cDNA末端快速扩增(rapid
amplification of cDNA ends,RACE),先以特异
引物GSP与Kit末端通用引物UPM为引物进行第
一轮扩增,再以稀释 10倍的产物为模板,以巢
式特异引物NGSP与Kit末端巢式通用引物NUP为
引物进行第二轮扩增。PCR反应条件:94 ℃预变
性 5 min;94 ℃变性 30 s,68 ℃退火 30 s,72 ℃
延伸 1 min,每循环一次退火温度降低 0.5 ℃,扩
增 31个循环降至 53 ℃;再 94 ℃变性 30 s,53 ℃
退火 30 s,72 ℃延伸 1 min,扩增 10个循环;
最后 72 ℃延伸 10 min。两轮反应条件相同,扩
增产物的克隆和测序同上。将 5与 3-RACE末端
测序结果用DNAMAN软件进行拼接,得到全长序
列。
所得序列再用Blast软件与NCBI的核酸与蛋
白Nr数据库进行比对,并用ClustalW软件对同源
蛋白序列进行比较和分析;使用 N C B I 提供的
Open Reading Frame Finder (ORF-finder)与The Con-
served Domain Database (CDD) (Marchler-Bauer等
2005)分别进行基因开放阅读框预测与保守结构域
预测;蛋白质疏水性分析使用软件Kyte-doolittle
(Kyte和Doolittle 1982) ;蛋白质信号肽、理论分
子量、等电点和疏水性预测分别采用 Signa lP、
植物生理学通讯 第 43卷 第 6期,2007年 12月1052
Compute pI/Mw以及 Protscal程序(http://au.expasy.
org/tools) ;蛋白质跨膜预测分析采用TMPRED软
件(http://www.ch.embnet.org/cgi-bin/TMPRED) ;
蛋白质蛋白信号定位采用GenomeNet的在线预测
程序 Psort Prediction (http://psort.hgc.jp/)。所有软
件使用的参数为默认设置。
实验结果
1 NTovate特异片段的获得和鉴定
通过番茄ovate蛋白序列与TGI数据库搜索比
对,得到 10个序列符合序列一致率高于 60%和E
值低于 1×10-10的条件,拼接后获得大小分别为
1 000与1 086 bp的2条特异片段contig1和contig2,
中间 862 bp的区域具有 90%的序列一致率,而两
端的序列没有同源性。根据 2条片段的同源和非
同源序列设计引物:P1 (5 GAATAGGTAGAAG-
GTCGTC 3)为两片段同源区共有的上游非特异引
物,P2 (5 CTCGTCGTTTAAGGTGTAA 3)和 P3
(5 CGTACGTACTTCGTTTCA 3)分别为contig1和
contig2非同源区的下游特异引物(图 1)。用 P1和
P2、P1和 P3分别扩增出 600 bp的 contig1与 520
bp的 contig2相应目的片段(图 2),测序结果与基
因预测结果完全一致,验证了ovate同源基因在烟
草中的 2 个拷贝。
图 1 NTovate的序列拼接
Fig.1 The sequence assemble results of NTovate
粗线条表示同源区域,细线条表示非同源区域。P 1 为上游非特异引物,P 2 和 P 3 为下游特异引物。
图 2 NTovate特异片段的 PCR鉴定
Fig.2 PCR identification of NTovate special fragments
M:D L 2 0 0 0 标记;1:c o n t i g 1 片段;2:c o n t i g 2 片段。
2 NTovate1全长cDNA克隆与序列分析
根据NTovate contig2片段序列设计了RACE的
第一轮基因特异引物GSP5 (5 GAGAAAGCCTCAA-
CAATCAACCCA 3)、GSP3 (5 ACCAAGAG-
GAGAGTGAAACATTCCAGACGA 3)和第二轮巢式
基因特异引物NGSP5 (5 CTATCGCAAAGCTCTC-
CTTCACTTTCCCTTCC 3)、NGSP3 (5 AGAAG-
GTCGTCAGTTTCTACGTCATCGGACAG 3)。经
5与 3-RACE扩增,5端获得 2条带,经测序确
定目的条带为带A,带 B比带A的 5上游缺失了
226 bp序列,其他序列相同,可能是mRNA逆
转录时 5端有部分降解,3端获得单一特异条带
(图 3 )。
测序结果得到长度为924 bp的5端片段与460
bp的 3端片段,基于两片段间 115 bp的重叠区序
列,并与 contig2序列进行比对,拼接得到全长
为 1 219 bp的基因片段。DNAStar软件分析表明,
该基因在 101~1 159 bp之间有一开放阅读框,共
编码 352个氨基酸,5端非编码区有 100 bp,3
非编码序列有 60 bp,其中包含 30 bp的 polyA尾。
该序列与 contig2中相应序列完全一致,与番茄
ovate基因 cDNA (AY140893)核酸序列一致率达
83%。保守区域分析结果表明,该基因推测出的
蛋白序列包含一个功能未知的 DUF623结构域,
含有60个氨基酸,在番茄ovate蛋白和拟南芥ovate
蛋白家族中也有发现,又称之为 o va t e 结构域
(Wang等 2007)。由此证明获得了 NTovate一个拷
贝的全长 cDNA序列,命名为NTovate1基因(图4)。
植物生理学通讯 第 43卷 第 6期,2007年 12月 1053
3 NTovate1编码的氨基酸序列比较
将 NTovate1编码的氨基酸序列 Blastp搜索
NCBI的Nr蛋白质数据库的结果显示,其与番茄
ovate蛋白具有70%的序列一致率,与拟南芥ovate
家族蛋白AtOFP7蛋白的同源性仅次于番茄,其序
列一致率为 36%。在 60个氨基酸的 ovate保守结
构域中,NTovate1与番茄 ovate和拟南芥AtOFP7
分别具有 4个和 17个氨基酸的差异(图 5)。与拟
南芥 ovate家族中其他 14个蛋白相比,除 ovate结
构域有一定的同源性外,其他区段没有同源性,
在 ovate结构域中氨基酸序列一致率从 40%~63%
不等。Blastp结果发现在水稻中具有 62个含有
ovate结构域的未知蛋白,其中预测的水稻 ovate
相似蛋白(BAD87078)保守域与NTovate1具有33%
的序列一致率。在苜蓿中也曾发现 3个含此结构
域的未知蛋白,保守域序列一致率最高达到
62%。这说明烟草与同科近缘的番茄相比,除了
在 ovate保守域具有最高的同源性外,在其他序列
上具有一定的同源性,可能体现了茄科中无浆果
发育与有浆果发育作物的进化差异;而与远缘的
拟南芥、苜蓿、水稻相比,仅在保守域中有较
低同源性,序列的一致率按亲缘关系的远近在拟
南芥、苜蓿、水稻中依次降低。
4 NTovate1蛋白的理化性质与结构
经 Compute pI/Mw程序预测,NTovate1编码
的蛋白质分子量为 40.1 kDa,等电点为 9.66,经
SignalP程序预测,无信号肽序列,为非分泌蛋
白。Kyte-doolittle疏水性分析结果显示,NTovate1
在 50~75氨基酸间有个疏水区域。跨膜分析预测
结果显示NTovate1不含跨膜区,蛋白信号位点在
线预测程序发现了一个核定位信号,表明
NTovate1可能是一个核蛋白。
讨 论
随着结构基因组学和功能基因组学的发展,
基因序列和结构的研究最终还是要归结到基因功能
上来。用现有模式植物中同源基因的序列分析与
比较,寻找它们与产量和品质等重要经济性状之
间的关系,可以研究其功能的进化和演变,并最
终探索如何用它们来改良非模式物种的产量和品质
(薛勇彪 2001)。
本文根据己知的番茄ovate蛋白序列和TGI数
据库中的序列信息,利用同源搜索拼接得到
NTovate基因的序列片段,并鉴定为 2个拷贝,说
明烟草基因组中至少有 2个 ovate同源基因。经
RACE扩增,得到了其中 1个拷贝 NTovate1的全
长 cDNA序列。其蛋白序列分析结果表明,与番
茄 ovate蛋白和拟南芥AtOFP7分别有 70%和 36%
的相似性,而且均具有ovate蛋白典型的保守功能
域DUF623结构,即 ovate结构域。与拟南芥ovate
家族中其他蛋白、苜蓿未知蛋白和水稻中预测的
ovate类似蛋白在此结构域上也具有相对较低的同
源性。NTovate1蛋白与番茄、拟南芥 ovate蛋白
都不具有信号肽结构。蛋白信号位点分析发现,
NTovate1蛋白具有与番茄的ovate蛋白类似的核定
位信号,且均无跨膜区,推测可能为核蛋白,在
拟南芥中已定位的AtOFP蛋白也位于核内(Wang
等 2007)。由此可见,烟草中的 ovate同源基因编
码的蛋白质结构特性符合 ovate蛋白的结构特点,
与同科近缘物种番茄具有较高的同源性,与其他
远缘物种在保守域也有一定的序列相似性。
但作为无浆果发育的茄科作物,烟草的ovate
同源基因也存在不少差异,烟草的同源基因至少
具有 2个拷贝,考虑到烟草的基因组比番茄的大
约 5倍,可能是进化过程中的基因组大片段或基
因复制事件的结果。NTovate1蛋白虽与番茄ovate
蛋白结构相似,但番茄ovate蛋白经预测是个亲水
蛋白(Liu等 2002),而NTovate1蛋白含有一个预
测的疏水区域,并且拟南芥同源蛋白中也不具有
图 3 NTovate1的RACE-PCR
Fig.3 RACE-PCR products of NTovate1
  M:DL 2000标记;1:5-RACE扩增;2:3-RACE扩增。箭头
表示目的片段。
植物生理学通讯 第 43卷 第 6期,2007年 12月1054
该疏水区域,有研究表明疏水区的螺旋结构可能
与一定的功能相关(Seigneurin-Berny等 1999),因
此ovate基因的功能在烟草中可能具有一定的特异
性。目前,ovate基因的功能仅在番茄和拟南芥
中有研究,在番茄中ovate是一个控制果实形状从
圆形到梨形转变的数量性状基因,也是多效发育
图 4 NTovate1的 cDNA序列及编码的氨基酸序列
Fig.4 The nucleotide sequence and amino acid sequence for NTovate1
框内为 o v a t e 保守结构域,星号表示终止密码子。
植物生理学通讯 第 43卷 第 6期,2007年 12月 1055
图 5 NTovate1编码的氨基酸序列与番茄和拟南芥的同源氨基酸序列的比较
Fig.5 Alignment of amino acid sequences of Ntovate1 and ovate orthologs from tomato and Arabidopsis
加框表示 60 个氨基酸的 ovate保守结构域,GenBank 登陆号为 EU043369 (烟草)、AAN17752 (番茄)、NP_179440 (拟南芥)。
调控基因,在植物生长发育中有抑制作用(Liu等
2002)。拟南芥 ovate蛋白家族中的AtOFP1是一
个转录因子抑制子,调节一种控制细胞延伸的赤
霉素合成酶基因表达,它的过表达会减小细胞长
度,从而发生胚轴、子叶、叶片、花器官、角
果均变短的表型变化,AtOFP2与AtOFP7也有相
似的功能(Wang等 2007)。本文选择茄科中无浆果
的烟草 ovate基因为对象,该基因全长 cDNA的获
得对于正确解析其基因在非浆果作物中的功能及其
表达调控的规律是非常重要的。而要真正了解
ovate同源基因在烟草发育过程中的功能、是否存
在特殊的疏水功能结构域、基因功能的进化机制
等问题,则尚需对其进行转基因研究。
参考文献
薛勇彪(2001). 国家重点基础研究发展规划项目: 水稻重要性状
的功能基因组学研究项目简介. 植物学报, 43: 769~770
Bernacchi D, Tanksley SD (1997). An interspecific backcross of
Lycopersicon esculentum×L. hirsutum: linkage analysis and
a QTL study of sexual compatibility factors and floral traits.
Genetics, 147: 861~877
Cong B, Liu J, Tanksley SD (2002). Natural alleles at a tomato fruit
size quantitative trait locus differ by heterochronic regulatory
mutations. Proc Natl Acad Sci USA, 99: 13606~13611
Eshed Y, Zamir D (1995). An introgression line population of
Lycopersicon pennellii in the cultivated tomato enables the
identification and fine mapping of yield-associated QTL.
Genetics, 141: 1147~1162
Frary A, Fulton TM, Zamir D, Tanksley SD (2004). Advanced
backcross QTL analysis of a Lycopersicon esculentum×L.
pennellii cross and identification of possible orthologs in the
Solanaceae. Theor Appl Genet, 108: 485~496
Grandillo S, Zamir D, Tanksley SD (1999). Genetic improvement
of processing tomatoes: a 20 years perspective. Euphytica,
110: 85~97
Hackbusch J, Richter K, Müller J, Salamini F, Uhrig JF (2005). A
central role of Arabidopsis thaliana ovate family proteins in
networking and subcellular localization of 3-aa loop exten-
sion homeodomain proteins. Proc Natl Acad Sci USA, 102:
4908~4912
Knapp S (2002). Tobacco to tomatoes: a phylogenetic perspective
on fru it diversity in the Solanaceae. J Exp Bot , 5 3:
2001~2022
Ku HM, Liu J, Doganlar S, Tanksley SD (2001). Exploitation of
Arabidopsis-tomato synteny to construct a high-resolution
map of the ovate-containing region in tomato chromosome
2. Genome, 44: 470~475
Ku HM, Vision T, Liu J, Tanksley SD (2000). Comparing sequenced
植物生理学通讯 第 43卷 第 6期,2007年 12月1056
segments of the tomato and Arabidopsis genomes: large-scale
duplication followed by selective gene loss creates a net-
work of synteny. Proc Natl Acad Sci USA, 97: 9121~
91 26
Kyte J, Doolittle RF (1982). A simple method for displaying the
hydropathic character of a protein. J Mol Biol, 157: 105~132
Liu J, Van Eck J, Cong B, Tanksley SD (2002). A new class of
regulatory genes underlying the cause of pear-shaped to-
mato fruit. Proc Natl Acad Sci USA, 99: 13302~13306
Marchler-Bauer A, Anderson JB, Cherukuri PF, DeWeese-Scott C,
Geer LY, Gwadz M, He S, Hurwitz DI, Jackson JD, Ke Z et al
(2005). CDD: a Conserved Domain Database for protein
classification. Nucl Acid Res, 33: D192~D196
Nesbitt TC, Tanksley SD (2002). Comparative sequencing in the
genus Lycopersicon . Implications for the evolution of fruit
size in the domestication of cultivated tomatoes. Genetics,
162: 365~379
Opperman CH, Lommel SA, Sosinski B, Burke M, Lakey N, He L,
Brierley R, Salstead A, Gadani F, Hayes A (2003). The to-
bacco genome initia tive. Plant and Animal Genome XI
Conference, San Diego, CA, 2003
Rogers SO, Bendich AJ (1985). Extraction of DNA from milligram
amounts of fresh, herbarium and mummified plant tissues.
Plant Mol Biol, 5: 69~76
Seigneurin-Berny D, Rolland N, Garin J, Joyard J (1999). Technical
advance: differential extraction of hydrophobic proteins
from chloroplast envelope membranes: a subcellular-spe-
cific proteomic approach to identify rare intrinsic mem-
brane proteins. Plant J, 19: 217~228
Wang S, Chang Y, Guo J, Chen JG (2007). Arabidopsis Ovate
Family Protein 1 is a transcriptional repressor that sup-
presses cell elongation. Plant J, 50: 858~872
Wilkinson JQ, Lanahan MB, Yen HC, Giovannoni JJ, Klee HJ
(1995). An ethylene-inducible component of signal trans-
duction encoded by never-ripe. Science, 270: 1807~1809
Yen HC, Lee S, Tanksley SD, Lanahan MB, Klee HJ, Giovannoni
JJ (1995). The tomato never-ripe locus regulates ethyl-
ene-inducible gene expression and is linked to a homolog
of the Arabidopsis Etr1 Gene. Plant Physiol, 107: 1343~
1353