免费文献传递   相关文献

拟南芥芥子酶基因TGG6是花特异表达的假基因



全 文 :生 命 科 学 研 究 2007年
随着更多物种基因组测序计划的展开或完
成,人们对假基因的概念及其意义有了更新的
思考,并成为基因组学研究的一个热点[1].假基
因(pseudogene)被定义为核苷酸序列与相应正常
功能基因相似的,但不能合成功能蛋白质的失活
基因.假基因最初由 Jacq等[2]人提出.他们在非
洲爪蟾 DNA中克隆了一个 5SrRNA相关基因,
在与其相应功能基因比较后发现,这个基因的 5′
拟南芥芥子酶基因TGG6是花特异表达的假基因
汪 萌,伍祚斌,李定琴,孙雪飘,张家明 *
(中国热带农业科学院 热带生物技术研究所 热带作物生物技术国家重点实验室,中国海南 海口 571101)
摘 要:芥子酶是一类催化硫代葡萄糖苷水解的同工酶.TGG6是在拟南芥中新发现的芥子酶基因.从拟南芥
几个不同生态型中克隆了 TGG6基因的全长核基因和 cDNA片段.序列分析结果表明,所有供试的生态型的
TGG6基因都与拟南芥第3个芥子酶基因TGG3类似,在编码区存在 1个以上移码突变,不能编码完整多肽.
生态型Col-0第10个内含子的剪切边界还发生了缺失,导致内含子不能被切除.初步确定 TGG6是一个假基
因.然而,RT-PCR结果却表明TGG6在花器中特异性表达,说明 TGG6在进化的某个阶段可能是有功能的基
因,由于某种原因,该基因在进化过程中被失活.
关键词:拟南芥;芥子酶;TGG6;组织特异表达;花特异表达;假基因
中图分类号:Q78 文献标识码:A 文章编号:1007-7847(2007)04-0316-07
MyrosinaseGeneTGG6inArabidopsisthalianaisaFlower
SpecificPseudogene
WANGMeng,WUZuo-bin,LIDing-qin,SUNXue-piao,ZHANGJia-ming*
(StateKeyBiotechnologyLaboratoryforTropicalCrops,InstituteofTropicalBioscienceandBiotechnology,ChineseAcademy
ofTropicalAgriculturalSciences,Haikou571101,Hainan,China)
Abstract:Myrosinaseareagroupofisoenzymescatalyzingthehydrolysisofglucosinolates.TGG6isanew
myrosinasegenefoundinArabidopsisgenome.BothgenomicandcDNAfragmentsofTGG6genewere
clonedfromafewArabidopsisecotypes.AnalysisofthesequencesindicatesthatTGG6geneinalthetested
ecotypescontainsatleastoneframeshiftmutation,andcouldnotencodeanintactpeptide.Moreover,TGG6
inCol-0containsadeletionofintron10splicingborderleadingtotheresidingofintron10initsmRNA.It
couldbeconcludedthatTGG6wasapseudogene.SimilartoTGG3,anothermyrosinasepseudogene,TGG6
wasalsoobservedtobeexpressedinflower,suggestingthatTGG6wasonceafunctionalgeneinits
evolutionalhistory,forsomereason,itwasdisabled.
Keywords:Arabidopsis;myrosinase;TGG6;tissuespecificexpression;flowerspecificexpression;
pseudogene
(LifeScienceResearch,2007,11(4):316~322)
收稿日期:2007-09-27;修回日期:2007-11-20
基金项目:国家自然科学基金资助项目(30571064)
作者简介:汪萌(1981-),女,山东聊城人,硕士研究生,主要从事生物化学和分子生物学研究,Tel:0898-66984866,E-mail:wangmeng1981_wm@126.
com;张家明(1966-),男,湖北公安人,热带生物技术研究所研究员,博士生导师,通讯作者,主要从事作物遗传育种和分子生物学研究,Tel:
0898-66986190,E-mail:jmzhang@vip.163.com.
第11卷 第4期 生命科学研究 Vol.11No.4
2007年12月 LifeScienceResearch Dec.2007
第4期
端有16bp的缺失以及 14bp的错配,不具有正
常 5SrRNA的功能,因此,将这个截短的 5S
rRNA的相关基因描述为假基因.随着人类基因
组计划的完成和后基因组计划的实施,对占人类
基因组约90%的非编码序列的研究已经展开,预
计人类基因组中有约 20000种假基因[3,4].在线
虫、果蝇以及酵母等生物中也发现大量假基因[5~8].
假基因保留了祖先功能基因的残余拷贝,为研究
生物进化和基因组动态变化,分析基因复制与突
变等事件的年代以及频率,揭示基因组 DNA替
换、插入和缺失等事件的机制提供了重要线索.
此外测定假基因的分布可为新基因的预测以及鉴
定提供更好的帮助.
芥子酶(myrosinase,EC3.2.1.147)是一类硫
代葡糖苷酶,主要分布在白花菜目植物中,专一
降解硫代葡糖苷.芥子酶和硫代葡糖苷分别储藏
在不同的细胞中[9,10],当植物受到昆虫或病源伤害
时,芥子酶将硫代葡萄糖苷水解为异硫氰化合物、
硫氰化合物、腈或噁唑烷硫酮等有毒物质,抵御病
虫侵袭,因此认为“芥子酶/硫代葡萄糖苷”系统
是植物重要的防御系统.目前已在15个科500多
种双子叶植物中检测到芥子酶活性.其中,对十字
花科作物的芥子酶研究得较多.油菜和白芥等作
物的芥子酶基因家族由 MA、MB、MC3个亚家族
组成[11,12],共 20多个基因,其中部分基因已被证
实为假基因[13].
在拟南芥中,最初认为只有3个芥子酶基因[14~16],
其中第3个基因TGG3被证实为花特异表达的假
基因[17].由于 3个基因都不在根中表达[17,18],人
们却检测到根提取物的芥子酶活性,因此推测存在
更多的芥子酶基因.2001年 Nitz等[19]分离到一
个根特异表达的葡萄糖苷酶基因Pyk10,由于与
芥子酶基因相似性高,认为是芥子酶基因.但是由
于没有酶活性测定证据,而且Pyk10不具备芥子
酶关键特征位点,因此Pyk10不一定是芥子酶基
因.通过Blast分析,我们发现了 3个序列高度相
似的基因具有芥子酶基因的特征,分别命名为
TGG4、TGG5、TGG6.其中 TGG4、TGG5在根部特
异表达,酵母表达产物具有芥子酶活性,证明是芥
子酶基因 (待发表).TGG6在 DNA序列上与
TGG4和TGG5高度相似,但是在根部检测不到
表达.使用 TGG4和 TGG5的 cDNA序列与
GenBank中的TGG6基因组DNA序列比对,个别
内含子的剪切边界很难确定,因此难以断定
TGG6是否是有功能的基因.本研究同时从拟南
芥几个生态型克隆了 TGG6的核基因和 cDNA.
通过生物信息学分析,发现TGG6存在移码突变
和内含子剪切边界的突变,不能合成有功能的芥
子酶,具有假基因的特征,因此推测TGG6是一个
假基因.
1 材料与方法
1.1拟南芥生态型和种植方法
本实验所使用的生态型Col-O、Ba-O、Ws-0来
自 NotinghamArabidopsisStockCenter,England.
JM1、JM2由作者实验室收集保存.种子播种在标
准营养土上,4℃放置3d后转到培养室培养.培
养室温度20℃,光照16h/d,光照强度5000lx.
1.2总DNA的提取和TGG6基因的克隆
取拟南芥5种生态型植株的叶片,液氮研磨,
采用大连宝生物公司总 DNA提取试剂盒提取总
DNA.以基因特异引物G6F1(5′-ACCCGCTGAA
AAGCTCCATCAA-3′),G6R1(5′-GGCTTCCACTTA
TTTTGCAATGAACC-3′)扩增 TGG6基因组 DNA.
引物由上海闪晶生物公司合成,DNA聚合酶 LA
Taq来自大连宝生物公司.PCR产物克隆在pMD-
19T载体中,转化大肠杆菌(E.co1i)DH5α,酶切
鉴定后,由上海闪晶生物公司测序.每个生态型
TGG6基因至少测 3个克隆,以排除 PCR错误对
序列的影响.
1.3 RNA提取和反转录
分别取新鲜的拟南芥根、茎、叶、花、子叶和绿
色角果约 50mg,液氮迅速研磨,加入 500μL
Trizol试剂,剧烈震荡,按照上海申能博彩公司的
3STrizolTotalRNAIsolationKit试剂盒说明书进
行提取.电泳检测各样品的总 RNA质量和浓度.
以5μLRNA为模板,合成第一链 cDNA.按照上
海生工AMV第一链cDNA合成试剂盒说明书的
方法进行.cDNA的合成过体系如下:在一个
Eppendorf管中,加入各个组织的总 RNA5μL,
oligo(dT)1μL,RNase-FreeH2O6μL,轻弹混匀
离心后置于 70℃变性 5min,立即取出放置冰上
30s,然后加入以下试剂:缓冲液 4μL,dNTP2
μL,RNaseinhibitor1μL,轻弹混匀离心后37℃
反应5min,再加入AMV反转录酶 1μL,37℃水
浴1h,70℃/10min终止反应.
1.4 TGG6基因在拟南芥各器官组织中的表达分析
以上述第一链 cDNA为模板,用半定量 PCR
汪 萌等:拟南芥芥子酶基因TGG6是花特异表达的假基因 317
生 命 科 学 研 究 2007年
方法扩增 TGG6cDNA,在基因转录水平探讨
TGG6基因在拟南芥植株中的表达情况.PCR反
应体系(50μL):拟南芥 cDNA100ng(1.5μL),
dNTP4μL,10×PCRbufer5μL,上游、下游引物
G6F1、G6R1各 1μL,TaqDNA聚合酶 0.5μL,
ddH2O37μL.反应条件如下:95℃,2min;94℃,
30s,56.3℃,45s,72℃,1min30s,30个循环;
72℃,7min结束反应.以Act1基因的表达作为参
照.Actin基因的引物序列为:5′-GGCAAAAGGA
TGCTTATGTTGG-3′,5′-ATTTCACGCTCTGCTGT
GGTGG-3′.反应结束后取 5μL进行电泳检
测,照相.
PCR阳性的产物纯化后,连接至 pMD-19T
载体,进行蓝白斑筛选挑取阳性克隆,酶切鉴定后
送上海闪晶生物公司进行序列测定.
2 结果与分析
2.1 生态型Col-0的TGG6基因的失活突变
植物芥子酶基因一般都由12个外显子和11
个内含子组成.TGG4和 TGG5代表一个芥子酶
基因新家族.其基因由13个外显子和12个内含
子组成(待发表).TGG6基因序列与 TGG4和
TGG5相似型较高,基因结构也相似,由 13个外
显子组成.不过,将生态型 Col-0的 TGG6核基因
序列、cDNA序列与TGG4、TGG5基因序列比较发
现,在TGG6中存在4个移码突变,包括第1个外
显子中2个碱基的插入突变、第6个外显子中1
个碱基的插入突变、第9个外显子中4个碱基的
缺失突变以及第12个外显子中17个碱基的缺失
突变(图 1).这些突变都使 TGG6基因不能编码
正确的芥子酶.此外,Col-0的TGG6基因的第10
个内含子的 3′端剪切边界区域发生 9个碱基的
缺失突变(与TGG4比较),导致第10个内含子保
留在cDNA中,未被剪切.有趣的是,TGG6第10
个内含子的5′端的剪切边界与TGG4和TGG5一
样,是一个异常边界“GC”.
318
第4期 汪 萌等:拟南芥芥子酶基因TGG6是花特异表达的假基因 319
生 命 科 学 研 究 2007年
图3 TGG6基因的组织特异表达
(A)Actin基因 RT-PCR结果(对照);(B)TGG6基因 RT-
PCR结果;
1:子叶;2:角果;3:花;4:叶;5:茎;6~7:根;M:分子质量标准.
Fig.3TissuespecificexpressionofTGG6
(A)RT-PCRresultofactinascontrol;(B)RT-PCRresult
ofTGG6;
1:cotyledons;2:siliques;3:flowers;4:leaves;5:stems;
6~7:roots;M:MolecularMarker.
2.2 TGG6在花中特异表达
以拟南芥生态型Col-0为材料,从不同器官
中提取总RNA,结果如图2所示.由图2可以看
出RNA条带整齐,完整性良好,可以满足后续试
验的要求.
RT-PCR结果(图 3)表明,TGG6基因在花中
特异表达,在子叶、根、茎、叶和角果中都检测不到
表达.
2.3 不同生态型TGG6基因的克隆及多态性分析
分别从Col-0、JM1、JM2、Ws-0、Ba-0等拟南芥
生态型克隆 TGG6基因组 DNA和 cDNA,测序后
进行序列比较.结果发现,生态型 Ws-0和 Ba-0
与Col-0序列相似性接近100%,具有Col-0的所
有移码突变以及第10个内含子的剪切边界缺失.
但生态型 JM1和 JM2仅具有第 6个外显子的 1
个碱基的插入突变,其它突变位点都正常(表 1).
说明第6个外显子的插入突变是TGG6基因最早
发生的基因失活突变,它发生在拟南芥生态型分
化之前,而其它位点的突变发生在 JM1、JM2与
Col-0等生态型的分化之后.
图1拟南芥Col-0的TGG6基因与TGG4基因DNA序列比较
外显子部分用大写字母表示,内含子部分用小写字母表示.外显子发生移码突变处以及内含子剪切边界缺失处用下划线
标出.尽管TGG6是一个假基因,通过序列比对我们可以看出它同有功能的基因TGG4结构是相似的.
Fig.1ThecomparisonsofTGG6andTGG4DNAsequencesofArabidopsis
Exonsarepresentedincapitalleters,intronsinlowercases.Frameshiftmutationsitesandthedeletionsiteofintronsplicing
borderareunderlined.ThoughTGG6isapseudogene,thegeneorganizationremainsthesameasthefunctionalTGG4.
1 2 3 4 5 6 7
图2 从拟南芥不同器官提取RNA的电泳结果
1:子叶;2:角果;3:花;4:叶;5:茎;6~7:根.
Fig.2 TotalRNA isolated from diferentorgansof
Arabidopsis
1:cotyledons;2:siliques;3:flowers;4:leaves;5:stems;6~7:
roots.
1 2 3 4 5 6 7 M
1 2 3 4 5 6 7 M
(A)
(B)
320
第4期
图4 拟南芥6个芥子酶基因结构比较
Fig.4ThecomparisonsofgeneorganizationsofsixArabidopsismyrosianasegenes
3 讨论
在过去的几十年中,假基因一直被认为是分
子化石,是进化中基因突变的遗迹,没有功能,属
于“垃圾基因”.与相应的正常基因相比较,假基
因缺少正常基因的内含子,两侧有顺向重复序列
等.大多数假基因本身存在着多种遗传缺陷,例
如早熟终止密码以及移码突变等等,因而它们
的表达受到了抑制.但是近来科学家发现假基
因并不是“垃圾基因”,假基因在基因表达、调控
以及产生基因多样性等方面可能都扮演着极为
重要的角色,但到目前为止,其确切的作用机制
仍不清楚.
目前已在拟南芥中发现 6个芥子酶基因即
TGG1、TGG2、TGG3、TGG4、TGG5及TGG6(TGG4、
TGG5及TGG6未发表).其中TGG1、TGG2、TGG4、
TGG5已被证实是有功能的基因,TGG3是不能编
码完整芥子酶的假基因[17].本研究通过对5个拟
南芥生态型TGG6基因的序列、结构和表达研究,
发现TGG6基因在所有5个生态型中都存在第6
个外显子的插入型移码突变,导致基因不能编码
完整的芥子酶,因此认为TGG6与TGG3一样,是
一个假基因.由于 TGG6在基因序列中存在
TGG4和TGG5中的所有内含子,TGG6是在基因
重复发生后,再通过失活突变而形成的.然而,与
TGG3一样,TGG6也在花中特异表达,而且TGG6
在所有生态型中所共有的移码突变发生在第6个
外显子,与TGG3在所有生态型中所共有的移码
突变(第5个外显子)的位置非常接近(图4),这种
现象到底是必然还是巧合有待进一步研究.
表1 不同拟南芥生态型TGG6基因的多态性
Table1 PolymorphismofTGG6geneindiferentArabidopsisecotypes
2bpinsert
inexon1
1bpinsert
inexon6
4bpdel
inexon9
Lossof
Intron10~Exon11border
17bpdel
inexon12
Col-0
JM1
JM2
Ws-0
Ba-0
+
-
-
+
+
+
+
+
+
+
+
-
-
+
+
+
-
-
+
+
+
-
-
+
+
注:“+”表示有插入或缺失;“-”表示没有插入或缺失.
Notes:“+”indicatesthepresenceofdeletionorinsertion;“-”indicatestheabsenceofdeletionorinsertion.
TGG1
TGG2
TGG3
TGG4
TGG5
TGG6
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12 13
TGG1~3由12个外显子组成,TGG4~6由13
个外显子组成.其差别来自在 TGG1~3中的第 5
个外显子在TGG4~6中被1个内含子分割为两个
外显子.TGG6和 TGG3的表达特征与 TGG1和
TGG2在叶片、子叶、茎、花和角果中表达,TGG4
与TGG5在根部表达形成鲜明的对比.这些信息
暗示 TGG6和 TGG3可能还有某种未知的功能.
另外,由于TGG6和TGG3的突变发生在基因重
复之后,在进化的历史上是否还残留着功能基因,
并保存在某个地区的某种生态型中?TGG6和
TGG3为什么要发生突变?突变被自然选择所保
留的生物学意义是什么?这都是今后研究必须回
汪 萌等:拟南芥芥子酶基因TGG6是花特异表达的假基因 321
生 命 科 学 研 究 2007年
答的问题.
参考文献(References):
[1] ZHANGZ,GERSTEINM. Patterns ofnucleotide substitution,
insertion and deletion in the human genome inferred from
pseudogenes[J]. Nucleic Acids Res,2003, 1:5338-5348.
[2] JACQ C,MILLER J R,BROWNL E G G. A pseudogene in
5SDNAofXenopus Laevis[J]. Cell,1977,13:109-120.
[3] ZHANG Z, ERSTEIN M. The human genome has 49
cytochrome c pseudogenes,including a relic of a primordial
gene that still functions in mouse[J]. Gene,2003, 12:61-72.
[4] ZHANGZ,HARRISONP M,LIU Y,et al. Millions of years
of evolution preserved: A comprehensive catalogue of the
processed pseudogenes in the human genome[J]. Genome Res,
2003,13:2541-2558.
[5]许亮,卢向阳,易克,等.假基因的研究进展[J].生命的化学
(XU Liang,LU Xiang-yang,YI Ke, t al. Research progress
ofpseudogene[J]. Chemistryoflife) ,2003,23(6) :406-409.
[6]崔峰,夏家辉.关于假基因的研究进展[J].生命科学研究
(CUI Feng,XIA Jia-hui. On research progress of pseudogene
[J]. Life Science Research) ,1999,3(3) :203-209.
[7]黄志华,薛庆中.假基因的组成、分布及其分子进化[J].植物
学通报(HUANGZhi-hua,XUE Qing-zhong. Composition and
distribution of pseudogenes and their molecular evolution[J].
Chinese Bulletin ofBotany) ,2006,23(4) :402-408.
[8]吴浩,曹明富.假基因[J].生物学通报(WUHao,CAOMing-fu.
Pseudogenes[J]. ChineseBulletinofbiology),2005,40(5):20.
[9] HOGLUND A S,LENMAN M,FALK A,et al. Distribution of
myrosinase in rapeseed tissues[J]. Plant Physiol,1991,95
(1):213-221.
[10] KELLY P J, BONES A, ROSSITER J T. Sub-cellular
immunolocalization ofthe glucosinolate sinigrin in seedlings of
Brassica juncea[J]. Planta,1998,206(3):370-377.
[11] XUE J P,LENMAN M,FALK A,et al. The glucosinolate-
degrading enzyme myrosinase in Brassicaceae is encoded by a
gene family[J]. Plant Mol Biol,1992,18(2):387-398.
[12] THANGSTAD O P,WINGE P,HUSEBYE H,et al. The
myrosinase(thioglucoside glucohydrolase) gene family in
Brassicaceae[J]. Plant Mol Biol,1993,23(3):511-524.
[13] LENMAN M,FALK A,XUE J,et al. Characterization of a
Brassica napus myrosinase pseudogene: myrosinases are
members ofthe BGAfamilyof beta-glycosidases[J]. Plant Mol
Biol,1993,21(3):463-474.
[14] XUE J,JORGENSEN M,PIHLGREN U,et al. The myrosinase
g e family in Arabidopsis thaliana: gene organization,
expression and evolution[J]. Plant Mol Biol,1995,27(5):
911-922.
[15] CHADCHAWAN S,BISSHOP J,THANGSTAD O P,et al.
Arabidopsis cDNA sequence encoding myrosinase[J]. Plant
Physiol,1993,103(2):671.
[16] RASK L,ANDREASSON E,EKBOM B,et al. Myrosinase:
ene family ev lution and herbivore defense in Brassicaceae
[J]. Plant Mol Biol,2000,42(1):93-113.
[17] ZHANG J,PONTOPPIDAN B,XUE J,et al. The third
myrosinase gene TGG3 in Arabidopsis thaliana is a
pseudogene specifically expressed in stamen and petal[J].
Physiol Plant,2002,115(1):25-34.
[18] HUSEBYE H,CHADCHAWANS,WINGE P,et al. Guard cell-
and phloem idioblast-specific expression of thioglucoside
glucohydrolase1(myrosinase) Arabidopsis[J].PlantPhysiol,
2002,128(4):1180-1188.
[19] NITZ I,BERKEFELD H,PUZIO P S,et al. Pyk10,a
seed ingand root specific gene and promoter fromArabidopsis
thaliana[J]. Plant Sci,2001, 61(2):337-346.
《生物化学与生物物理进展》2008年征订启事
《生物化学与生物物理进展》是国内外公开发行的全国性学术期刊,由中国科学院生物物理研究所
和中国生物物理学会共同主办。主要报道生物化学、分子生物学、生物物理学及神经科学等领域的国内
外最新进展,设有微型述评、综述与专论、研究快报、研究报告、技术与方法等十几个栏目。自1974年
创刊以来,始终以推动生命科学发展和促进国家经济建设为宗旨,不断提高学术、编辑和出版质量。目
前已成为一个在我国生命科学、基础医学及其他相关领域具有一定影响、深受广大读者欢迎及专家好评
的学术期刊。1999年荣获首届中国期刊奖提名奖。被SCIE、CA等国际权威检索系统收录。ISI最新出
版的期刊引征报告表明,本刊2005年影响因子(即SCI影响因子)0.215。
本刊国际连续出版物号:ISSN1000-3282,国内统一刊号:CN11-2161/Q,邮发代号:2-816。本刊
为月刊(每月20日发行),国际标准开本(210 mm×297 mm), 120页,每本订价$48.00元(全年576.00元)。
若错过邮局订阅,请直接与编辑部联系。
编辑部地址:北京朝阳区大屯路15号中国科学院生物物理研究所
邮政编码: 100101
电话:(010)64888459;传真:(010)64889892
E-mail:prog@sun5.ibp.ac.cn
网址:http://www.pibb.ac.cn
·信息交流·
322