Abstract: Understanding the function of non-coding RNA is one important focus in the post-genomic era. This review aims to summary the catalytic and regulatory function of non-coding RNAs in RNA splicing. RNA members are the key players in splicing of three major groups of introns during RNA processing. Group I and group II introns catalyze their own excision and exon ligation, while snRNAs in spliceosome mediate the splicing of nuclear mRNA introns. Group I and group II introns are limited in bacterial and the organellar genomes of lower eukaryotes and plants, but all protein coding genes in nuclear genomes harbor nuclear mRNA introns and the intron number per gene is increased with the complexity of the organisms. A pre-mRNA containing multiple introns can produce several and even tens of thousands mRNAs and proteins through alternative splicing, which is responsible for the spatially and timely regulated proteome diversity in cells. Alternative splicing is determined by the specific interaction between the regulatory proteins and the regulatory RNA elements located in the pre-mRNA; systematic appreciation of their interactions in vivo is a key to reveal the regulatory network in genome expression.
Key words: intron non-coding RNA; splicing; catalytic; regulatory
全 文 :生命科学
Chinese Bulletin of Life Sciences
第 20卷 第 2期
2008年 4月
Vol. 20, No. 2
Apr., 2008
RNA在 RNA剪接中的功能:从催化到调控
张 翼
(武汉大学生命科学学院国家病毒学重点实验室,武汉 430072)
摘 要:对非编码RNA功能的认识是后基因组时代的一个研究焦点,本文主要介绍非编码RNA在 RNA
剪接中的催化和调控功能。在 RNA 加工过程中,三大类内含子的剪接都是由 RNA 成员主导。其中 I
型和 II型内含子能催化自身的切除和外显子连接反应;而核mRNA内含子的剪接则由剪接体里的小核
RNA主导。I型和 II型内含子存在于细菌、低等真核细胞和植物的细胞器内;而真核细胞的核编码蛋
白质基因内全部是核 mR NA 内含子,并且其数目随生物体的复杂性而显著升高。一个多内含子前体
mRNA通过选择性剪接产生多种,甚至上万种不同的mRNA和蛋白质,对蛋白质组的复杂度和时空表
达调控至关重要。选择性剪接调控由剪接调控蛋白特异识别和结合前体mRNA里所富含的顺式RNA调
控元件完成的;系统认识这两者之间的对应关系是揭示基因组表达调控网络的一把钥匙。
关键词:内含子非编码 R N A;剪接;催化;调控
中图分类号:Q 52 2 文献标识码:A
RNA functions in RNA splicing: from catalysis to regulation
ZHANG Yi
(The State Key Laboratory of Virology, College of Life Science, Wuhan University, Wuhan 430072, China)
Abstract: Understanding the function of non-coding RNA is one important focus in the post-genomic era. This
review aims to summary the catalytic and regulatory function of non-coding RNAs in RNA splicing. RNA
members are the key players in splicing of three major groups of introns during RNA processing. Group I and
group II introns catalyze their own excision and exon ligation, while snRNAs in spliceosome mediate the
splicing of nuclear mRNA introns. Group I and group II introns are limited in bacterial and the organellar
genomes of lower eukaryotes and plants, but all protein coding genes in nuclear genomes harbor nuclear mRNA
introns and the intron number per gene is increased with the complexity of the organisms. A pre-mRNA contain-
ing multiple introns can produce several and even tens of thousands mRNAs and proteins through alternative
splicing, which is responsible for the spatially and timely regulated proteome diversity in cells. Alternative
splicing is determined by the specific interaction between the regulatory proteins and the regulatory RNA
elements located in the pre-mRNA; systematic appreciation of their interactions in vivo is a key to reveal the
regulatory network in genome expression.
Key words: intron non-coding RNA; splicing; catalytic; regulatory
文章编号 :1004-0374(2008)02-0202-05
收稿日期:2008-02-29
基金项目:国家自然科学基金委重点项目(30330170) ;
“973”项目(2005CB724604)
通讯作者:Email: yizhang@whu.edu.cn
1 内含子和RNA剪接
Philip Sharp 1977年发现基因会被插入序列打断
(split genes),这些插入序列被称为内含子(intron)[1]。
内含子的发现及其在生物体内的广泛而重要的生物
学功能很快被科学界所认识,该发现于1993年获得
诺贝尔生理学或医学奖。打断正常编码序列的内含
子很快被发现存在于从细菌到人所有的生物体内,
并且也存在于噬菌体和病毒的基因组里。内含子不
203第2期 张 翼:RNA在 RNA剪接中的功能:从催化到调控
但打断蛋白质编码序列,也打断 rRNA和 tRNA编码
序列,而被内含子打断的编码序列被称为外显子
(exon)。由携带内含子的宿主基因转录成前体 RNA
必须经过内含子的剪除和外显子的拼接才能生成成
熟的信使 RNA(mRNA)、转运RNA(tRNA)或者核糖
体 R N A ( r R N A ),该分子过程称为 R N A 剪接
(splicing)。
按照剪接机制的不同,内含子被分为四类:即
I型内含子(group I intron)、II型内含子(group II
intron)、核mRNA内含子(nuclear mRNA intron),
以及 tRNA内含子(tRNA intron)[2]。前三类内含子的
剪接反应均与 R N A 的结构与功能密切相关,而
tRNA内含子的剪接是一个经典的酶催化反应,由
核酸内切酶切割,连接酶连接完成的,该文将不讨
论该类内含子剪接,有兴趣的读者请阅参考文献
[3]。I型和 II型内含子的剪接均由内含子自身进行
催化,所以也称为自剪接(spliceosome),而这两类
内含子因为具有催化功能被称为核酶(ribozyme)[2] ;
核mRNA内含子的剪接由剪接体(spliceosome)完成,
其剪接机制最复杂、调控最精细,且在自然界中分
布最广泛。研究发现剪接体里的小核 RNA(snRNA)
U2和 U6能催化转酯反应[4]。有趣的是,虽然 I型
内含子和 II型内含子都是自剪接核酶,但是它们的
结构和催化的化学机制显著不同,而 II型内含子却
与核mRNA内含子剪接使用同样的化学机制。
三类由RNA催化的内含子在自然界中的分布也
非常有趣。I 型内含子广泛分布于噬菌体、细菌、
真菌等低等真核生物体内,但其分布不具有显著的
进化保守性。我们最近的研究表明,从基因组里鉴
定的 I型内含子有约 17000个,而且它们在植物的
叶绿体 tRNA基因中相当保守(http://www.rna.whu.
edu.cn/gissd)[5]。I型内含子主要存在于细菌和细胞
器的 tRNA和 rRNA基因里,以及低等真核生物的核
rRNA基因里,也有少部分该类内含子存在于蛋白
质编码里;II型内含子广泛存在于细菌、以及低等
真核生物和植物的细胞器内,其分布在进化上也不
保守。目前所发现的 II型内含子仅有 200多个(http:/
/www.fp.ucalgary.ca/group2introns/)。与 I型内含子
不同的是,它主要插在蛋白质编码基因里。真核生
物的核编码蛋白质基因富含内含子,它们都是核
mRNA内含子,均由剪接体剪接。因此,II 型内
含子与核mRNA内含子剪接的化学机制相同,所插
入的基因也相似。而 I型内含子相对而言更加古老[6]。
内含子的进化是该领域研究的一个热点问题,“内
含子先出现”和“内含子后出现”的争论持续了
十几年到现在也没有解决。最近有人指出在真核生
物进化中存在一个无内含子的时期[7]。
2 I型内含子核酶是认识RNA催化和折叠机制的
模式分子
美国科学家Cech报道了嗜热四膜虫核糖体大亚
基 rRNA中的 I型内含子可以催化自身的剪接反应[8],
并且随后证明将该内含子进行加工改造后可反式催
化多种生化反应[2]。1983年美国科学家Altman发现
在 tRNA加工中起重要作用的内切酶 RNase P是由
RNA催化的[9]。催化 RNA(核酶)很快被科学界认识
和接纳,而这两位科学家也因此于1989年获得诺贝
尔化学奖。除这两类核酶以外,核酶也存在于病毒
基因组里,对病毒 RNA的成熟起重要作用,如锤
头型核酶、发夹型核酶和VS核酶等[10]。而 2000年
高分辨率核糖体晶体结构的解析使得争议了多年的
催化肽键形成的主角问题终于盖棺定论,它就是大
亚基核糖体 RNA,它也是目前所发现的最大的核
酶[11]。除了催化 RNA外,RNA在自然界中还起着
广泛的调控功能,如近年来被广泛关注的微小RNA
(miRNA),因为RNA在催化和调控方面的重要的生
物学功能,研究RNA分子结构与功能之间的关系就
显得尤为重要。
I型内含子催化的内含子切除和外显子拼接由两
步连续的转酯反应完成。第一步是由外源的鸟苷或
鸟苷酸衍生物(exoG)的 3羟基攻击 5剪接位点的磷
原子,并与内含子 5的第一个核苷酸形成 3-5磷酸
二酯键。第二步转酯由 5外显子的 3羟基攻击 3剪
接位点的磷原子,导致内含子的释放和外显子的连
接。这两步转酯反应发生在一个活性位点上,第一
步由 exoG占据活性位点,而第二步转酯反应由内
含子的最后一个保守的鸟苷(ωG)占据活性位点,所
以核酶的结构需要发生构型转换方可完成(图 1)。
在 I型内含子发现之前,tRNA一直被作为研究
RNA结构与折叠的模式分子。而在 I型内含子发现
之后,就取代了 tRNA 作为模式分子的地位[14]。原
因有几方面:(1)I型内含子具有催化活性,其折叠
状态可以通过催化活性反映出来,因此成为一类良
好的用来研究 RNA结构与功能的模式分子;(2)I型
内含子大小从 300 到 3 000 个碱基不等,含有更丰
富的结构元件[14] ;(3)虽然 I型内含子可以独立催化剪
接反应,但是已经发现多种蛋白质可以影响其折叠成
活性结构,所以研究这些蛋白质如何影响 I型内含子
折叠可以揭示RNA-蛋白质相互作用机制,以及蛋白
204 生命科学 第20卷
质在体内对RNA折叠的影响[12]。
为了认识 I型内含子的催化机制,科学家们付
出巨大努力来获得它的晶体结构。第一个 I型内含
子的晶体结构于 1996年获得,只含有一个结构域,
所以对催化机制没有任何帮助。2004- 2005年期
间,先后有三个包括催化结构域的 I型内含子高分
辨率晶体结构被解析,为人们认识RNA的催化机制
提供了重要的信息[13]。晶体结构表明,第二步转酯
反应需要两个镁离子作为辅助因子来完成[14],但是
第一步转酯的机制仍然不明。
近十几年的研究大大丰富了我们对 I型内含子
折叠机制的认识[15]。I型内含子具有丰富的结构单
元,不同的结构单元可以决定内含子不同折叠途
径,有些内含子容易陷入动力学陷阱,有些则不会[16]。
选择性结构(alternative structure)在I型内含子折叠中
普遍存在,有趣的是最近发现的核糖核酸开关
(riboswitch)就是通过不同结构的转换来完成基因表
达调控的。
除了实验生物学的手段,生物信息学对揭示 I
型内含子的结构和折叠特征也做出了重要贡献。完
整的 I型内含子三级结构于 1990年已被预测出[17],
与后来获得的晶体结构高度一致。I型内含子一级
序列的变异并非很大,但具有较为保守的二级结
构。对 I型内含子保守二级结构的分析为我们认识
I型内含子的起源、演化、以及预测它与蛋白质的
相互作用都起到重要的作用[18]。最近我们研究组发
表的 I型内含子序列和结构数据库(www.rna.whu.
edu.cn/gissd),预测了近 1800个 I型内含子精细的
二级结构和序列比对,收集了约 17 000种 I型内含
子的信息,为推进 I型内含子相关研究建立了一个
更大的平台[5 ]。
3 II型内含子和核mRNA内含子的剪接机制
这两类内含子也是通过两步连续的转酯反应完
成的。第一步转酯由 II型内含子里的第六结构域的
保守A或者核mRNA内含子里保守的分枝G攻击 5
剪接位点的磷原子。而第二步转酯则与Ⅰ型内含子
相同。最后外显子被连接,内含子以套马索结构被
释放出来。II型内含子与核mRNA内含子的剪接位
点均遵从 5-GT- G-3的规律。
自从 II型内含子核酶被发现以来,它的催化机
制、折叠和结构即受到广泛关注,但是因为它太
长,并且结构不稳定,对其结构的研究进展相当缓
慢,折叠研究也不易于进行。然而核mRNA的剪
接机器和机制的复杂度远远高于 II型内含子,所以
II型内含子作为核mRNA内含子剪接机制研究的一
种模式分子,其研究仍然受到很大重视[19]。另外值
得一提的是,I型内含子和 II型内含子都是可移动
的基因元件,而 II型内含子作为移动元件(mobile
elements),其移动机制和应用得到了广泛研究[20]。
核mRNA内含子的两步转酯剪接通过“剪接体
(spliceosome)”完成。剪接体包括 5种小核 RNA
(snRNA)和 150多种蛋白质。5种 snRNA与特定的
蛋白质形成 5 种相应的小核核糖核蛋白复合物
( snRN P),即 U1、U2、U4、U5 和 U6。首先,
U1识别 5剪接位点,U2识别保守的A分枝位点;
然后,U4-U5-U6复合物结合,U6取代U1结合 5
剪接位点,通过U5与U2的相互作用将保守的A分
枝位点带到 5剪接位点附近;随后U4释放,U2-U6
形成复合物(其RNA结构类似II型内含子核酶的第五
和第六结构域)催化内含子的切除和外显子的连接。
4 选择性剪接调控机制及其重要的生物学功能
伴随着基因组技术的日新月异,许多高等生物
基因组序列已清楚。令人瞩目的是,随着生物体复
杂性升高,其蛋白质编码基因的数目并无显著升
高,而每个基因平均的内含子数目却相应升高,这
暗示 RNA剪接的复杂度与生物体的复杂性高度相
关。譬如,人类内含子序列占总基因组的 2 4%,
大约20倍于蛋白质编码序列;每个蛋白质编码基因
平均有 7个内含子[21]。富含内含子的基因被转录成
前体mRNA后,可以通过多种不同的方式进行剪
接,生成多种成熟mRNA,称为选择性剪接或者可
变剪接。这些不同的成熟mRNA可以通过编码不同
功能的蛋白质增加蛋白质组的复杂度,也可以通过
包含终止密码子来关闭某个基因的表达[22]。
图1 I型内含子的自剪接过程
205第2期 张 翼:RNA在 RNA剪接中的功能:从催化到调控
前体mRNA的选择性剪接发生的频率很高,是
提高复杂生物体蛋白质组的复杂度的主要分子机
制。譬如,果蝇的 DSCAM基因有 24个外显子,
有些外显子的剪接方式多样,其第六个外显子就有
48种不同的剪接方式。从理论上讲,该基因通过选
择性剪接可产生 38 016种不同的mRNA和蛋白质[23]。
而人类基因组里由多个外显子构成的基因至少 74%
发生了选择性剪接,70%- 80%的选择性剪接产生
改变了的蛋白质产物[24]。
选择性剪接的方式是高度调控的,为细胞分化
和个体发育的时空控制提供了有效的调控基础[25]。
如果改变了正常的mRNA选择性剪接形式则会导致
发育异常与疾病[26,27]。果蝇的性别由可选择性剪接
决定是一个非常经典的例子,因为其性别决定最重
要的调控蛋白Sxl蛋白是一个选择性剪接调控蛋白,
而被它所调控的下游基因Tra也编码一个剪接调控因
子。选择性剪接调控在细胞分化中起着非常广泛的
作用。譬如,多嘧啶串结合蛋白 PTB是一个在多
种组织中均表达的剪接抑制因子,而它的同源基因
nPTB只在神经元细胞中表达,最近的研究表明由PTB
到表达的 nPTB转换调控程序化的神经元分化[28]。
选择剪接的调控是通过选择性剪接调控蛋白(反
式作用因子)识别前体mRNA中特异性顺式作用元件
而完成的(图 2)。如果明显增强相关内含子的剪接
水平,该 R N A 序列称为剪接增强子( s p l i c i n g
enhancer);如果降低相关内含子的剪接水平,该
RNA序列称为剪接沉默子(splicing silencer)。顺式调控
RNA序列既可以位于前体mRNA的内含子里,也可
以位于外显子里;位于内含子内的称为内含子剪接
增强子(ISE)或内含子剪接沉默子(ISS),而位于外
显子内的称为外显子剪接增强子(ISE)或外显子剪接
沉默子(ISS)。调控剪接位点选择的 RNA序列一般
较短,在前体mRNA里出现的频率很高。系统性
认识前体mRNA里的顺式作用元件与剪接调控蛋白
的相互识别和结合显然是揭示基因组表达调控网络
的钥匙之一。
5 选择性剪接调控研究展望
该领域目前有几个瓶颈问题:所发现的选择性
剪接调控蛋白太少,目前只有十几种;对已知的选
择性剪接调控蛋白在细胞内的调控靶标不清楚;对
调控的分子机制认识不全面。在技术更新快速的后
基因组世代,该领域的研究发展趋势已经或者将出
现以下特色:
5.1 研究方法将从单基因研究转向系统性研究 在
后基因组时代,面对庞大的基因组信息,深感我们
所知太少。原来单基因研究模式在一些方面还是很
有必要和价值的,但是系统化和高通量的研究模式
将在未来十年中慢慢走向主导地位。对极为复杂,
数目庞大的选择性剪接来说,其研究走向系统化势
在必行。
5.2 对选择性剪接机制的深入和全面研究 显而易
见,想要正确解码人类基因组和其他哺乳动物基因
组所包含的生命活动信息,以及相关的疾病机制,
全面和深入了解选择性剪接机制极为重要。新的研
究动向是在基因组范围内系统发现前体mRNA里的
顺式调控RNA元件和新的选择性剪接调控蛋白,并
系统认识这两者之间相互作用的对应关系及调控机
制等。
5.3 与疾病相关的选择性剪接研究的快速拓展 人
类健康问题是生命科学永恒的主题。全面鉴定与选
择性剪接相关的遗传性疾病和非遗传性疾病将无疑
是人们关注的焦点。深入认识选择性剪接的致病机
理将比以往更受关注。期待这方面的研究将为人类
健康做出重要贡献。
[参 考 文 献]
[1] Sharp PA. Split genes and RNA splicing. Cell, 1994, 77:
805-15
[2] Cech TR. Self-splicing of group I introns. Ann Rev Biochem,
1990, 59: 543-68
[3] Abelson J, Trotta CR, Li H. tRNA splicing. J Biol Chem,
1998, 273: 12685-8
[4] Valadkhan S, Manley JL. Splicing-related catalysis by pro-
tein-free snRNAs. Nature, 2001, 413: 701-7
图2 选择性剪接调控蛋白与前体mRNA里的顺式作用元件
206 生命科学 第20卷
[5] Zhou Y, Lu C, Wu QJ, et al. GISSD: group I intron sequence
and structure database. Nucleic Acids Res, 2008, 36(Database
issue):D31-7
[6] Cavalier-Smith T. Intron phylogeny: a new hypothesis.
Trends Genet, 1991, 7: 145-8
[7] Sverdlov AV, Csuros M, Rogozin IB, et al. A glimpse of a
putative pre-intron phase of eukaryotic evolution. Trends
Genet, 2007, 23: 105-8
[8] Cech TR, Zaug AJ, Grabowski PJ. In vitro splicing of the
ribosomal RNA precursor of Tetrahymena: involvement of
a guanosine nucleotide in the excision of the intervening
sequence. Cell, 1981, 27: 487-96
[9] Guerrier-Takada C, Gardiner K, Marsh T, et al. The RNA
moiety of ribonuclease P is the catalytic subunit of the
enzyme. Cell, 1983, 35: 849-57
[10] Doudna JA, Cech TR. The chemical repertoire of natural
ribozymes. Nature, 2002, 418: 222-8
[11] Steitz TA, Moore PB. RNA, the first macromolecular
catalyst: the ribosome is a ribozyme. Trends Biochem Sci,
2003, 28: 411-8
[12] Schroeder R, Barta A, Semrad K. Strategies for RNA folding
and assembly. Nat Rev, 2004, 5: 908-19
[13] Vicens Q, Cech TR. Atomic level architecture of group I
introns revealed. Trends Biochem Sci, 2006, 31: 41-51
[14] Stahley MR, Strobel SA. Structural evidence for a two-metal-
ion mechanism of group I intron splicing. Science, 2005,
309: 1587-90
[15] Woodson SA. Metal ions and RNA folding: a highly charged topic
with a dynamic future. Curr Opin Chem Biol, 2005, 9: 104-9
[16] Zhang BL, Xiao M, Lu C, et al. Fast formation of the P3-P7
pseudoknot: a strategy for efficient folding of the catalyti-
cally active ribozyme. RNA, 2005, 11: 59-69
[17] Michel F, Westhof E. Modelling of the three-dimensional
architecture of group I catalytic introns based on compara-
tive sequence analysis. J Mol Biol, 1990, 216: 585-610
[18] Haugen P, Simon DM, Bhattacharya D. The natural history
of group I introns. Trends Genet, 2005, 21: 111-9
[19] Fedorova O, Zingler N. Group II introns: structure, folding
and splicing mechanism. Biol Chem, 2007, 388: 665-78
[20] Lambowitz AM, Zimmerly S. Mobile group II introns. Ann
Rev Genet, 2004, 38: 1-35
[21] Venter JC, Adams MD, Myers EW, et al. The sequence of
the human genome. Science, 2001, 291: 1304-51
[22] Kriventseva EV, Koch I, Apweiler R, et al. Increase of func-
tional diversity by alternative splicing. Trends Genet, 2003,
19: 124-8
[23] Black DL. Protein diversity from alternative splicing: a chal-
lenge for bioinformatics and post-genome biology. Cell, 2000,
103: 367-70
[24] Johnson JM, Castle J, Garrett-Engele P, et al. Genome-wide
survey of human alternative pre-mRNA splicing with exon
junction microarrays. Science, 2003, 302: 2141-4
[25] Lopez AJ. Alternative splicing of pre-mRNA: developmen-
tal consequences and mechanisms of regulation. Ann Rev
Genet, 1998, 32: 279-305
[26] Hermiston ML, Xu Z, Weiss A. CD45: a critical regulator of
signaling thresholds in immune cells. Ann Rev Immunol,
2003, 21: 107-37
[27] Faustino NA, Cooper TA. Pre-mRNA splicing and human
disease. Genes Dev, 2003, 17: 419-37
[28] Coutinho-Mansfield GC, Xue YC, Zhang Y, et al. PTB/nPTB
switch: a post-transcriptional mechanism for programming
neuronal differentiation. Genes Dev, 2007, 21: 1573-7
化学所成功实现分子马达在蛋白微胶囊表面的组装
在科技部、国家自然科学基金委和中国科学院的支持下,胶体、界面与化学热力学院重点实验室的研究人
员在旋转分子马达的分子仿生组装方面取得新进展,研究工作发表在近期出版的Adv Mater (2008, 20: 601-5) 上。
细胞生长代谢的整个过程需要能量,绝大多数情况下能量由ATP的高能键水解而获得,而ATP又是通过ATP
合酶合成所得到。ATP合酶是线粒体、叶绿体和细菌中能量转化的核心酶,在跨膜质子动力势的推动下催化合成
ATP。近年来,借助分子马达的生物活性和特殊功能开发生物纳米器件用于信息存储和能量转化,已经成为当前
纳米生物技术研究领域的热点。
在前期工作中,该研究组将分子马达组装在聚合物微胶囊表面,用于ATP的生物合成,取得了阶段性成果
(Angew Chem Int Ed, 2007, 46: 6996; Biochem Biophys Res Comm, 2007, 354: 357)。利用“层层组装”技术制备了中
空聚电解质微胶囊,然后将ATP合酶成功组装到磷脂修饰的聚合物微胶囊上。研究表明组装后的ATP酶保留了
其生物功能,通过更换缓冲溶液改变体系的 pH值提供跨膜质子动力势,实现了ATP的生物合成。
在上述工作的基础上,研究人员借助共价键作用利用层层组装技术制备了中空血红蛋白微胶囊,然后在蛋白
微胶囊上组装了含ATP合酶的脂质体,从而将分子马达组装到血红蛋白微胶囊表面。利用葡萄糖氧化酶对葡萄糖
氧化水解产生的质子H+,形成了跨膜质子流,为ATP合酶合成ATP提供质子动力势(质子泵)。研究发现组装在
胶囊表面的ATP合酶仍然保留其催化合成功能,能够将ADP和无机磷酸盐合成ATP,并且合成的ATP能存储在
中空蛋白胶囊内部,使胶囊成为ATP的载体。这种生物兼容性的仿生体系研究有助于开发与构建新型的纳米生物
机器。
摘自 http://www.cas.ac.cn
·简 讯 ·