全 文 :·综述与专论· 2013年第11期
生物技术通报
BIOTECHNOLOGY BULLETIN
高等植物 nrDNA ITS(包括 ITS1、ITS2 和 5.8S
区)在核基因组中是高度重复的,这些拷贝位于同
一染色体或不同染色体上[1]。ITS 通常以不等交换
(unequal crossover)、基因转换(gene conversion)和
基因扩增(gene amplification)[2-4]等方式发生位点
内或位点间的致同进化(concerted evolution),因而
不同的 ITS 拷贝序列会基本趋于一致或完全一致,
这为 PCR 扩增产物直接测序奠定了理论基础。同时,
ITS 进化速率较快,能够提供较为合适的变异和信
息位点,因而被广泛应用于系统发育研究中。此外,
ITS 也是 DNA 条形码候选序列之一[5]。
然而,尽管一致进化在 rDNA 的进化中起着很
大的作用,但事实上 ITS 在植物基因组内存在多态
性。越来越多的研究发现,某些物种内甚至个体内
收稿日期 :2013-05-06
基金项目 :国家质检总局科技计划项目(2010IK273)
作者简介 :尤欢,女,硕士研究生,研究方向 :分子分类相关工作 ;E-mail :youhuan@outlook.com
通讯作者 :丁元明,男,研究员,研究方向 :植物及进出口检疫 ;E-mail :13808735816@163.com
植物 nrDNA ITS 假基因研究进展
尤欢1,3 周阿涛2,3 岳亮亮3 寸东义3 李旻3 丁元明3
(1. 云南农业大学植物保护学院,昆明 650221 ;2. 昆明理工大学生命科学与技术学院,昆明 650224 ;
3. 云南出入境检验检疫局,昆明 650228)
摘 要 : 核核糖体 DNA 内转录间隔区(nrDNA ITS)被广泛应用于植物系统发育研究中。近年来,发现在很多植物类群中
存在 ITS 假基因(pseudogenes),然而这些假基因在系统发育分析中的潜在价值往往被低估,甚至在部分研究中被忽略。主要介绍
假基因的生成、特性以及 ITS 假基因在植物系统学中的应用,并对 ITS 假基因的研究前景进行展望。
关键词 : ITS 假基因 进化 系统分析
Research on nrDNA ITS Pseudogenes in Plants
You Huan1,3 Zhou Atao2,3 Yue Liangliang3 Cun Dongyi3 Li Min3 Ding Yuanming3
(1. College of Plant Protection,Yunnan Agricultural University,Kunming 650221 ;2. Faculty of Life Science and Technology,Kunming
University of Science and Technology,Kunming 650224 ;3. Yunnan Entry-Exit Inspection and Quarantine,Kunming 650228)
Abstract: The internal transcribed spacer(ITS)of nuclear ribosomal DNA has been widely used for re-constructing phylogenies. In
recent years, the occurrence of ITS putative pseudogenes is well documented for many groups of plants, the potential utility of these pseudogenes
in phylogenetic analyses has often been underestimated or even ignored in part. In this review, we briefly summarize the formation mechanism of
pseudogenes, characteristics of ITS pseudogenes and the applications of the ITS pseudogenes on the phylogenetic study. In addition, the future
prospect of scientific researches on ITS pseudogenes was viewed.
Key words: ITS Pseudogenes Evolution Phylogenetic analysis
的 ITS 序列一致进化不完全,拷贝之间存在明显的
差异,包括一部分假基因序列。这一发现成为应用
ITS 序列进行进化分析的一个新的挑战,相应的系统
进化分析会因同一物种中多样化的序列类型而无法
构建出可靠的进化树[6]。但是,如果对这些 ITS 假
基因拷贝进行充分取样分析,可能会为系统进化和
物种形成研究提供全新的遗传证据。
1 假基因的产生
由于 ITS1-5.8S-ITS2 在一个或多个染色体位点
上的多个重复,rDNA 上基因位点在进化上易发生变
化,造成了整个进化过程中并不是所有的重复片段
都具有功能,其中的一部分退化成为假基因[7],除
非这些假基因序列从基因组中删除,或者通过协同
进化“拯救”这些假基因,否则基因组将成为这些
2013年第11期 15尤欢等 :植物 nrDNA ITS 假基因研究进展
假基因的“墓地”[8]。
假基因主要有两种产生途径(图 1),其中一种
途径是通过在基因组 DNA 复制过程中发生功能缺失
突变(如插入、缺失或者移码),这些复制后的基因
片段无法进行正常的编码,而形成沉默的冗余片段;
另一种途径是由 mRNA 转录物反转录成 cDNA 后随
机整合到基因组中,并在长期进化选择过程中因随
机突变积累而形成假基因[9,10]。
由于 ITS 假基因广泛存在于植物中,因此发现
个体内存在 ITS 序列多态性时,首先必须要鉴别其
中是否包含 ITS 假基因。ITS 假基因的检测方法已较
成熟,包括 5.8S 区的插入缺失状况、ITS 区的二级
结构特征及自由能、序列的替代模式、甲基化诱导
的核苷酸替代比率以及构树法[6],在相关研究中一
般会将以上多种检测方法相结合进行综合判断。ITS
假基因序列一般具有如下特征 :(1)CpG 和 CpNpG
位点上的甲基化诱导的替代增加 ;相反,ITS 功能拷
贝 拥 有 更 多 的 CpG 和 CpNpG 位 点[17];(2)5.8 区
变异增加,有些假基因 5.8S 区甚至出现长片段的缺
失[18],高度保守的 5.8S 区存在如此高的变异正是
假基因的特征之一 ;(3)GC 含量明显偏低。例如,
在 Song 等[19]的研究中,ITS 功能拷贝的 GC 含量为
68.2%-73.7%,另外两种类型的假基因 GC 含量分别
为 48.6%-58.8% 和 55.2%-56.9%。在苏铁属中,ITS
功能拷贝的 ITS1、ITS2 以及 5.8S 区的 GC 含量分别
为 64.4%、65.2% 和 55.4%,而 ITS 假基因相应区段
的 GC 含 量 分 别 为 52.2%、51.6% 和 44.8%[12], 这
表明其 GC 位点碱基突变频繁 ;(4)5.8S 二级结构
最小自由能明显偏高,表明其二级结构稳定性显著
降低[12,20];(5)ITS 假基因进化过程中的核苷酸置
换脱离了功能限制,倾向于中性进化[13,19];(6)由
于 ITS 假基因具有较低的 GC 含量和较低二级结构
稳定性,往往会因最先熔解而被优先扩增。在 PCR
反应液中添加适量的二甲基亚砜(DMSO)可以较
好的避免 ITS 假基因序列的扩增,并能提高功能 ITS
序列的扩增效率[12,14,18]。
3 ITS 假基因在植物系统学中的应用
3.1 植物中ITS假基因现象
自 Buckler 和 Holtsford[21]首先在玉蜀黍属(Ze-
a)中发现 nrDNA ITS 假基因以来,越来越多的植
物类群被报道存在 ITS 假基因。例如,Muir 等[11]
发 现 常 出 现 杂 交 的 岩 生 栎(Quercus petraea) 和
夏 栎(Quercus robur) 这 两 个 物 种 中 有 3 种 类 型
的 ITS 序列存在,其中有两种 ITS 序列类型为 ITS
假基因,且只有 ITS 功能序列适用于系统进化分
析。同样,周阿涛等[22]发现杂交成种的云南山茶
(Camellia reticulata)中存在大量的 ITS 假基因,这
DNA
RNA
࣐ᐕRNA
㳻ⲭ
䙄ᖴ2˖৽䖜ᖅ઼ケਈ
䶎࣐ᐕٷสഐ ࣐ᐕٷสഐ
䲿ᵪᮤਸ
cDNA
䙄ᖴ1˖༽ࡦ઼ケਈ
图 1 假基因的形成[10]
2 ITS 假基因的特性
假基因的定义不同于其他基因,仅局限于对
功能和表达特点的描述,而是具有独特的核苷酸序
列[6]。从这个意义上来说,ITS 假基因是非功能性
的,一般失去了转录功能,因而利用 RNA 反转录
合成 cDNA ITS 比较相关参数,可以很好地判断基
因组中 5.8S 序列是否具有功能[11,12]。然而,有研
究 通 过 反 转 录 PCR(RT-PCR) 从 茶 树(Camellia
sinensis)中不仅获得了 ITS 功能拷贝,同时也获得
了 ITS 假基因[13]。此外,在除植物外的其他生物类
群中也存在同样的情况。Keller 等[14]在蝗虫(Podisma
pedestris)中利用 RNA 反转录扩增 cDNA ITS 时发现
也存在假基因,这表明 ITS 假基因能够转录,其原
因可能是转录元件仍保留着功能。但是,能否转录
并不是基因功能性的标志[6],有些时候假基因的转
录产物较来自功能基因的转录产物更丰富[15]。ITS1
和 ITS2 区包含在初级转录产物中,并在前体 rRNA
加工时被切除,如果这个过程对假基因转录产物不
太有效,它们就能保留在细胞中,因而能成为反转
录 PCR 的模板[16]。这些研究表明存在一些 ITS 假
基因拷贝进入了细胞核的转录机制,尽管不一定在
活跃的核仁组织。
生物技术通报 Biotechnology Bulletin 2013年第11期16
些 ITS 假基因的变异位点显然较其他核基因更丰
富。Hughes 等[23]发现异源多倍体银合欢(Leucaena
leucocephala)中的一些假基因并不是基因沉默的结
果,而是来自其 2 倍体 母 本 Leucaena pulverulenta。
Bayly 等[17] 发现 ITS 假基因广泛存在于桃金娘科
(Myrtaceae)植物中,有趣的是,在系统树上有些假
基因与不同属的功能基因聚在一起,分析认为不同
类群的 ITS 假基因具有各自独立的起源,并且这些
ITS 假基因位点与功能位点可能继续进行着协同进
化。Hribova 等[24]在芭蕉科(Musaceae)中也发现
存在 ITS 假基因,并认为假基因对系统重建有负面
影响。Song 等[19] 利用竹亚族(Bambusinae)及其
相关植物的 ITS 序列进行系统分析时发现,存在 3
种类型的 ITS 序列,且都以 100% 的支持率分离开,
经鉴定有两种类型序列为假基因,考虑到利用假基
因可能对植物进化研究产生风险,因而在后续系统
发育分析中排除了这两种 ITS 假基因序列。以上诸
多研究表明 ITS 假基因在植物中广泛存在。
3.2 ITS假基因对植物系统学研究的影响
ITS 假基因对使用 ITS 拷贝建立物种系统进化树
有影响,不同起源时间的 ITS 假基因序列对系统树
结构会产生不同的影响。例如,Vijayan 等[25]获得
山茶(Camellia japonica)两种类型的 ITS 序列,这
些 ITS 假基因与功能性 ITS 拷贝聚在一起形成一个
单系群,仍然可以真实地反映物种之间的系统进化
关系,这样的 ITS 假基因可以认为是 shallow paralogy
(物种分化后复制产生的基因),对系统重建结果影
响较小 ;而在短柱茶(Camellia tenuiflora)中存在的
部分假基因化的 ITS 拷贝与不同物种的 ITS 拷贝聚
在一起,这样的 ITS 假基因可以认为是 deep paralogy
(即物种分化前发生的复制事件产生的基因),这些
基因往往对系统重建产生很大影响[6]。因此,在利
用 rDNA 对山茶属进行系统分析时应特别注意这些
旁系同源基因。
Ochieng 等[26]利用 ITS 对伞房桉属(Corymbia)
进行系统发育重建发现,ITS 功能序列并不支持该
属为单系属,但 ITS 假基因支持伞房桉属为单系
属,与该属的形态证据以及 SSR 的结果相一致,认
为 ITS 功能序列参与 RNA 转录要维持特定的二级结
构,需要进行必要的补偿性突变[27],这可能掩盖系
统发育信息,而假基因变异趋于中性,因而 ITS 假
基因甚至比其功能序列能够更好重建其物种进化关
系。在悬铃木属(Platanus)中,起源早于物种分化
的 ITS 假基因在系统发育树和网状进化树上形成一
个特殊的类群,能够清楚地反映物种间古老的杂交
事件[28]。在梨属(Pyrus)这个类群中,功能性 ITS
序列在梨属植物中分化程度较低,且在大多数供试
样本中存在高水平的个体内多态性,因此导出的系
统关系结果较混乱,而在梨属中发现存在一种在 5.8S
区共享 18 bp 突变的 ITS 假基因,这些假基因导出的
系统关系支持率高,关系明确,且在梨属植物中广
泛存在,具有较大的系统学价值[18]。同样,乳突球
属(Mammillaria)中存在部分 ITS 假基因能够清楚
地反映物种进化关系[29]。ITS 假基因序列的替代速
率相当快,为植物系统重建来说既是障碍又是新的
机遇,能提供更多有关 ITS 序列进化的信息,可以
改进重建的分子系统树。此外,进行系统关系研究时,
ITS 假基因往往比姊妹种更适合作为外类群[12,21]。
另一方面,起源较早的 ITS 假基因在进化上没
有功能限制,进化速率则较快,会存在很多突变累积。
系统发育重建时,就会有单个位点的多次反复突变
和长枝吸引(指在用系统发育分析方法分析一个有
限数据集时,由于高频率的相似变化和加速的进化
速率等因素的存在使序列达到相同状态,人为地将
这些不是来自于共同祖先的序列的代表分类元聚在
一起,使这些分类元之间相互“吸引”[30])等问题,
构建的基因树难以反映真实的物种进化关系[28],建
议在进一步分析时应该除去这些 ITS 假基因。由此
看来,ITS 假基因的系统应用价值需要具体分析,不
能笼统而言。
4 展望
ITS 假基因问题的发现虽然给系统进化研究带
来了一定的困难,但同时也提供了强有力的工具和
全新的研究思路。虽然对 ITS 假基因的研究已经取
得了较大进展,但 ITS 假基因的应用仍然面临较多
问题。
首先,在很多研究中,研究者往往把获得的
ITS 假基因当成是一个随机事件,而没有对 ITS 假
2013年第11期 17尤欢等 :植物 nrDNA ITS 假基因研究进展
基因进行深入研究,这些 ITS 假基因所包含的遗传
价值就鲜为人知了。其次,由于 ITS 拷贝数量较
大,很多假基因可能并没有被检测到,这也可能给
研究带来很大的不便。通过荧光原位杂交(FISH)
和基因组原位杂交(GISH)等方法,调查植物内的
nrDNA 在基因组中的分布状况尤为重要,这将有利
于我们了解 rDNA 假基因的确切位置,也有利于更
深入理解所研究类群的进化问题。相信随着研究方
法的不断改进和研究工作的不断展开,对植物 ITS
假基因的认识会越来越透彻,也会更有效、更广泛
地对其加以利用。
参 考 文 献
[1] Eickbush TH, Eickbush DG. Finely orchestrated movements :
evolution of the ribosomal RNA genes[J]. Genetics, 2007, 175(2):
477-485.
[2] Hillis DM, Moritz C, Porter CA, et al. Evidence for biased gene
conversion in concerted evolution of ribosomal DNA[J]. Science,
1991, 251(4991):308-310.
[3] Gonzalez IL, Sylvester JE. Human rDNA :Evolutionary patterns
within the genes and tandem arrays derived from multiple
chromosomes[J]. Genomics, 2001, 73(3):255-263.
[4] Kovari A, Matyasek R, Lim KY, et al. Concerted evolution of 18-
5.8-26S rDNA repeats in Nicotiana allotetraploids[J]. Biological
Journal of Linnean Society, 2004, 82(4):615-625.
[5] Li DZ, Gao LM, Li HT, et al. Comparative analysis of a large
dataset indicates that internal transcribed spacer(ITS)should be
incorporated into the core barcode for seed plants[J]. Proceeding
of the National Academy of Sciences of the United States of America,
2011, 108(49):19641-19646.
[6] Bailey CD, Carr TG, Harris SA, et al. Characterization of angiosperm
nrDNA polymorphism, paralogy, and pseudogenes[J]. Molecular
Phylogenetics and Evolution, 2003, 29(3):435-455.
[7] Makalowski W. Genomic scrap yard :genomes utilize all that
junk[J]. Gene, 2000, 259 :61-67.
[8] Álvarez I, Wendel JF. Ribosomal ITS sequences and plant
phylogenetic inference[J]. Molecular Phylogenetics and
Evolution, 2003, 29(3):417-434.
[9] Mighell AJ, Smith NR, Robinson PA, et al. Vertebrate pseudoge-
nes[J]. FEBS Letters, 2000, 468 :109-114.
[10] Chen SM, Ma KY, Zeng J. Pseudogene :lessons from PCR bias,
identification and resurrection[J]. Molecular Biology Reports,
2011, 38 :3709-3715.
[11] Muir G, Fleming CC, Schlötterer C. Tree divergent rDNA clusters
predate the species divergence in Quercus petraea(Matt.)Liebl.
and Quercus robur L.[J]. Molecular Phylogenetics and Evolution,
2001, 18(2):112-119.
[12] Xiao LQ, Möller M, Zhu H. High nrDNA ITS polymorphism in the
ancient extant seed plant Cycas :incomplete concerted evolution
and the origin of pseudogenes[J]. Molecular Phylogenetics and
Evolution, 2010, 55(1):168-177.
[13] 徐晶 . 茶 16S-26S rDNA 多态性与进化[D]. 上海 :复旦大学
生命科学学院 , 2008.
[14] Keller I, Chintauan-Marquier IC, Veltsos P, et al. Ribosomal DNA
in the grasshopper podisma pedestris :escape from concerted
evolution[J]. Genetics, 2006, 174(2):863-874.
[15] Fujii GH, Morimoto AM, Berson AE, et al. Transcriptional analysis
of the PTEN/MMAC1 pseudogene, psiPTEN[J]. Oncogene,
1999, 18(9):1765-1769.
[16] van Nues RW, Venema J, Rientjes JM, et al. Processing of
eukaryotic pre-rRNA :the role of the transcribed spacers[J].
Biochemistry and Cell Biology, 1995, 73(11-12):789-801.
[17] Bayly MJ, Ladiges PY. Divergent paralogues of ribosomal DNA
in Eucalypts(Myrtaceae)[J]. Molecular Phylogenetics and
Evolution, 2007, 44(1):346-356.
[18] Zheng X, Cai D, Yao L, et al. Non-concerted ITS evolution, early
origin and phylogenetic utility of ITS pseudogenes in Pyrus[J].
Molecular Phylogenetics and Evolution, 2008, 48(3):892-903.
[19] Song HX, Gao SP, Jing MY, et al. The evolution and utility of
ribosomal ITS sequences in Bambusinae and related species :
divergence, pseudogenes, and implications for phylogeny[J].
Journal of Genetics, 2012, 91(2):129-139.
[20] Queiroz Cde S, Batista FR, de Oliveira LO. Evolution of the 5.8S
nrDNA gene and internal transcribed spacers in Carapichea
ipecacuanha(Rubiaceae)within a phylogeographic context[J].
Molecular Phylogenetics and Evolution, 2011, 59(2):293-302.
[21] Buckler ES, Holtsford TP. Zea ribosomal repeat evolution and
mutation patterns[J]. Molecular Biology and Evolution, 1996, 13
(4):623-632.
[22] 周阿涛 , 岳亮亮 , 李旻 , 等 . 云南山茶(Camellia reticulata
生物技术通报 Biotechnology Bulletin 2013年第11期18
Lindl)nrDNA ITS 序 列 多 态 性 分 析[J]. 植 物 科 学 学 报 ,
2013, 31(1):1-10.
[23] Hughes CE, Bailey CD, Harris SA. Divergent and reticulate
species relationships in Leucaena(Fabaceae)inferred from
multiple data sources :insights into polyploid origins and nrDNA
polymorphism[J]. American Journal of Botany, 2002, 89(7):
1057-1073.
[24] Hřibová E, Čížková J, Christelová P, et al. The ITS1-5.8S-ITS2
sequence region in the Musaceae :structure, diversity and use in
molecular phylogeny[J]. PLoS One, 2011, 6(3):e17863.
[25] Vijayan K, Chung MC, Tsou CH. Dispersion of rDNA loci and its
implications on intragenomic variability and phylogenetic studies in
Camellia[J]. Scientia Horticulturae, 2012, 137 :59-68.
[26] Ochieng JW, Henry RJ, Baverstock PR, et al. Nuclear ribosomal
pseudogenes resolve a corroborated monophyly of the eucalypt ge-
nus Corymbia despite misleading hypotheses at functional ITS
paralogs[J]. Molecular Phylogenetics and Evolution, 2007, 44
(2):752-764.
[27] Petrov DA, Hartl DL. Pseudogene evolution and natural selection
for a compact genome[J]. The Journal of Heredity, 2000, 91(3):
221-227.
[28] Grimm GW, Denk T. ITS evolution in Platanus(Platanaceae):
homoeologues, pseudogenes and ancient hybridization[J].
Annals of Botany, 2008, 101(3):403-419.
[29] Harpke D, Peterson A. Non-concerted ITS evolution in Mammillaria
(Cactaceae)[J]. Molecular Phylogenetics and Evolution, 2006,
41(3):579-593.
[30] 黎一苇 , 于黎 , 张亚平 . 系统发育研究中“长枝吸引”假象概
述[J]. 遗传 , 2007, 29(6):659-667.
(责任编辑 狄艳红)