免费文献传递   相关文献

Phylogenetic Origin of BBCC Genome Allotetraploids in Oryza Revealed by Chloroplast Gene Sequences

利用叶绿体基因探讨稻属BBCC基因组物种的系统起源


基于9个叶绿体基因片段(atpA、atpB、matK、petA、psaA、psbA、psbB、psbCrbcL), 深入探讨了稻属(Oryza)3个BBCC基因组异源四倍体和5个与之相关的BB或CC基因组二倍体物种间的谱系关系。进一步的系统发育分析表明: 3个具有相同BBCC基因组的四倍体物种并非同一次物种形成事件的产物, 而是在不同的分布区经历了至少3次分别的物种起源。其中, 四倍体Oryza punctata的母本可能来自同样分布在非洲并具有CC基因组的二倍体物种O. eichingeri; 而四倍体O. malampuzhaensisO. minuta的母本则可能来自亚洲已经灭绝的具有BB基因组的不同二倍体。研究结果不但为追溯稻属异源四倍体的复杂网状进化提供了重要的分子证据, 而且拓展了我们对有花植物复杂物种形成的深入理解。

With 9 maternal heritable chloroplast gene fragments (atpA, atpB, matK, petA, psaA, psbA, psbB, psbC, and rbcL), we explored the lineage relationships of 3 BBCC genome allotetraploids and 5 related BB or CC genome diploids in the Oryza genus. Further phylogenetic analyses indicated that the 3 allotetraploid species did not originate from a common speciation event but occurred at least 3 times in different distribution areas. The maternal parent of the tetraploid O. punctata was possibly the Africa CC genome diploid O. eichingeri, whereas the maternal parent of O. minuta and O. malampuzhaensis was possibly 2 extinct Asian BB genome diploids. Our results provided important molecular evidence to track complicated reticular evolutionary processes for the polyploids and also broaden our understanding of the puzzling speciation histories of flowering plants.


全 文 :植物学报 Chinese Bulletin of Botany 2016, 51 (2): 175–183, www.chinbullbotany.com
doi: 10.11983/CBB15054
——————————————————
收稿日期: 2015-03-31; 接受日期: 2015-09-16
基金项目: 山东省自然科学基金(No.ZR2012CM024)
* 通讯作者。E-mail: baoyingus@126.com
利用叶绿体基因探讨稻属BBCC基因组物种的系统起源
杜家潇, 秦宗燕, 徐思, 景翔, 包颖*
曲阜师范大学生命科学学院, 曲阜 273165
摘要 基于9个叶绿体基因片段(atpA、atpB、matK、petA、psaA、psbA、psbB、psbC和rbcL), 深入探讨了稻属(Oryza)
3个BBCC基因组异源四倍体和5个与之相关的BB或CC基因组二倍体物种间的谱系关系。进一步的系统发育分析表明: 3个
具有相同BBCC基因组的四倍体物种并非同一次物种形成事件的产物, 而是在不同的分布区经历了至少3次分别的物种起
源。其中, 四倍体Oryza punctata的母本可能来自同样分布在非洲并具有CC基因组的二倍体物种O. eichingeri; 而四倍体
O. malampuzhaensis和O. minuta的母本则可能来自亚洲已经灭绝的具有BB基因组的不同二倍体。研究结果不但为追溯稻
属异源四倍体的复杂网状进化提供了重要的分子证据, 而且拓展了我们对有花植物复杂物种形成的深入理解。
关键词 二倍体, 异源四倍体, 谱系关系, 基因组
杜家潇, 秦宗燕, 徐思, 景翔, 包颖 (2016). 利用叶绿体基因探讨稻属BBCC基因组物种的系统起源. 植物学报 51, 175–
183.
稻属(Oryza)隶属禾本科(Poaceae), 尽管只包括
大约23个物种, 却是稻族(Oryzeae Dumortier)中种
类最多且分布最广的属(Lu et al., 2001)。该属广泛生
长于全球热带, 分布区横跨亚洲、非洲、拉丁美洲和
大洋洲(Vaughan, 1994), 其分类地位在禾本科乃至
单子叶植物中均非常重要。同时, 由于属内的栽培稻
(O. sativa)为全球近一半人口提供粮食 (Khush,
1997), 更使该属成为提高稻米产量和品质的直接基
因库而备受瞩目。鉴于稻属在系统分类研究和推动粮
食遗传改良过程中的重要价值, 理清属内的谱系起源
和进化关系, 无疑成为更好地开发和利用该属的关
键。虽然稻属的物种数目有限, 但物种间的遗传组成
和谱系关系却非常复杂。首先在倍性水平上, 稻属物
种即有二倍体又有四倍体, 并且种内两种倍性共存的
现象也比较普遍。其次, 属内基因组类型多样, 有多
达10种基因组类型, 其中二倍体物种的基因组构成
有AA、BB、CC、EE、FF和GG, 而四倍体物种则包
括BBCC、CCDD、HHJJ和HHKK (Aggarwal et al.,
1997; Ge et al., 1999)。稻属这种不同倍性水平和彼
此交错的基因组类型在少数物种内共存的现象, 使得
该属物种间除了具有以二倍体为主体的平行系统发
育关系外, 还增加了由异源四倍体复杂起源导致的网
状进化(Dally and Second, 1990; Ge et al., 1999;
Kumagai et al., 2010)。
在稻属众多的网状进化中, 具有BBCC基因组的
物种是稻属内唯一可以在现存二倍体物种内同时找
到2个亲本基因组(BB和CC)的四倍体。因此, 正确判
明这类四倍体的谱系来源无疑为阐明稻属四倍体复
杂的物种形成提供了契机。该基因组共包括3个物种,
即分布在印度的O. malampuzhaensis、分布在亚洲
和大洋洲的O. minuta以及分布在非洲的O. punc-
tata。但是, 目前具有BB基因组的二倍体仅在非洲的
O. punctata中以二倍的细胞型出现; 而具有CC基因
组的二倍体虽然涉及3个物种(间断分布在非洲和斯
里兰卡的O. eichingeri、分布在亚洲和大洋洲的O.
officinalis和分布在斯里兰卡的O. rhizomatis), 但其
分布格局却并未和现存的四倍体物种构成一一对应。
因此, 这3个具有相同基因组的四倍体是如何起源和
散布的一直令人困惑, 而对其母系来源究竟是BB还
是CC二倍体的问题, 早期基于特定样品的研究也未
能得出一致的结果(Ge et al., 1999; Bao et al., 2006;
Kumagai et al., 2010)。
·研究报告·
176 植物学报 51(2) 2016

叶绿体DNA被用于系统分类研究已有数十年 ,
正是由于它具有单系遗传且较少发生分子间重组的
特性被广泛用于植物亲缘关系评判和系统重建
(Dally and Second, 1990; Ge et al., 1999; Avise,
2000; Kumagai et al., 2010)。较之核基因, 叶绿体
DNA单系遗传的特性也为追溯异源四倍体的复杂网
状进化提供了最有力的分子证据。本研究中, 我们将
利用叶绿体在稻属中母系遗传的特点, 综合9个叶绿
体基因(atpA、atpB、matK、petA、psaA、psbA、
psbB、psbC和rbcL)的遗传数据, 从母本谱系的角度
进一步探讨3个BBCC基因组异源四倍体的起源问
题。本研究结果将拓展我们对稻属内复杂物种形成和
遗传多样性的全面理解, 同时也为更有效地利用这些
遗传资源提升栽培稻品质提供理论依据。
1 材料与方法
1.1 实验材料
本研究的稻属(Oryza L.)植物材料全部来自菲律宾国
际水稻研究所(International Rice Research Institute,
IRRI)种子资源库, 其中3个BBCC基因组四倍体按照
不同原产地各选取3个样品; 同时, 具有BB基因组(O.
punctata)和CC基因组的二倍体(O. eichingeri、O.
officinalis和O. rhizomatis)各选取1–2个样品。此外, 根
据以往的稻属系统学研究(Ge et al., 1999), 选2个具
有EE基因组的二倍体(O. australiensis)样品作为系统
发育分析的外类群(表1)。所有样品的倍性和基因组构
成均通过染色体计数以及实验室一直沿用的鉴定稻
属植物基因组构成的分子方法(Ge et al., 2001; Bao
et al., 2005)进行确定。
1.2 DNA提取、PCR扩增和测序
采用CTAB法(Doyle and Doyle, 1987)从样品鲜叶中
提取DNA。选取9个最常用于种级系统发育关系分析
的叶绿体基因atpA、atpB、matK、petA、psaA、psbA、
psbB、psbC和rbcL作为本研究的目的片段。其中除
了matK基因的部分序列(AY318858、AF48995、
AF148658–F148663、AF148667和KJ830774)来自
我们之前的研究(Ge et al., 1999; Bao and Ge, 2003)
以及O. minuta的1条序列(AC231139.1)来自AGI
(Arizona Genomics Institute)的Oryza OMAP项目
表1 稻属植物样品材料
Table 1 Plant materials of Oryza used in this study
Species Genome IRRI Acc. No. Origin
BB 103888 Tanzania Oryza punctata
Kotechy ex Steud. 101434 Tanzania
O. eichingeri A. Peter CC 105159 Uganda
O. officinalis Wall. ex
G. Watt.
CC 104973 China
O. rhizomatis D. A.
Vaughan
CC 103410 Sri Lanka
BBCC 80764 India O. malampuzhaensis
Krish. et Chand. 105223 India
105328 India
BBCC 104677 PhilippinesO. minuta J. S. Presl.
ex C. B. Presl. 105307 Philippines
103880 Philippines
O. punctata BBCC 105181 Uganda
104059 Nigeria
104975 Kenya
O. australiensis Domin EE 103303 Australia
105165 Australia


(Oryza Map Alignment Project) (Wing et al., 2005),
其它8个基因的序列均为本实验首次获取。8个基因的
PCR扩增引物信息详见表2。聚合酶链式反应在
Tgradient 96 (Biometra)热循环仪上完成。扩增反应
体系均为25 μL, 包括模板DNA 10–20 ng; 上下游引
物各0.2 µmol·mL–1; dNTP 20 mmol·mL–1; 扩增缓冲
液(Tris-HCl pH8.3,10 mmol·mL–1; MgCl2 20 mmol·
mL–1)和0.15单位的DNA聚合酶(TaKaRa, Cat No.
RR001Q)。基因扩增程序如下: 94°C预变性5分钟;
94°C变性 30秒 , 不同的温度 (petA: 49°C; atpB:
50°C; psaA: 51°C; rbcL和atpA: 53°C; matK、psbA、
psbB和psbC: 55°C)退火30秒, 72°C延伸1.5分钟; 35
个循环; 最后72°C延伸10分钟。PCR产物利用Star-
Prep Gel Extraction Kit (GenStar, Cat No.D205-04)
回收试剂盒纯化 , 测序工作在3100-Avant Genetic
Analyzer (Life Technologies)自动测序仪上完成。本
研究获取的全部序列在GenBank中的存储号为KP-
864461–KP864581。
1.3 数据分析
为全面比较9个基因对稻属B或C基因组以及相关物
种的分辨能力, 实验涉及的物种均先各选1个样品进
行初步的生物信息学统计分析, 然后根据分辨率大
杜家潇等: 利用叶绿体基因探讨稻属 BBCC基因组物种的系统起源 177

表2 引物序列
Table 2 The sequences of primers
Gene Primer sequences (5–3)
atpA AGGCTTACTTGGGTCGTGTT
TCCTCGGTGAATGTCTTGCT
atpB ATCCTACTACTTCTCGTCCC
AATTGCGATAATGTCCTGAA
petA TTGGGTAAAGGAACAGATGA
AATAACGGATGCGAAGAAGA
psaA TAGCAGGGTTATTAGGACTTG
ATGCGTGAATGTGATGGACT
psbA TCGGATGGTTCGGTGTTTTGA
AGGGAAGTTGTGAGCATTACG
psbB GGGTTTGCCTTGGTATCGTG
GGCTGTCTCCCTGTAGTTGG
psbC GGGTTGATTTTACTTCCGCAC
GAAGGTCCCAAAAACGCATAG
rbcL TATCTTGGCAGCATTCCGAGTAA
ATTTGATCGCTTTCCATATTTC


小, 选取合适的片段用于全部BBCC基因组样品的谱
系研究。所得序列的对位排列通过软件Seaview
(Gouy et al., 2010)完成。每个基因不同序列间的
Kimura 2-parameter遗传距离、基因组间和基因组内
变异大小等信息使用软件MEGA5 (Tamura et al.,
2011)进行计算, 系统发育重建采用最大似然法(ML)
通过应用软件PhyML_3.0 (Criscuolo, 2011)在默认
参数下完成。
2 结果与讨论
2.1 序列特点
由于本研究的主要目的是从单系的角度探讨BBCC基
因组四倍体的起源, 因此在分析单一基因片段的序列
特点时将外类群排除在外。9个基因共获得长7 460
bp的核苷酸片段 , 其中matK基因的片段最长 , 为
1 552 bp, psaA基因的片段最短, 为511 bp, 所有基
因片段的绝对长度和排列长度一致, 均没有出现插入
缺失。9个基因除matK基因的GC含量较低外(34%),
其它基因的GC含量相近, 为41%–45% (表3)。同时,
9个叶绿体基因片段在稻属BB、CC和BBCC基因组物
种内的变异程度不同。从核苷酸多样性水平来看, 最
多的单核苷酸多态性(Single nucleotide polymor-
phism, SNP)出现在matK基因片段, 多达16个, 而
petA基因则在多个物种中维持高度的序列一致性
表3 9个稻属叶绿体基因片段的序列特点
Table 3 Sequence characteristics for 9 chloroplast gene
fragments of Oryza
Gene name Length (bp) SNP GC (%)
atpA 997 3 42
atpB 673 3 43
matK 1552 16 34
petA 770 0 43
psaA 511 1 44
psbA 662 3 42
psbB 628 1 45
psbC 648 5 41
rbcL 1019 6 43
Total 7460 41 42
SNP: 单核苷酸多态性 SNP: Single nucleotide polymorphism

(SNP=0), 其它7个基因的SNP在1–6之间变动(表3)。
通过进一步比较这些SNP, 我们发现稻属B/C基因组
相关物种的序列分歧更多来自不同的基因组而非来
自物种之间的差异。例如, 在matK基因的16个SNP
中, 13个是B和C基因组之间的核苷酸变异; 而psaA、
psbA、psbB和rbcL各基因片段的SNP则全部来自B
和C基因组之间的碱基分化(表4)。不同基因矩阵内遗
传距离的成对比较分析表明, 3个BBCC基因组四倍
体物种和4个相关的二倍体物种之间的遗传距离是不
均衡的(图1)。8个叶绿体基因数据体现的一致性规律
为: 四倍体O. malampuzhaensis和O. minuta与具有
BB基因组的O. punctata二倍型的遗传距离明显小于
它们与3个CC基因组二倍体的遗传距离; 而四倍体
O. punctata则正好相反, 它和具有CC基因组的3个
二倍体的遗传距离较小, 但与其具有BB基因组的二
倍型的遗传距离则相对较大(图1)。此外, 当考虑四倍
体O. puncata与3个CC二倍体的遗传关系时, 8个基
因中只有2个(matK和psbC)能够给出一定的可分辨
信息(图1C, G), 即与O. officinalis的遗传距离最大,
与O. eichingeri的遗传距离最小。
2.2 系统发育分析
由于petA基因在稻属BB/CC基因组物种间高度保守
(sequence similarity=100%), 不适合用于系统发育
分析, 因此只对其它8个基因进行系统发育重建(图
2)。基于单个叶绿体基因构建的8个最大似然性ML树
显示了基本一致的系统发育关系, 即二倍体首先按照
基因组B或C进行聚类, 而3个四倍体则分别归入代表
178 植物学报 51(2) 2016

表4 9个稻属叶绿体基因片段的变异核苷酸位点
Table 4 Variable nucleotide sites of 9 chloroplast gene fragments of Oryza
Variable nucleotide sites Species (genome)
atpA atpB matK psaA psbA psbB psbC rbcL
O. punctata (BB) GGA GGC CTATATAATTCTTTCT C ACC G GAAA CTTGTC
O. punctata (BB) ... ... ................ . ... . .... ......
O. minuta (BBCC) A.. ... ................ . ... . .... ......
O. malampuzhaensis (BBCC) A.. A.. .......C........ . ... . .... ......
O. eichingeri (CC) AAC AAT TAGCGCCATCAACTTA T GTT A GGCG ACGACG
O. officinalis (CC) ... ... ........A....C.. . ... . C.A. ......
O. rhizomatis (CC) ... ... ................ . ... . ..A. ......
O. punctata (BBCC) ... ... ................ . ... . .... ......
灰色背景代表B基因组的同源序列, “.”表示与二倍体O. punctata的9个基因相同的核苷酸; 空白背景代表C基因组的同源序列, “.”表
示与二倍体O. eichingeri的9个基因相同的核苷酸。
Grey background indicates the homologous sequences with genome B, “.” indicates identical nucleotides to the 9 genes of the
diploid O. punctata; blank background indicates the homologous sequences with genome C, “.” indicates identical nucleotides to
the genes of the diploid O. eichingeri.



图1 BBCC基因组四倍体和其相关二倍体的对遗传距离
(A)–(H) 分别代表atpA、atpB、matK、psaA、psbA、psbB、psbC和rbcL基因片段。横坐标puBB、eiCC、ofCC和rhCC分别代表
BB基因组的二倍体O. punctata和CC基因组的二倍体O. eichingeri、O. officinalis和O. rhizomatis; 纵坐标为遗传距离。

Figure 1 Pairwise genetic distances of the BBCC genomic tetraploids and their related diploids
(A)–(H) Pairwise genetic distances of atpA, atpB, matK, psaA, psbA, psbB, psbC, and rbcL, respectively. x axis: puBB, eiCC,
ofCC, and rhCC represents diploid O. punctata with genome BB, and O. eichingeri, O. officinalis, and O. rhizomatis with genome
CC, respectively; y axis: Genetic distances


不同基因组序列的分支内。例如, 在atpA基因构建的
ML树上(图2A), BB基因组的O. punctata二倍型和CC
基因组的3个二倍体首先形成2个平行分支, 而四倍
体O. malampuzhaensis和O. minuta以及O. punc-
tata则分别内置在2个不同的分支(支持率分别为77%
和62%)中。纵观8个基因的分辨率发现, 如果单从基
杜家潇等: 利用叶绿体基因探讨稻属 BBCC基因组物种的系统起源 179




图2 叶绿体基因的最大似然树
(A)–(H) 分别基于个体基因atpA、atpB、matK、psaA、psbA、psbB、psbC和rbcL构建的最大似然性系统发育关系树; (I) 基于5个
基因(atpA、atpB、matK、psbA和psbC)合并数据的最大似然树; 分支上的数字表示大于50%的自展支持率; BBCC基因组异源四倍
体用粗体表示。

Figure 2 The maximum likelihood trees based on 8 and combined chloroplast genes
(A)–(H) The ML tree based on atpA, atpB, matK, psaA, psbA, psbB, psbC, and rbcL gene, respectively; (I) The ML tree based on
5 combined genes (atpA, atpB, matK, psbA, and psbC). Numbers near branches indicate bootstrap values above 50%, Boldface
indicates allotetraploid species with BBCC genome.


180 植物学报 51(2) 2016

因组划分的角度来看, atpA、atpB、matK和psbA均可
以将2个基因组进行有效的区分, 其中matK基因的分
辨率最好, ML树上代表不同基因组的2个分支均具有
非常高的支持率(90%和100%) (图1C)。但是, 如果进
一步考虑二倍体和四倍体的系统发育关系, 特别是3
个CC基因组二倍体和四倍体O. punctata的亲缘关
系, matK和psbC则具有较好的分辨能力。在由上述2
个基因构建的系统发育ML树上, 四倍体O. punctata
均和二倍体O. eichingeri以中等支持率聚成另外的小
分支(图2C, G)。因此, 在这8个叶绿体基因中, 针对
稻属B/C基因组相关的序列, matK显然是分辨率最好
的叶绿体基因。
为了进一步明确3个四倍体的母系关系, 我们对
5个分辨率相对较高的基因(atpA、atpB、matK、psbA
和psbC)扩大了样本量, 并利用合并基因构建了系统
发育关系树(图2I)。由合并的ML树不难看出, 其基本
的谱系进化规律和单基因构建的系统发育树是完全
一致的, 具有BB和CC基因组的二倍体分别构成并列
的2个高支持率的分支 (100%和97%), O. malam-
puzhaensis和O. minuta内置在BB基因组的分支内,
而O. punctata则分布在CC基因组的分支内。此外,
在BB基因组分支内, 并行的小分支(O. malampuz-
haensis分支和BB基因组二倍体分支)显示, 来自O.
malampuzhaensis与O. minuta的B基因组和来自二
倍型O. punctata的B基因组仍然存在一定的差异。同
时, 在CC基因组分支内, 四倍体O. punctata显然先
和O. eichingeri聚在一起, 然后再和另外2个二倍体
构成并系。
2.3 讨论
由于进化速率较快和单系遗传的特点, 细胞器DNA
被有效地用于判断不同等级生物之间的亲缘关系以
及评估种内居群的遗传结构和多样性水平 (Avise,
2000)。在稻属中, 叶绿体的进化速率是线粒体的3倍
(Tian et al., 2006), 加之特定的母系同源特点, 使叶
绿体基因摒弃了核基因双亲遗传所带来的并系困扰,
因此经常用于稻属植物的系统发育重建, 特别是四倍
体的谱系筛查(Dally and Second, 1990; Ge et al.,
1999; Kumagai et al., 2010)。我们早期基于单个叶绿
体基因的研究结果显示(Ge et al., 1999, 2002; Bao
et al., 2006), 3个BBCC基因组异源四倍体物种中的
O. malampuzhaensis和O. minuta的母本是来自BB
基因组的二倍体, 而O. punctata的母本是来自CC基
因组的二倍体, 这个结果和其他学者根据叶绿体和线
粒体DNA限制性片段多样性 (Dally and Second,
1990; Buso et al., 2001)得出的结果完全一致。但是,
也有学者基于叶绿体SSR及其侧翼序列(Nishikawa
et al., 2005)以及3个叶绿体基因片段(Kumagai et al.,
2010)得出, O. minuta的母本为CC基因组的二倍体,
而O. punctata的母本则可能分别来自不同的BB或
CC基因组的二倍体。本研究中, 我们扩大了叶绿体基
因的取样量, 选取了最常用于植物系统发育分析的9
个基因片段进行综合分析, 其中除了1个petA基因在
B/C基因组物种间不存在核苷酸变异外, 其余8个基
因构建的ML树均不同程度地支持O. minuta和BB基
因组二倍体以及O. punctata和CC基因组二倍体之间
具有更近的系统发育关系这一结论(图2)。
通过分析得出不同结论的Nishikawa等(2005)和
Kumagai等(2010)的工作, 我们认为这种不一致有可
能是真实的, 也有可能仅仅是实验误差所致。由于利
用叶绿体基因进行系统重建的过程中, 具有系统进化
信息的SNP相对较少, 因此诸如Taq酶误配等偶发事
件也可能影响最后系统发育树的拓扑结构。为此, 我
们重新检测了Nishikawa等(2005)和Kumagai等(2010)
中采用的基因 (AB128166–AB128767、AB436187–
AB436198、AB436246–AB436257和AB436306–AB-
436316), 并查询比对了GenBank (http://www.ncbi.
nlm.nih.gov/)内稻属BBCC基因组物种中来自其它样
品编号的同源序列(如四倍体O. punctata)已经释放
的几个基因序列(FJ908309、FJ908307和FJ908581)
以及物种O. minuta (taxid:63629)的高通量基因组序
列(HTGS) (AC231139)等。结果发现, Nishikawa等
(2005)和Kumagai等(2010)的序列与GenBank内其
它来源的相同基因均存在明显的SNP差异。由于这些
SNP并非来自一个片段, 而且以上两个研究(Nishika-
wa et al., 2005; Kumagai et al., 2010)之间还有取样
重叠, 如O. minuta均选取了W1213这个编号的样品,
因此单纯将这些序列分歧归咎为PCR扩增或测序过
程中碱基错配等原因是不足以令人信服的。当然, 实
验的误差也可能来自取样的错误, 即样品最初的鉴定
错误。由于Nishikawa等(2005)和Kumagai等(2010)的
植物材料全部来自日本国家遗传所(National Institute
杜家潇等: 利用叶绿体基因探讨稻属 BBCC基因组物种的系统起源 181

of Genetics, Japan), 而公共种子库中样品鉴定失误
或混样的情况并不少见。例如, 之前我们研究国际水
稻所种子库中64份样品的基因组构成时, 发现样品
存在鉴定错误的问题(Bao et al., 2005)。这类问题在
Aggarwal等 (1999)的研究中也曾提及 , 而Buso等
(2001)的工作中更是发现在O. minuta内有CC基因组
的二倍体混入现象。因此我们也有理由怀疑目前
Nishikawa等(2005)和Kumagai等(2010)系统发育树
上得出的O. minuta和CC基因组二倍体聚合在一起的
情况是否就是由于这个O. minuta本身就是CC基因组
的二倍体? 值得一提的是, 我们在查询Kumagai等
(2010)上传到GenBank的所有基因序列时, 发现其
中一份具有GG基因组的O. granulata样品(W0003),
所涉及的3个叶绿体高变区片段中的2个(AB436217
和AB436276)与上述研究中的具有CC基因组的二倍
体序列完全一样, 尽管这个编号样品最终并没有用于
正式的系统树构建中, 但是这种情况的存在说明同批
次的样品间有可能出现混样或基因渗入的情况。当然,
不同BBCC基因组四倍体母系的来源迥异也可能是由
于物种内的确存在随机的母系起源。因此, 开展大范
围取样和基于分子和形态相互结合的深入研究对于
澄清该问题是十分必要的。
此外, 从我们构建的ML树上(图2)也可以发现,
在3个CC基因组二倍体中 , 分布在非洲的O. eich-
ingeri和四倍体O. punctata表现出更近的亲缘关系,
说明该种有可能是同样分布在非洲的四倍体O.
punctata的直系母本。这个推测与我们早期利用SSR
评价稻属B/C基因组遗传多样性和系统发育关系(Bao
et al., 2006)时所得出的3个BBCC基因组四倍体异域
多次起源的结果相吻合。另外, 在合并的ML树上(图
2I), BB基因组二倍体并没有与2个BBCC基因组四倍
体直接聚合在一起, 而是另外形成一定枝长的小分支
与四倍体并行。同时, O. malampuzhaensis的3个样
品单独聚成独立分支, 并没有和O. minuta混合在一
起。尽管以上各分支的支持率并不高, 但是这种拓扑
结构暗示, O. malampuzhaensis和O. minuta这两个
物种的B基因组可能和现存于O. puncata二倍型内的
B基因组稍有不同, 并且彼此之间也存在一定的差
异。事实上, 类似的拓扑结构在以往基于不同核基因
构建的系统发育树上就有发现 (Ge et al., 1999;
Wang et al., 2009; Bao et al., 2010)。从目前的地理
分布格局来看, O. malampuzhaensis仅特产于印度
的局部区域, 而O. minuta也只是在亚洲和大洋洲的
新几内亚出现, 但是在相应的分布区均不存在BB基
因组的二倍体物种。同时, 目前多个叶绿体基因的序
列分析显示, 分布在非洲的O. puncata二倍型和O.
malampuzhaensis及O. minuta三者之间, 在B基因
组序列上存在明显的SNP差异(表4)。由于稻属叶绿体
基因在物种内具有高度的保守性, 因此O. malam-
puzhaensis和O. minuta内的B基因组很有可能是来
自O. puncata之外的物种。利用FISH方法, Wang等
(2009)也发现, O. puncata二倍型中的B基因组与O.
malampuzhaensis中的B基因组具有显著差异。
由此, 我们可以推测, 稻属3个具有相同BBCC
基因组的四倍体并非源自一次共同的物种形成事件,
而是经历了发生在不同分布区的、分别由BB或CC基
因组二倍体作为母本的至少3次的独立起源。其中分
布在非洲的O. puncata四倍型可能是它的二倍型与
O. eichingeri本地杂交并多倍化的产物, 而O. mala-
mpuzhaensis和O. minuta则可能是亚洲等地已经消
失的不同BB基因组二倍体作为亲本而分别衍生的后
代谱系。今后基于叶绿体全基因组的比较将有助于更
全面地阐明这些复杂的谱系关系。
参考文献
Aggarwal RK, Brar DS, Khush GS (1997). Two new ge-
nomes in the Oryza complex identified on the basis of
molecular divergence analysis using total genomic DNA
hybridization. Mol Gen Genet 254, 1–12.
Aggarwal RK, Brar DS, Nandi S, Huang N, Khush GS (1999).
Phylogenetic relationships among Oryza species revealed
by AFLP markers. Theor Appl Genet 98, 1320–1328.
Avise JC (2000). Phylogeography: the History and Forma-
tion of Species. Cambridge: Harvard University Press. pp.
1–447.
Bao Y, Ge S (2003). Phylogenetic relationships among dip-
loid species of Oryza officinalis complex revealed by mul-
tiple gene sequences. Acta Phytot Sin 41, 497–508.
Bao Y, Lu B, Ge S (2005). Identification of genomic consti-
tutions of Oryza species with the B and C genomes by the
PCR-RFLP method. Genet Res Crop Evol 52, 69–76.
Bao Y, Wendel FJ, Ge S (2010). Multiple patterns of rDNA
evolution following polyploidy in Oryza. Mol Phylogenet
Evol 55, 136–142.
Bao Y, Zhou HF, Ge S, Hong DY (2006). Genetic diversity
182 植物学报 51(2) 2016

and evolutionary relationships of Oryza species with the
B- and C-genomes as revealed by SSR markers. J Plant
Biol 49, 339–347.
Buso GS, Rangel PH, Ferreira ME (2001). Analysis of
random and specific sequences of nuclear and cytoplas-
mic DNA in diploid and tetraploid American wild rice spe-
cies (Oryza spp.). Genome 44, 476–494.
Criscuolo A (2011). morePhyML: improving the phylogenetic
tree space exploration with PhyML 3. Mol Phylogenet Evol
61, 944–948.
Dally AM, Second G (1990). Chloroplast DNA diversity in
wild and cultivated species of rice (genus Oryza, section
Oryza). Cladistic-mutation and genetic-distance analysis.
Theor Appl Genet 80, 209–222.
Doyle JJ, Doyle JL (1987). A rapid DNA isolation procedure
for small quantities of fresh leaf tissue. Phytochem Bull
19, 11–15.
Ge S, Li A, Lu BR, Zhang SZ, Hong DY (2002). A phylog-
eny of the rice tribe Oryzeae (Poaceae) based on matK
sequence data. Am J Bot 89, 1967–1972.
Ge S, Sang T, Lu BR, Hong DY (1999). Phylogeny of rice
genomes with emphasis on origins of allotetraploid spe-
cies. Proc Natl Acad Sci USA 96, 14400–14405.
Ge S, Sang T, Lu BR, Hong DY (2001). Rapid and reliable
identification of rice genomes by RFLP analysis of PCR-
amplified Adh genes. Genome 44, 1136–1142.
Gouy M, Guindon S, Gascuel O (2010). SeaView version
4: a multiplatform graphical user interface for sequence
alignment and phylogenetic tree building. Mol Biol Evol
27, 221–224.
Khush GS (1997). Origin, dispersal, cultivation and variation
of rice. Plant Mol Biol 35, 25–34.
Kumagai M, Wang L, Ueda S (2010). Genetic diversity and
evolutionary relationships in genus Oryza revealed by
using highly variable regions of chloroplast DNA. Gene
462, 44–51.
Lu BR, Ge S, Sang T, Chen JK, Hong DY (2001). The
current taxonomy and perplexity of the genus Oryza
(Poaceae). Acta Phytot Sin 39, 373–388.
Nishikawa T, Vaughan DA, Kadowaki K (2005). Phyloge-
netic analysis of Oryza species, based on simple se-
quence repeats and their flanking nucleotide sequences
from the mitochondrial and chloroplast genomes. Theor
Appl Genet 110, 696–705.
Tamura K, Peterson D, Peterson N, Stecher G, Nei M,
Kumar S (2011). MEGA5: molecular evolutionary genet-
ics analysis using maximum likelihood, evolutionary dis-
tance, and maximum parsimony methods. Mol Biol Evol
28, 2731–2739.
Tian XJ, Zheng J, Hu SN, Yu J (2006). The rice mitochon-
drial genomes and their variations. Plant Physiol 140,
401–410.
Vaughan DA (1994). The Wild Relatives of Rice: a Genetic
Resources Handbook. Manila: International Rice Rese-
arch Institute. pp. 1–137.
Wang BS, Ding ZY, Liu W, Pan J, Li CB, Ge S, Zhang DM
(2009). Polyploid evolution in Oryza officinalis complex of
the genus Oryza. BMC Evol Biol 9, 250.
Wing RA, Ammiraju JS, Luo M, Kim H, Yu Y, Kudrna D,
Goicoechea JL, Wang W, Nelson W, Rao K, Brar D,
Mackill DJ, Han B, Soderlund C, Stein L, SanMiguel P,
Jackson S (2005). The Oryza map alignment project: the
golden path to unlocking the genetic potential of wild rice
species. Plant Mol Biol 59, 53–62.


杜家潇等: 利用叶绿体基因探讨稻属 BBCC基因组物种的系统起源 183

Phylogenetic Origin of BBCC Genome Allotetraploids in Oryza
Revealed by Chloroplast Gene Sequences
Jiaxiao Du, Zongyan Qin, Si Xu, Xiang Jing, Ying Bao*
School of Life Sciences, Qufu Normal University, Qufu 273165, China
Abstract With 9 maternal heritable chloroplast gene fragments (atpA, atpB, matK, petA, psaA, psbA, psbB, psbC, and
rbcL), we explored the lineage relationships of 3 BBCC genome allotetraploids and 5 related BB or CC genome diploids in
the Oryza genus. Further phylogenetic analyses indicated that the 3 allotetraploid species did not originate from a com-
mon speciation event but occurred at least 3 times in different distribution areas. The maternal parent of the tetraploid O.
punctata was possibly the Africa CC genome diploid O. eichingeri, whereas the maternal parent of O. minuta and O.
malampuzhaensis was possibly 2 extinct Asian BB genome diploids. Our results provided important molecular evidence
to track complicated reticular evolutionary processes for the polyploids and also broaden our understanding of the puz-
zling speciation histories of flowering plants.
Key words diploid, allotetraploid, lineage relationship, genome
Du JX, Qin ZY, Xu S, Jing X, Bao Y (2016). Phylogenetic origin of BBCC genome allotetraploids in Oryza revealed by
chloroplast gene sequences. Chin Bull Bot 51, 175–183.
———————————————
* Author for correspondence. E-mail: baoyingus@126.com
(责任编辑: 朱亚娜)