免费文献传递   相关文献

禾本科植物叶绿体基因组结构的系统进化研究



全 文 :中国农学通报 2011,27(30):171-176
Chinese Agricultural Science Bulletin
0 引言
叶绿体基因组为一环状四组分结构,2个片段的
反向重复序列 (IR,inverted repeat)被大单拷贝 (LSC,
large single copy)和小单拷贝(SSC, small single copy)
所隔开,基因组长度通常介于100 kb至200 kb之间,包
含 100~130个不同的基因。大约 80个基因编码蛋白
质,参与光合作用、基因表达。其余编码 tRNAs和
rRNAs。大多数高等植物的叶绿体基因组结构是稳定
的,基因数量、排列顺序及组成上具有保守性[1]。但有
些物种的叶绿体DNA发生多次的重排,如松树 [2]、豆
科[3]植物等。
禾本科植物作为人类粮食的主要来源、生物燃料
的资源,以及在生态上及进化上的重要性,引起了生物
学家极大的关注。人们观察到在进化过程中禾本科植
物叶绿体基因组进化速度加快[4],并发生了一系列结
构上的变化[5-6],因此禾本科植物为叶绿体基因组的进
化研究提供了很好的系统。以往的研究中,作为参照
的物种与禾本科植物亲缘关系较远,在系统分析时很
难确定某些变化是否仅在禾本科植物中发生。随着一
些近缘物种,如同为禾本目的香蒲(Typha latifolia L.)
的测序完成 [7],尤其是禾本科早期分化物种
Anomochloa marantoidea L.[8]及竹亚科的2个物种绿竹
基金项目:江苏省自然科学基金项目“水稻近缘物种中抗稻瘟病基因的克隆与利用”(BK2009235)。
第一作者简介:唐萍,女,1965年出生,江苏连云港人,副教授,博士,主要从事植物分子遗传与进化研究。通信地址:222006江苏省连云港市新浦区
圣湖路28号,连云港师范高等专科学校,Tel: 0518-85817779,E-mail: tp_6543@sina.com。
收稿日期:2011-07-01,修回日期:2011-09-18。
禾本科植物叶绿体基因组结构的系统进化研究
唐 萍 1,阮秋燕 1,彭 程 2
(1连云港师范高等专科学校/连云港市应用生物技术重点实验室,江苏连云港 222006;
2南京大学生命科学学院,南京 210093)
摘 要:为了探讨叶绿体基因组结构变化与系统发生的关系,以烟草为参照,系统比较了禾本科植物叶绿
体基因组结构的进化。结果发现:(1)大单拷贝序列上产生3个倒置;(2)3个基因accD、ycf1、ycf2退化;
(3)clpP、rpoC1内含子序列丢失;(4)IR与SC的边界变化,大都发生于科的水平,但也存在一定的层次
性。结构变化的系统发生与叶绿体基因内含子构建的系统进化树相一致。叶绿体基因组的结构变化可
以用于构建相关植物的系统发生。
关键词:叶绿体基因组;结构变化;系统进化
中图分类号:S184 文献标志码:A 论文编号:2011-1913
Phylogeny in Structure Alterations of Poaceae cpDNA
Tang Ping1, Ruan Qiuyan1, Peng Cheng2
(1Key Laboratory of Applied Biotechnology of Lianyungang, Lianyungang Teacher’s College, Lianyungang Jiangsu 222006;
2School of Life Sciences, Nanjing University, Nanjing 210093)
Abstract: The aim was to research the relationship between structure alterations of chloroplast DNA and
phylogeny. The structural alterations of the chloroplast genome found in grass chloroplast DNA in comparison
with that of tobacco was systematically surveyed. (1) three inversions in the large single-copy region; (2)
degradation of the gene accD, ycf1, ycf2; (3) deletion of intron in the gene clpP, rpoC1; (4) changes of IR/SC
bordery, mostly occurred at the family level, but some alterations showed time hierarchy. These phylogenetic
relationships were supported by the phylogenetic tree with introns of cpDNA. Structural analysis of the
chloroplast genome is applicable to the phylogenetic reconstruction of related plants.
Key words: cpDNA; structure alteration; phylogeny
中国农学通报 http://www.casb.org.cn
(Bambusa oldhamii L.)、麻竹 (Dendrocalamus latiflorus
L.)的叶绿体基因组的测序完成[9],可以更加系统地分
析禾本科植物叶绿体基因组的进化,为进一步探讨基
因组重排在系统发生构建中的应用提供有价值的参
考。
1 数据和方法
1.1 数据
研究选择了 18种植物的叶绿体基因组(表 1),包
含双子叶植物的烟草,单子叶的兰科植物(台湾蝴蝶
兰、文心兰),禾本目中香蒲科的香蒲,以及禾本科的
14个物种。从 http://www.ncbi.nlm.nih.gov/下载 18种
植物的叶绿体基因组序列。
1.2 方法
以NCBI上叶绿体DNA序列为库,用目标基因序
列进行Blastn,来判定库序列中的基因是发生了完全
丢失还是因为突变而丧失功能。
多重序列的比对采用ClustalW[10]法,选择默认参
数,序列间差异度的计算选用 Jukes-Canter校正。应用
MEGA v4.0[11]的 neighbor-joining(NJ)法中的 Kimura
2-parameter模型构建系统进化树,进行1000次重复。
2 结果与分析
2.1 基因数量的变化
比较了双子叶植物烟草、禾本目中的香蒲及14种
禾本科植物的叶绿体基因组中基因的数量及排列,发
现基因和内含子数量在所有的基因组中除了有少数不
同外,表现得十分保守。禾本科物种中缺失了 accD、
ycf1、ycf2基因。用香蒲叶绿体基因组的 accD、ycf1、
ycf2基因序列与禾本科植物进行比对发现(表 2),存
在一些保守的基因残留片段,说明在进化过程中,基因
序列发生了逐渐退化。ycf2基因比对时发现中间的片
段在禾本科中非常保守,ycf2残留在水稻、小麦中的各
有 734 bp,A. marantoidea中 768 bp。在黍亚科中超过
3000 bp,通过核苷酸差异度计算发现残余序列是保守
的,与香蒲的核苷酸差异度从 9.1%到 16.6%。黍亚科
中保留长的片段,早熟禾亚科、稻亚科及 A.
marantoidea中残留的片段较短。与 ycf2不同,ycf1大
约前 250 bp、后 300 bp表现出保守,在A. marantoidea
中残留的片段较长。但是与香蒲的核苷酸差异度从麻
竹的 16.8%增至A. marantoidea的 19.5%。而 accD情
况则完全不同,只在绿竹、麻竹、水稻、大麦、薏苡中发
现很短的残留片段,与香蒲的差异度高达30%以上,其
他基因组中已完全退化。
在烟草、香蒲基因组中 18个基因存在内含子
(intron),而在禾本科植物中A. marantoidea 17个基因
存在内含子,clpP内含子发生了丢失。其余13个物种
除了clpP外,rpoC1内含子也没有发现匹配的片段。
以上数据说明基因退化发生于禾本科植物物种分
化之前。而内含子丢失则不同,禾本科植物最初分化
产生的物种发生 clpP基因内含子的丢失,随后又发生
了 rpoC1内含子丢失。至于 rpoC1内含子丢失发生于
分化的哪一阶段还有待于禾本科中更多的亚科植物测
序完成。
在羊茅叶绿体基因组中缺失了 rps14和 ycf4基
因。用同属的黑麦草的 rps14和 ycf4基因去NCBI以
羊茅的叶绿体基因组为库进行Blastn,获得全序列的
rps14、ycf4的对应片段,二者之间配对序列的核苷酸
差异度仅为 10.5%、2.4%。但是在羊茅中的配对序列
中发生多次非 3倍数碱基的插入 (insertion)、缺失
(deletion)(图 1),造成移码突变,从而导致基因的丢
失。
2.2 基因排列顺序的变化
比较禾本科植物与香蒲、兰以及烟草中叶绿体基
因组上基因排列的顺序及转录方向发现,禾本科中的
物种发生了变化(图 2),出现 3次倒置(inversion),第 1
次为从 trnR至 trnfM,大约 28 kb,第 2次为 trnG至
psbD,大约6 kb,第3次倒置为 trnT区域,小于1 kb,两
个大的倒置重叠,说明28 kb倒置发生于6 kb之前。香
中文名
茄科
兰科
香蒲科
禾本科
烟草
文心兰
台湾蝴蝶兰
香蒲
高粱
玉米
甘蔗
薏苡
野生稻
绿竹
麻竹
短柄草
剪股颖
小麦
大麦
羊茅
黑麦草
拉丁名
Nicotiana tabacum L.
Phalaenopsis Aphrodite L.
Oncidium Gower Ramsey L.
Typha latifolia L.
Sorghum bicolor L.
Zea mays L.
Saccharum officinarum L.
Coix lacryma-jobi L.
Oryza nivara L.
Bambusa oldhamii L.
Dendrocalamus latiflorus L.
Brachypodium distachyon L.
Agrostis stolonifera L.
Triticum aestivum L.
Hordeum vulgare L.
Festuca arundinacea L.
Lolium perenne L.
Anomochloa marantoidea L.
基因库中编号
NC_001879
NC_007499
NC_014056
NC_013823
NC_008602
NC_001666
NC_006084
NC_013273
NC_005973
NC_012927
NC_013088
NC_011032
NC_008591
NC_002762
NC_008590
NC_011713
NC_009950
NC_014062
表1 研究所选的18种植物叶绿体基因组
·· 172
唐 萍等:禾本科植物叶绿体基因组结构的系统进化研究
蒲与兰科物种没有观察到倒置的发生,在禾本科中14
个物种所有的基因序列完全相同,说明倒置发生于禾
本科植物的共同祖先。
2.3 IR序列边缘的变化
叶绿体基因组具有2个片段的 IR,IR与SC之间存
在 4个边界,IRb/LSC、IRb/SSC、IRa/LSC和 IRa/SSC。
古老的基因组进化时,IR边界的扩张与收缩使得有些
基因进入 IR区域或者有些基因进入单拷贝序列。每
个物种边界处序列复制的程度不同。以烟草为对照,
比较发现兰科植物、禾本目植物的所有成员LSC与 IR
的边界都发生了扩张(图3),使得 rps19和 trnH位于了
IR片段上,2个基因都从1个拷贝变成2个拷贝。叶绿体
基因组上存在高的基因转换(gene conversion)能力[12],确
保了 2个 IR序列的一致与稳定。对于禾本目物种来
说,这一扩张发生于它们的祖先分化产生之前。但在
剪股颖、大麦和高粱中情况又有所不同,rps19和 trnH
虽然出现2个拷贝,但是都位于LSC片段上,说明这3
个物种 IR向LSC扩张后又发生了收缩,收缩发生在扩
张之后。在 IR与SSC边界出现了不同的变化,烟草、
兰科中两物种以及香蒲的 rps15基因位于 SSC片段
上,而所有禾本科植物 rps15都位于 IR上为两个拷贝,
说明禾本科植物的祖先 IRa向SSC发生了扩张。在此
Query代表黑麦草的基因;Sbjct代表羊茅叶绿体基因组;数字代表碱基位点;“-”代表碱基缺失
图1 羊茅叶绿体基因组rps14、ycf4基因中的插入、缺失
·· 173
中国农学通报 http://www.casb.org.cn
扩张发生后,禾本科中不同物种的 IR与SSC边界又依
次发生了不同的演化。一种是 IRb/SSC边界的演化,
复制了部分片段(29 bp)的ndhF,这一变化发生于禾本
科植物PACCAD分化枝的黍亚科,高粱、玉米、甘蔗、
薏苡皆呈现此变化。另一种扩张发生于 IRa/SSC边界
处,ndhH基因发生了162~215 bp的复制。这一变化发
生于禾本科BEP分枝的稻亚科、早熟禾亚科和竹亚科
中的物种,以及禾本科中早期分化的A. marantoidea。
IR序列边缘的变化表现出进化的层次性。
2.4 系统进化分析
在系统进化分析时,通常采用蛋白序列构建进化
树[13]。Wu等[9]用叶绿体基因组中 61个蛋白序列进行
分析发现,竹亚科表现出与稻亚科的亲缘关系明显较
近,共同组成早熟禾亚科的姐妹群。而李德铢 [14]、
Zhang[15]等研究发现,竹亚科与早熟禾亚科的亲缘关系
较近。可能是在进行近缘物种分析时,由于蛋白序列
的保守性,物种间差异较小,造成一定的误差。为了进
一步确定禾本科植物各物种进化上的关系,以便准确
反应出结构进化的层次关系,采用叶绿体基因组的内
含子序列来构建进化树。从图 4看出,A. marantoidea
是禾本科植物中较早分化出的物种,其余13个物种分
成 2 支进化枝,BEP(Bambusoideae、Ehrhartoideae、
Pooideae) 进 化 枝 和 PACCAD(Panicoideae、
Arisdidoideae、 Centothecoideae、 chloridoideae、
Arundinoideae、Danthonioideae)进化枝。高粱、玉米、
甘 蔗 、薏 苡 属 于 PACCAD 进 化 枝 的 黍 亚 科
(Panicoideae)。在BEP进化枝中,分成了3个亚科,水
稻属于稻亚科(Ehrhartoideae),绿竹、麻竹属于竹亚科
(Bambusoideae),大麦、小麦、剪股颖、黑麦草、羊茅、
短柄草属于早熟禾亚科 (Pooideae)。从进化树分析,
物种
香蒲
玉米
甘蔗
高粱
薏苡
绿竹
麻竹
小麦
剪股颖
大麦
羊茅
短柄草
黑麦草
水稻
Anomochloa arantoidea
accD
1509 bp
0 bp
0 bp
0 bp
136/0.369
498/0.377
498/0.377
0 bp
0 bp
136/0.313
0 bp
0 bp
0 bp
253/0.348
0 bp
ycf1
5508 bp
1170/0.176
1170/0.172
1170/0.174
1150/0.173
1148/0.170
1148/0.168
1118/0.173
1148/0.193
1148/0.191
1152/0.185
1148/0.193
1152/0.192
1148/0.184
1720/0.195
ycf2
6882 bp
3106/0.161
3110/0.157
3108/0.156
3110/0.159
1738/0.144
1718/0.148
734/0.091
1738/0.160
1756/0.164
1746/0.162
1746/0.166
1750/0.163
734/0.091
768/0.100
表2 禾本目中物种accD, ycf1和ycf2的变化(长度/与香蒲比较的差异度)
箭头表示转录的方向
图2 禾本科植物中3次倒置的发生(未按比例)
·· 174
唐 萍等:禾本科植物叶绿体基因组结构的系统进化研究

rps15 rps19
trnH
trnH
rps19
truncated ndhH
SSC
ndhF
LSC LSC IRa IRb 剪股颖 大麦
trnH rps15
SSC
ndhF ndhH rps19
LSC LSC IRb IRa 烟草
台湾蝴蝶兰文心兰
trnH
rps19 trnH
rps15
SSC
rps19
LSC LSC IRb IRa
香蒲
rps19 trnH
trnH rps15
SSC
ndhF ndhH rps19
LSC LSC IRb IRa
水稻 小麦 短柄草
黑麦草 羊茅 绿竹
麻竹A. marantoidea trnH
truncated ndhH rps15
rps15
rps19 trnH SSC
ndhF ndhHrps19
LSC IRb IRa
玉米 甘蔗 薏苡
trnH
rps15
rps15
rps19 trnH SSC
ndhF ndhH rps19
LSC LSC IRb IRa
高粱 trnH
trnH
rps15
rps15
rps19 SSC
ndhF ndhH rps19
LSC LSC IRb IRa
灰色方框代表基因,基因和 IR长度不成比例
图3 18种植物叶绿体基因组中 IR片段的不同边界
图4 基于叶绿体基因内含子构建的系统进化树
·· 175
中国农学通报 http://www.casb.org.cn
BEP进化枝中竹亚科与早熟禾亚科亲缘关系较近,与李
德铢等[14]研究结果相同。禾本科植物结构变化的层次性
与进化树呈现的相关物种的亲缘关系相吻合。
3 结论与讨论
禾本科植物叶绿体基因组结构表现出快速的变
化,变化大多发生在科的水平上,为禾本科所有物种所
共有,与典型的叶绿体基因组相比呈现出多处的基因
重组。如,3次倒置的发生;由于序列退化丢失了 3个
基因。说明这些结构的变化发生于禾本科植物祖先形
成时。这与禾本科植物高的核苷酸替代率相匹配,说
明结构变化与进化速率呈现相关性。
禾本科植物叶绿体基因组结构上的变化又表现出
一定的层次性,clpP内含子的丢失发生于禾本科植物所
有物种中,但 rpoC1 内含子序列的丢失在 A.
marantoidea 未发生。在残留的 ycf1 序列中,A.
marantoidea为 1720 bp,其余 13种都为 1100~1200 bp。
在残留的 ycf2序列中,存在 3种长度不同的残留片段
(700~800 bp、1700~1800 bp、3100~3200 bp),最大的残
留发生在黍亚科,说明在禾本科植物中ycf2发生逐渐
的退化。竹亚科与早熟禾亚科残留片段长度相近,体
现出二者亲缘关系较近,共同组成稻亚科的姐妹群。
ycf1和ycf2基因残留的序列大都由于存在于 IR上,可
能由于 IR比单拷贝序列保守。IRb的扩张限于黍亚
科,IRa的扩张为稻亚科和早熟禾亚科共有。这一结
构上特征支持稻亚科和早熟禾亚科的姐妹群的关系。
基因退化、内含子丢失及 IR边缘的扩张体现的层次性
与用内含子构建的进化树体现的物种间的亲缘关系相
一致。但A. marantoidea在 ycf2退化、IR边缘扩张特
性上与稻亚科相近,其中原因还有待进一步研究。
目前还无法确定禾本目中分化产生禾本科时基
因、内含子丢失的分布程度,随着测序叶绿体基因组数
量的增多,一定能发现叶绿体基因组中基因、内含子丢
失的机制。
结构变化体现了物种间进化上的关系,因此结构
变化可以作为系统进化研究的一个参考。
参考文献
[1] Palmer J D. Comparative organization of chloroplast genomes[J].
Ann Rev Genet,1985(19):325-354.
[2] Strauss S H, Palmer J D, Howe G T, et al. Chloroplast genomes of
two conifers lack a large inverted repeat and are extensively
rearranged[J]. Proc Natl Acad Sci USA,1988,85(11):3898-3902.
[3] Palmer J D, Osorio B, Thompson W F. Evolutionary significance of
inversions in legume chloroplast DNAs[J]. Curr Genet,1988,14(1):
65-74.
[4] Smith S A, Donoghuem J. Rates of molecular evolution are linked
to life history in flowering plants[J]. Science,2008,322(5898):86-89.
[5] Katayama H, Ogihara Y. Structural alterations of the chloroplast
genome found in grasses are not common in monocots[J]. Curr
Gene,1993,23(2):160-165.
[6] Katayama H, Ogihara Y. Phylogenetic affinities of the grasses to
other monocots as revealed by molecular analysis of chloroplast
DNA[J]. Curr Genet,1996,29(6):572-81.
[7] Guisinger M M, Chumley T W, Kuehl J V, et al. Implications of the
Plastid Genome Sequence of Typha (Typhaceae, Poales) for
Understanding Genome Evolution in Poaceae[J]. J Mol Evol,2010,
70(2):149-166.
[8] Morris L M, Duvall M R. The chloroplast genome of Anomochloa
marantoidea (Anomochlooideae; Poaceae) comprises a mixture of
grass-like and unique features[J]. Am J Bot,2010,97(4):620-627.
[9] Wu F H, Kan D P, Lee S B, et al. Complete nucleotide sequence of
Dendrocalamus latiflorus and Bambusa oldhamii chloroplast
genomes[J]. Tree Physiol,2009,29(6):847-856.
[10] Higgins D, Thompson J, Gibson T, et al. CLUSTAL W: improving
the sensitivity of progressivemultiple sequence alignment through
sequence weighting, position-speci fi c gap penalties and weight
matrix choice[J]. Nucleic Acids Res,1994,22(22):4673-4680.
[11] Tamura K, Dudley J, Nei M, et al. MEGA4: molecular evolutionary
genetics analysis (MEGA) software version 4.0[J]. Mol Biol Evol,
2007,24(8):1596-1599.
[12] Khakhlova O, Bock R. Elimination of deleterious mutations in
plastid genomes by gene conversion[J]. The Plant Journal,2006,46
(1):85-94.
[13] Saski C, Lee S B, Fjellheim S, et al. Complete chloroplast genome
sequences of Hordeum vulgare, Sorghum bicolor and Agrostis
stolonifera, and comparative analyses with other grass genomes[J].
Theor Appl Genet,2007,115(4):571-590
[14] 李德铢,郭振华.竹亚科系统学和生物地理学研究进展及存在的问
题[J].云南植物研究,2002,24(4):431-438.
[15] Zhang Y J, Ma P F, Li D Z. High-throughput sequencing of six
bamboo chloroplast genomes: phylogenetic implications for
temperate woody bamboos (Poaceae: Bambusoideae[J]. PLoS ONE,
2011,6(5):20596.
·· 176