免费文献传递   相关文献

茄科植物叶绿体基因组插入、缺失和核苷酸替代的发生方式及影响



全 文 :HEREDITAS (Beijing) 2008 年 11 月, 30(11): 1506―1512
ISSN 0253-9772 www.chinagene.cn 研究报告


收稿日期: 2008−04−03; 修回日期: 2008−07−14
基金项目: 国家自然科学基金项目(编号:30570987)资助[Supported by the National Natural Science Foundation of China (No.30570987) ]
作者简介: 唐萍 (1965−), 女, 博士, 副教授, 研究方向:植物分子进化。E-mail: tp_6543@sina.com
通讯作者: 陈建群(1962−), 男, 教授, 博士生导师, 研究方向:植物分子进化。Tel: 025-83594720; E-mail: chenjq@nju. edu. cn
DOI: 10.3724/SP.J.1005.2008.01506
茄科植物叶绿体基因组插入、缺失和核苷酸替代的发生方式
及影响
唐萍, 王强, 陈建群
南京大学生命科学学院生物系, 南京 210093
摘要: 核苷酸替代和 indels(插入、缺失统称)发生是进化的重要动力。以茄科植物为研究对象, 探讨茄属中番茄
和马铃薯、烟草属中绒毛状烟草和普通烟草分化时叶绿体基因组 indels 和核苷酸替代的发生方式, 以及这两种
突变对基因组造成的影响。结果显示: indels 和核苷酸替代的发生都不是随意的。indels 发生在 A+T 丰富的区
域, 1 bp indels 占据总数的 30%以上, 大部分 indels 都为低于 10 bp 的较短片段。核苷酸替代表现出 Ts(转
换)/Tv(颠换)偏差, 但 T→G, A→C 颠换频率却明显增加。Ts/Tv 比值出现种属特异性, 番茄和马铃薯比较时替代
的 Ts/Tv 比值低于绒毛状烟草和普通烟草比较时 Ts/Tv 比值。不同物种替代的(A+T)/(G+C)比值有一定差异, 从
而影响基因组的(G+C)%, 此比值的差异与形成物种的生长习性有一定的关系。
关键词: 茄科植物; 叶绿体; 插入; 缺失; 核苷酸替代
The patterns and influences of insertions, deletionsand
nucleotide substitutions in Solanaceae chloroplast genome
TANG Ping, WANG Qiang, CHEN Jian-Qun
Biological Department, College of Life Science, Nanjing University, Nanjing 210093, China

Abstract: Nucleotide substitution and indels (insertions and deletions) events are the major evolutionary driving forces.
Comparisons of the indels and nucleotide substitution patterns were made in the chloroplast genomes between Solanum
lycopersicum L. and Solanum bulbocastanum L., Nicotiana tomentosiformis L. and Nicotiana tabacum L. in Solanaceae.
The influence of mutation on genome composition was analyzed. The indels and substitutions were not randomly
distributed throughout the chloroplast genomes. The indels were in AT-rich regions. One base pair indels accounted for
above 30% of the total indels. Most of the indels were short of 10 bp. The nucleotide substitutions showed Ts/Tv bias, but
transversion frequency of T→G and A→C was increased significantly. Ts/Tv rates were lineage-specific. The Ts/Tv rate
between S. lycopersicum and S. bulbocastanum was lower than that between N. tomentosiformis and N. tabacum.
(A+T)/(G+C) rates varied in different lineages, which had an influence on (G+C)% of genomes. The changes in the
(A+T)/(G+C) rates might correlate with the life histories of different species.
Keywords: Solanaceae; chloroplast; insertion; deletion; nucleotide substitution


第 11 期 唐萍等: 茄科植物叶绿体基因组插入、缺失和核苷酸替代的发生方式及影响分析 1507


植物在长期进化过程中不断地发生突变, 成为
新物种产生的动力之一, indels 和核苷酸替代是形成
突变的两种重要方式。Indels 是插入(Insertions)和缺
失(Deletions)的统称, 核苷酸替代可分为转换(Ts)和
颠换(Tv), 转换是嘌呤互换或嘧啶互换, 如 A 和 G
之间, C 和 T 之间互换, 形成 4 种转换方式; 颠换则
是嘧啶和嘌呤相互替换, 如 A 和 C、T, G 和 C、T
之间互换, 共有 8 种颠换方式。对基因组突变方式
的研究有利于人们更好地探究进化上的相关问题如
基因组的稳定性、错配修复、染色体复制误差等。
对于突变的发生人们进行了大量的研究, 发现
不管是插入、缺失的发生还是点突变的发生都不是
随意的[1, 2]。Indels 的发生位点及频率对序列的组成
具有很强的依赖性[3]。在碱基替代中, 如果各种类型
转换和颠换的发生频率相同, 则转换与颠换的比值
(Ts/Tv)应等于 0.5, 但往往此比值高于 0.5, 表现出
转换偏差[4]。Petrov 等[5]在研究果蝇和哺乳动物基因
组的非编码区时发现另一种替代的偏差, 生成的替
代碱基中 A和 T所占比例增大, 即(A+T)/(G+C)的偏
差。Yang 等[6]用线粒体的细胞色素 b 基因, 对原猴
亚目和类人猿亚目中物种进化过程中产生的碱基替
代方式进行了探讨, 发现 Ts/Tv 的比值具有种属特
异性。
前人对突变的研究大多集中在对动物基因组的
研究, 对植物的研究主要集中在禾本科植物, 在对
禾本科植物叶绿体基因组替代方式进行研究时发现,
突变位点两侧的碱基组成影响到突变位点的转换偏
差、GC→AT 变化的压力[7, 8]。Decker-Walters 等 [9]
采用叶绿体部分基因、内含子以及非编码区片段对
葫芦科中不同物种进化过程中的碱基替代模式进行
研究, 发现了一些不同的替代现象。为了更精确地
阐述植物叶绿体基因组进化时插入、缺失和替代的
发生方式, 我们选择茄科中茄属和烟草属的各两个
物种来进行研究, 通过采用选择参照序列的方法研
究进化过程中核苷酸替代以及插入、缺失的发生规
律, 了解突变发生的普遍规律性以及在茄科植物中
表现出的种属特异性, 探讨突变的发生对基因组造
成的影响及导致种属特异性现象的可能原因。
1 数据和方法
本文所用 5 种植物叶绿体基因组数据全部来源
于 NCBI。番茄 (Solanum lycopersicum L.), 编号
NC_007898; 马 铃 薯 ( 野 生 种 )(Solanum
bulbocastanum L. ), 编号 NC_007943; 绒毛状烟草
(Nicotiana tomentosiformis L. ), 编号 NC_007602;
普通烟草(Nicotiana tabacum L. ), 编号 NC_001879;
颠茄(Atropa belladonna L.), 编号 NC_004561。
5种植物分属于茄科的 3个不同属, 番茄和马铃
薯属于茄属 , 绒毛状烟草和普通烟草属于烟草属 ,
颠茄属于颠茄属。
所有的序列分析采用 Clustal W[10]法进行比对。
当对两叶绿体基因组序列进行比对分析时, 为
了判定在进化过程中 indels 的发生是一条序列上发
生了插入还是另一条序列上发生了缺失, 以及碱基
替代发生在哪条序列上, 发生了怎样的替代, 我们
选取一个基因组序列作为参照, 所选的参照序列应
与分析的两物种进化上关系较近, 但参照序列与任
一分析的物种间的关系要远于分析的两物种之间的
关系。在对茄属中番茄和马铃薯以及烟草属中绒毛
状烟草和普通烟草分化过程中插入、缺失, 核苷酸
替代方式进行分析时 , 我们选择颠茄作为参照序
列。因为从分类上来看颠茄属与茄属、烟草属同属
于茄科植物, 与茄属和烟草属进化上关系较近, 但
颠茄与茄属中番茄、马铃薯间进化上的关系要远于
番茄和马铃薯之间进化上关系, 同样颠茄与烟草属
中绒毛状烟草、普通烟草进化上关系远于绒毛状烟
草和普通烟草之间进化上的关系。
Perl 语言编写的程序用于分析在有一参照序列
的条件下, 在每一基因组上插入、缺失发生的数量,
长度以及插入、缺失序列片段的(G+C)%; 分析每一
条序列上每种替代的发生比例, 从而分析突变造成
的对基因组进化的影响。三序列比对时, 去除了一
些突变方式无法判定的位点, 如发生点突变时, 两
比对序列上碱基与参照序列都不相同, 无法判定替
代发生在哪一序列上, 并且发生了怎样的替代; 产
生 indels 处, 如果两条序列与参照都不完全相同则
无法判定此位点是发生了插入还是发生了缺失。这
一设定与 Zhang 等[11]设定相同, 去除这些不确定位
点, 确保统计数据的可信性。
2 结果与讨论
番茄(S. lycopersicum)和马铃薯(S. bulbocastanum)
叶绿体基因组的差异为 0.6%, 绒毛状烟草 (N.
tomentosiformis)和普通烟草(N. tabacum)叶绿体基因组
之间的差异为 0.7%, 因此物种间产生的突变很少会是
多重替代的结果。颠茄(A. belladonna)与茄属和烟草属

1508 HEREDITAS (Beijing) 2008 第 30 卷


CA
内物种叶绿体基因组差异不超过 2%, 因此用颠茄序
列作为参照时突变位点难以判定其变化方式的数量很
少, 所得数据完全可以反映真实的基因组突变方式。
2.1 插入、缺失的发生方式
进化过程中会产生不同核苷酸长度的 indels,
茄属中番茄和马铃薯的分化以及烟草属中绒毛状烟
草和普通烟草的分化, 它们各自叶绿体基因组序列
上产生的 indels 长度与数量的分布关系见图 1。由于
长于 14 bp 的 indels 数目很少, 我们在此仅展示了
14 bp 以下的 indels。
图 1 显示: 无论是总的 indels 数量还是分别的
插入、缺失数量都随着 indels 长度的增加而急剧下
降。这种长度与数量的相关性在玉蕊科植物叶绿体
基因组非编码区的 indels 中[12]以及人和黑猩猩[13]的
假基因的插入、缺失中都观察到。在 4 个物种中, 1 bp
长的 indels都占有极高的比例, 超过各自 indels总量
的 30%, 低于 10 bp 的 indels 的总数超过 indels 总
量的 70%。在普通烟草中 1 bp 的 indels 高达 41%。
Yamane 等 [1]在研究玉米和甘蔗叶绿体基因组非编
码区 indels 时也发现了 1 bp 的 indels 高达 41%; 同
样的结果在 Zhang 等[11]利用人类 RP 假基因研究进
化方式时也被发现, 1 bp 的插入、缺失都占其各自总
量的 42%以上, 1 bp 到 3 bp 的 indels 高达 70%。可
见, 短片段的 indels 易于发生, 进化上距离较近的
物种在分化时产生的 indels 中单碱基 indels 占有相
当大的比例。
我们对不同序列产生的插入、缺失片段的
(G+C)%分别进行了统计(表 1), 总的看来, 不管是
插入还是缺失片段 , 其(G+C)%都低于整个基因组
序列的(G+C)%, 可见插入、缺失的产生并不是随意
的 , 插入的片段富含 A+T, 缺失一般会产生在高
(A+T)%区域。因为富 A+T 含量区域相对于富 G+C
含量区域从热力学上来看更不稳定, 更容易发生突
变。Kelchner 等[3]曾研究了叶绿体基因组中非编码
区结构上的突变, 发现 indels 的发生频率对于序列
组成具有强烈的依赖性。Yamane 等[1]的研究结果同
样建议一个区域 AT 的含量会影响到 indels 的分布。
有人曾探讨过 G+C 含量不同的基因组与产生的多
聚 A/T、多聚 G/C 片段数量之间的关系[14], 发现富
含 A+T 的基因组形成多聚 AT 的比例高。我们认为
基因组的组成会影响到 indels 发生及分布。




图 1 4 种茄科植物叶绿体基因组中 indels (插入、缺失)长度分布图
A: 番茄; B: 马铃薯; C: 绒毛状烟草; D: 普通烟草。
Fig. 1 The length distribution of indels (insertions and deletions) of the four chloroplast genomes in Solanaceae
A: S. lycopersicum; B: S. bulbocastanum; C: N. tomentosiformis; D: N.tabacum.

第 11 期 唐萍等: 茄科植物叶绿体基因组插入、缺失和核苷酸替代的发生方式及影响分析 1509



表 1 4 种茄科植物叶绿体基因组中插入、缺失及核苷酸替代方式的统计
Table 1 Patterns of indels (insertions and deletions) and nucleotide substitution of the 4 chloroplast genomes in Solanaceae
茄属 Solanum 烟草属 Nicotiana
番茄
S. lycopersicum
马铃薯
S. bulbocastanum
绒毛状烟草
N. tomentosiformis
普通烟草
N. tabacum
基因组
Genome

A% 30.64% 30.65% 30.71% 30.69%
T% 31.50% 31.47% 31.50% 31.46%
G% 18.61% 18.66% 18.57% 18.60%
C% 19.25% 19.23% 19.22% 19.25%
插入和缺失
Indels

1 bp ndels 百分比
% of 1 bp indels 37% 31% 30% 41%


插入片段(G+C)%
(G+C)% of insertions 23% 23% 17% 17%


缺失片段(G+C)%
(G+C)% of deletions 28% 25% 25% 28%
突变位点碱基组成
Base composition of mutation loci



替代前
Before substitution

A% 25.94% 26.66% 21.24% 26.45%
T% 27.88% 30.73% 24.69% 31.07%
G% 24.48% 18.89% 27.26% 21.36%
C% 21.71% 23.70% 26.81% 21.12%


替代后
After substitution
A% 22.53% 20.74% 28.01% 25.49%
T% 26.42% 22.96% 31.48% 22.57%
G% 23.01% 29.99% 20.03% 24.52%
C% 28.05% 26.29% 20.48% 27.42%
转换/颠换
Ts/Tv
– 0.83 0.75 1.36 1.35

插入事件的发生会使得整条序列的组成向降低
(G+C)%的方向进化 , 而缺失事件的发生却使得整
条序列向增加(G+C)%的方向进化。我们比较了同一
条序列上的插入、缺失片段(G+C)%发现插入片段的
(G+C)%都要低于缺失片段的(G+C)%。因此插入、
缺失的发生对基因组 (G+C)%会造成一定的影响 ,
这一影响决定于每一序列上发生的插入、缺失片段
的组成与长度两个方面的因素。
2.2 核苷酸替代 Ts/Tv 比值具有种属特异性
碱基替代分为转换和颠换两种方式。已知有多
种因素可以影响基因组的碱基替代的发生, 如 DNA
合成酶的严谨性、错配修复酶的保真性和理化因素
影响等[15,16], 而现在大量的研究认为生物体基因组
的碱基构成也会影响碱基的变异[7, 8]。
我们对茄属中番茄和马铃薯、烟草属中绒毛状烟草
和普通烟草叶绿体基因组分化过程中的点突变进行
了统计, 12 种碱基替代方式在总的替代中的发生比
例见图 2。很显然每条序列上 12 种替代的发生频率
出现差异, 但除了在番茄叶绿体基因组中 A→G 的
转换外, 每个物种中转换发生的频率都较高。我们
比较每一物种中 8 种颠换的发生频率时发现 T→G,
A→C 的比例要明显地高于其他颠换, 这一现象在
对动物基因组中替代发生方式研究中没有发现, 但
与葫芦科植物叶绿体基因组中替代的方式相似, 尤
其在茄属的两个物种中 T→G, A→C 的发生频率在
12 种替代中最高。当统计每一物种的 Ts/Tv 比值时
(表 1), 发现都高于 0.5, 表现出转换偏差。一种假说
认为点突变的这种转换偏差的保守性是由于一些内
在的特征如化学组成、结构(嘌呤和嘧啶)、代谢所
决定; 一种认为[17]这可能意味着由于净化选择所导

1510 HEREDITAS (Beijing) 2008 第 30 卷


致的一定程度保守性, 因为转换偏差可以降低有害
突变的发生, 这一假说暗示点突变的发生形式与



图 2 4 种茄科植物叶绿体基因组中各种类型替代的百分比
A: 番茄和马铃薯; B: 绒毛状烟草和普通烟草。
Fig. 2 Percentages of all types of substitutions of the 4
chloroplast genomes in Solanaceae
A: S. lycopersicum and S. bulbocastanum; B: N.
tomentosiformis and N. tabacum.

密码子的遗传特征相适应, 以此可以推测各个物种
偏差程度不同, 反映了它们所受到的净化选择的差
异。从我们的统计结果看到不同物种的 Ts/Tv 比值
表现出差异, 茄属中两物种分化过程中番茄、马铃
薯叶绿体基因组序列上替代的 Ts/Tv 比值为 0.83、
0.75, 烟草属中两物种分化过程中绒毛状烟草和普
通烟草序列上替代的 Ts/Tv 比值为 1.36、1.35, 可见
在茄属中番茄和马铃薯分化时颠换的发生比例要高
于两种烟草分化时的颠换发生比例。
赵辉等[18]研究了水稻和拟南芥碱基替代的机制,
发现水稻和拟南芥基因组上 Ts/Tv 比值不同, 推测水
稻基因组和拟南芥基因组转换偏差的差异, 主要是拟
南 芥 基 因 组 (A+T)%(65.14%) 高 于 水 稻 的
(A+T)%(56.83%)。而我们所研究的物种之间的 A+T
含量非常近似(表1), 因此可以排除基因组组成导致的
转换偏差的差异, 可能是物种间的突变机制有不同。
Yang 等[6]在研究原猴亚目和类人猿亚目的线粒
体基因细胞色素 b时发现, 分化物种的 Ts/Tv比值与
物种间的差异呈现负相关性, 不同物种的 Ts/Tv 值
表现出一定的差异, 但同义替代、非同义替代的比
值与转换、颠换的比值不表现相关性, 因此认为选
择压力不能用以解释物种间 Ts/Tv 比值的差异。
在我们的分析中, 番茄和马铃薯间叶绿体基因
组的差异与绒毛状烟草和普通烟草间叶绿体基因组
差异近似, 因此 Ts/Tv 比值的差异不应当来源于物
种间进化距离的远近造成的影响。对茄属中和烟草
属中物种各种替代类型的百分比进行比较, 推测茄
属中物种低 Ts/Tv 比值可能由于高的 T→G, A→C 频
率所导致。
我们对茄属和烟草属中物种的叶绿体基因组相
对进化速度进行了比较, 发现茄属中两个物种有比
烟草属中物种相对来说较快的进化速度(数据未显
示), 但是只在 cemA、clpP、matK 基因位点处番茄、
马铃薯和绒毛状烟草、普通烟草相比进化速度上出
现显著差异。不同基因位点相对进化速度的差异主
要由于非同义替代的差异所导致[19]。Matsuoka 等[20]
进行水稻、小麦、玉米叶绿体基因组相对进化速度
研究时发现显著性差异主要存在于密码子的非兼并
位点上 , 在二倍兼并位点上出现少量的显著性差
异。在二倍兼并位点上如果发生转换则为同义替代,
如果发生颠换则为非同义替代, 可见选择压力的大
小对于颠换的发生不会造成很大的影响, 不会导致
茄属中 T→G, A→C 颠换频率大幅度增加, 因此我们
认为选择压力不应成为导致茄属中物种分化以及烟
草属中物种分化时 Ts/Tv 比值差异的主要因素。是
什么原因导致 Ts/Tv 比值如此明显的种属特异性还
有待进一步探讨。
2.3 不同物种中(A+T)/(G+C)偏差的差异
为了深入探讨替代的偏差, 我们分别计算了突
变位点处突变前的碱基组成以及全序列的碱基组成,
从表 1 可见几个物种中叶绿体基因组序列的碱基组
成比例相似, A 和 T 比例为 31%左右, G 和 C 比例为
19%左右, 与每物种中突变位点替代前各种碱基的
组成比例相比较, 我们可以发现突变位点处的 4 种
碱基组成比例相对于全序列来说更接近, 替代位点
的(A+T)%低于基因组的(A+T)%。可见在基因组中
G、C 位点相对于 A、T 位点更容易发生替代, 这可
能是基因组高的 (A+T)% 所导致 , 高的基因组
(A+T)%会增加 G、C→A、T 压力[21]。在突变位点处

第 11 期 唐萍等: 茄科植物叶绿体基因组插入、缺失和核苷酸替代的发生方式及影响分析 1511


替代发生前番茄、马铃薯、绒毛状烟草、普通烟草
(A+T)/(G+C)的比例分别为 1.16、1.35、0.85、1.35, 可
见番茄与马铃薯相比叶绿体基因组发生在 G、C 位
点的突变频率要高; 绒毛状烟草与普通烟草相比突
变位点的选择更倾向于 G、C 位点。在同一属中不
同物种进化中, 表现出核苷酸替代具有不同的 G、C
位点选择的倾向性, 这在不同的物种中可能会体现
G、C 向 A、T 转化程度的不同, 从下面的分析我们
可以看出这可能与物种衍化后的生活习性有一定的
关系。
Blouin 等[22]、Kowalczuk 等[23]研究发现替代表
现 (A+T)/(G+C)偏差 , 即替代发生后突变位点处
A+T 比例要高于 G+C 比例。Decker-Walters 等[9]在
对葫芦科植物中部分编码区、非编码区、内含子区
的核苷酸替代方式进行总的分析时发现了几乎无偏
差的 (A+T)/(G+C), 比值为 0.93, 但各个物种的
(A+T)/(G+C)比值不同。在我们的研究中同样出现了
物种不同则偏差不同的情况 , 除绒毛状烟草中
(A+T)/(G+C)比值为 1.47 表现出偏差外, 番茄、马铃
薯、普通烟草的(A+T)/(G+C)比值分别为 0.96、0.78、
0.93。可见核苷酸替代具有高的 G、C 位点选择的倾
向性的物种突变后具有高的(A+T)/(G+C)比值。番
茄、马铃薯替代后突变位点处的(A+T)/(G+C)比值都
低于替代前 , 表现出突变导致基因组(G+C)%的增
加, 但番茄与马铃薯相比, 替代发生前突变位点处
(A+T)/(G+C)比值番茄低于马铃薯 , 替代发生后突
变位点处 (A+T)/(G+C)比值番茄高于马铃薯 , 可见
马铃薯的叶绿体基因组突变位点处(G+C)%增加的
比例大于番茄。而烟草属中两物种则出现不同的情
况 , 普通烟草替代后突变位点处(A+T)/(G+C)比值
低于替代前 , 绒毛状烟草突变位点则是替代后
(A+T)/(G+C)比值较高 , 从而普通烟草突变位点处
(G+C)%增加, 而绒毛状烟草则降低。
不同物种的基因组序列通过碱基替代会使其组
成的(G+C)%发生改变, 导致基因组的热力学稳定性
出现差异。在动物中发现寒冷的气候[24, 25]和快的细胞
代谢[26]会增加(A+T)/(G+C)偏差, Decker-Walters 等[9]
在对葫芦科中各进化枝的(A+T)/(G+C)比值分别进
行分析时发现此比值的种属特异性, 他同样认为是
由于各物种分化后显著的生活史的差异所导致。我
们看到马铃薯为多年生草本, 而番茄为一年生, 因
此番茄相对于马铃薯细胞代谢速度较快, 这与番茄
和马铃薯相比(A+T)/(G+C)比值较高、突变位点处增
加的(G+C)%较低相一致。异源四倍体的普通烟草为
父本是绒毛状烟草和母本是林烟草 (Nicotiana
sylvestris L. )的杂交后代, 因此普通烟草的叶绿体基
因组与林烟草相近[27], 绒毛状烟草和林烟草分属于
普通烟亚属和碧冬烟亚属的花烟草组, 都是原产于
南美洲的一年生草本, 但普通烟亚属起源于厄瓜多
尔至阿根廷的安第斯山脉一带 , 因此喜温不耐热 ,
而花烟草组较耐热, 这与绒毛状烟草和普通烟草相
比高的 (A+T)/(G+C)比值 , 以及降低的突变位点处
(G+C)%相一致, 因为耐热的物种需要高的(G+C)%
从而保证基因组的稳定性。可见在物种进化过程中
发生的碱基替代(A+T)/(G+C)差异及导致的(G+C)%
的改变与形成的物种的生长习性有一定的关系。
我们研究了茄属中两物种及烟草属中两物种的
叶绿体基因组核苷酸替代的发生, 发现与葫芦科植
物一样有 A→C、T→G 颠换比例增高的现象, 这在
其它的研究中没有观察到。葫芦科植物叶绿体基因
组的核苷酸替代表现出 G→A→C→T→G 这样一系
列状的偏差[9], 但我们只在番茄中看到 G→A→C→
T→G 这样一系列状的偏差趋势较明显。可见同为双
子叶植物的茄科和葫芦科植物在核苷酸替代的方式
上出现一些不同于其他物种的特征, 但二者的替代
方式并不完全相同。
参考文献(References):
[1] Yamane K, Yano K, Kawahara T. Pattern and rate of indels
evolution inferred from whole chloroplast intergenic
regions in sugarcane, maize and rice. DNA Res, 2006,
13(5): 197−204.
[2] Morton BR. Neighboring base composition and
transversion/transition bias in a comparison of rice and
maize chloroplast noncoding regions. Proc Natl Acad Sci
USA, 1995, 92(21): 9717−9721.
[3] Kelchner SA. The evolution of non-coding chloroplast
DNA and its application in plant systematics. Ann
Missouri Bot Gard, 2000, 87(4): 499−527.
[4] Collins DW, Jukes TH. Rates of transition and
transversion in coding sequences since the human-rodent
divergence. Genomics, 1994, 20(3): 386−396.
[5] Petrov DA, Hartl DL. Patterns of nucleotide substitution
in Drosophila and mammalian genomes. Proc Natl Acad
Sci USA, 1999, 96(4): 1475−1479.
[6] Yang Z, Yoder AD. Estimation of the
transition/transversion rate bias and species sampling. J
Mol Evol, 1999, 48(3): 274−283.
[7] Morton BR. The role of context-dependent mutations in
generating compositional and codon usage bias in grass

1512 HEREDITAS (Beijing) 2008 第 30 卷


chloroplast DNA. J Mol Evol, 2003, 56(5): 616−629.
[8] Morton BR, Oberholzer VM, Clegg MT. The influence of
specific neighboring bases on substitution dynamics in
noncoding regions of the plant chloroplast genome. J Mol
Evol, 1997, 45(3): 227−231.
[9] Decker-Walters DS, Chung SM, Staub JE. Plastid
sequence evolution: a new pattern of nucleotide
substitutions in the Cucurbitaceae. J Mol Evol, 2004,
58(5): 606−614.
[10] Thompson JD, Higgins DG, Gibson TJ. CLUSTAL W:
improving the sensitivity of progressive multiple sequence
alignment through sequence weighting, positions-specific
gap penalties and weight matrix choice. Nucleic Acids Res,
1994, 22(22): 4673−4680.
[11] Zhang Z, Gerstein M. Patterns of nucleotide substitution,
insertion and deletion in the human genome inferred from
pseudogenes. Nucleic Acids Res, 2003, 31(18):
5338−5348.
[12] Hamilton MB, Braverman JM, Soria- Hernanz DF.
Patterns and relative rates of nucleotide and
insertion/deletion evolution at six chloroplast intergenic
regions in new world species of the Lecythidaceae. Mol
Biol Evol, 2003, 20(10): 1710−1721.
[13] Gu X, Li WH. The size distribution of insertions and
deletions in human and rodent pseudogenes suggests the
logarithmic gap penalty for sequence alignment. J Mol
Evol, 1995, 40(4): 464−473.
[14] Zhou Y, Bizzaro JW, Marx KA. Homopolymer tract length
dependent enrichments in functional regions of 27 eukaryotes
and their novel dependence on the organism DNA (G+C)%
composition. BMC Genomics, 2004, 5(1): 95
[15] Seo KY, Jelinsky SA, Loechler EL. Factors that influence
the mutagenic patterns of DNA adducts from chemical
carcinogens. Mutat Res, 2000, 463(3): 215−246.
[16] Timsit Y. DNA structure and polymerase fidelity. J Mol
Biol, 1999, 293(4): 835−853.
[17] Li WH, Wu CI, Luo CC. Nonrandomness of point
mutation as reflected in nucleotide substitutions in
pseudogenes and its evolutionary implications. J Mol Evol,
1984, 21(1): 58−71.
[18] ZHAO Hui, LI Qi-Zhai, LI Jun, ZENG Chang-Qing, HU
Song-Nian, YU Jun. The study of neighboring nucleotide
composition and transition/transversion bias in plant
genomes. Sci China ( C, Life Sci), 2006, 36(1): 1−8.
赵辉 , 李启寨 , 李俊 , 曾长青 , 胡松年 , 于军 . 相邻碱
基组分与产生 SNP 的转换或颠换在植物基因组中的研
究. 中国科学(C 辑, 生命科学), 2006, 36(1): 1−8.
[19] Gaut BS, Muse SV, Clegg MT. Relative rates of nucleotide
substitution in the chloroplast genome. Mol Phylogenet
Evol, 1993, 2(2): 89−96.
[20] Matsuoka Y, Yamazaki Y, Ogihara Y, Tsunewaki K. Whole
chloroplast genome comparison of rice, maize, and wheat:
implications for chloroplast gene diversification and
phylogeny of cereals. Mol Biol Evol, 2002, 19(12):
2084−2091.
[21] Morton BR, Bi IV, McMullen MD, Gaut BS. Variation in
mutation dynamics across the maize genome as a function
of regional and flanking base composition. Genetics, 2006,
172(1): 569−577.
[22] Blouin MS, Yowell CA, Courtney CH, Dame JB.
Substitution bias, rapid saturation, and the use of mtDNA
for nematode systematics. Mol Biol Evol, 1998, 15(12):
1719 −1727.
[23] Kowalczuk M, Mackiewicz P, Mackiewicz D, Nowicka A,
Dudkiewicz M, Didek MR, Cebrat S. DNA asymmetry
and the replicational mutational pressure. J Appl Genet,
2001, 42(4): 553−577.
[24] Bernardi G, Bernardi G. Compositional constraints and
genome evolution. J Mol Evol, 1986, 24(1-2): 1–11.
[25] Galtier N, Lobry JR. Relationships between genomic G+C
content, RNA secondary structures, and optimal growth
temperature in prokaryotes. J Mol Evol, 1997, 44(6):
632−636.
[26] Martin AP. Metabolic rate and directional nucleotide
substitution in animal mitochondrial DNA. Mol Biol Evol,
1995, 12(6): 1124−1131.
[27] Yukawa M, Tsudzuki T, Sugiura M. The chloroplast genome
of Nicotiana sylvestris and Nicotiana tomentosiformis:
complete sequencing confirms that the Nicotiana sylvestris
progenitor is the maternal genome donor of Nicotiana
tabacum. Mol Genet Genomics, 2006, 275(4): 367−373.