全 文 :园 艺 学 报 2009, 36 (12):1827-1836
ActaHorticulturaeSinica
收稿日期:2009-06-01;修回日期:2009-11-19
基金项目:国家自然科学基金项目 (30370988);浙江省自然科学基金杰出青年团队项目 (R307605);中国博士后科学基金项目
(20090451480)
*通讯作者 Authorforcorespondence(E-mail:ywteng@zju.edu.cn)
DNA序列分析在植物分子系统学研究中的应用现
状 ———以蔷薇科为例
郑小艳 , 曹家树 , 滕元文*
(浙江大学园艺系 , 农业部园艺植物生长发育与品质调控重点开放实验室 , 杭州 310029)
摘 要:近 20年来 , DNA序列已被广泛应用于植物各分类阶元的系统学研究中 , 为解决长期有争议
的和亟待解决的系统进化问题提供了有力的证据。现以蔷薇科为例 , 概述了应用 DNA片段进行植物分子系
统研究的现状 , 详细剖析了应用 DNA序列进行植物系统发育研究时常见的问题及其原因 , 提出了对存在多
倍化 、 杂交起源和快速分化等复杂进化史的植物类群进行系统学分析时选用 DNA序列的策略和注意事项。
关键词:蔷薇科;DNA序列;系统发育;ITS假基因;低拷贝核基因
中图分类号:S685.12 文献标识码:A 文章编号:0513-353X(2009) 12-1827-10
ResearchProgressofPlantMolecularPhylogeneticAnalysesBasedonDNASequenceData—ACaseReviewinRosaceae
ZHENGXiao-yan, CAOJia-Shu, andTENGYuan-wen*
(DepartmentofHorticulture, theStateAgriculturalMinistryKeyLaboratoryofHorticulturalPlantGrowth, Developmentand
QualityImprovement, ZhejiangUniversity, Hangzhou310029, China)
Abstract:Duringthelasttwentyyears, DNAsequenceshavebeenwidelyusedinphylogeneticanalyses
ofplantsatthediferenttaxonomiclevels, andprovidedconvincingevidencetosolvethelong-standingdispu-
tedorunsolvedphylogeneticproblems.Inthispaper, thecurentstatusofapplicationsofDNAfragmentsin
plantphylogeneticstudieswerebrieflyreviewedtakingRosaceaeasanexample, andthecommontroublesoc-
curinginphylogeneticstudiesandthepossiblereasonswerediscussedindetail.Finaly, thestrategiesand
pointsforatentioninselectingDNAsequenceswereproposedforphylogeneticreconstructionofplanttaxaes-
pecialyforplantsthathaveundergonecomplexevolutionaryprocessessuchashybridization, polyploidization
andrapidradiation.
Keywords:Rosaceae;DNAsequence;phylogeny;ITSpseudogene;Low-copynucleargene
经典植物分类学根据直观且丰富的形态特征研究分类群 (taxa)的特性 , 区别了数十万种植物 ,
并建立了一套完善的植物演化体系 , 是现代植物学和农学的重要基础之一 。然而 , 由于植物的形态特
征易受环境和发育阶段的影响 , 加上不同科学家对形态指标主观侧重不同 , 导出的系统学结果不一致
而产生争议 。分类学家也试图利用其它植物特征或性状 , 如同工酶 、 花粉超微结构 、特殊的内含物等
信息解决形态学分类 , 但由于这些特征的标记数量非常有限 , 也不能很好地解决存在的问题。
随着分子生物学和生物信息学的快速发展 , 基于各种分子数据的分析已成为植物系统学研究的主
要手段 , 其中以 DNA序列的比较分析应用最为广泛。植物拥有 3套基因组 , 按进化速率由快到慢依
次为核基因组 (nDNA)、叶绿体基因组 (cpDNA)和线粒体基因组 (mtDNA)(Wolfeetal., 1987)。
DOI :10.16420/j.issn.0513-353x.2009.12.001
园 艺 学 报 36卷
每套基因组内不同区域的核苷酸进化速率不同 , 为各分类阶元的系统学研究提供了丰富的变异来源。
其中高等植物的线粒体基因组的大小 、结构和基因次序在植物种间变异很大 (Newton, 1988), 使其
在植物系统学研究中的应用受到限制 , 迄今还未在蔷薇科中得到应用 。国内外学者就 3套基因组内的
不同 DNA区域在植物系统发育研究中的适用范围和当时的应用现状已做了较详尽的综述 (Soltis&
Soltis, 1998;田欣和李德铢 , 2002), 然而 , 学者们在试图应用 DNA序列进行系统进化研究时遇到了
各种难题。
蔷薇科 (Rosaceae)是起源较早的一个大科 , 共有 95 ~ 97个属 , 约 2 825种 (吴征镒 等 ,
2003)。在被子植物演化系列中 , 蔷薇科仍处于比较原始的 、 从初级到中级的发展阶段 (俞德浚 ,
1984)。传统上 , 根据果实形态及染色体基数将蔷薇科划分为 4个亚科:绣线菊亚科 (Spiraeoideae, 蒴
果或鹘突果 , x=9)、 蔷薇亚科 (Rosoideae, 瘦果 , x=7, 8, 9)、李亚科 (Prunoideae, 核果 , x=8)
及苹果亚科 (Maloideae)或梨亚科 (Pomoideae, 梨果 , x=17) (Schulze-Menz, 1964;Robertson,
1974)。截止 2009年 10月 , NCBI上的 GenBank已公布了蔷薇科植物的核苷酸序列近 2万条 (其中氨
基酸序列 1万多条)、 EST序列 50万条及 GSS序列 4万多条 , 这些数据资源为蔷薇科植物的分子系统
研究提供了重要来源 。目前 , 基于 DNA序列的分子系统研究已在蔷薇科各阶元的分类群中展开 , 解
决了一些长期有争议或待解决的系统进化问题 。本文以蔷薇科为例综述近几年来的研究趋势 , 并对存
在的疑难问题进行探讨。
1 DNA序列在植物分子系统学研究中的应用与发展
1.1 由 DNA单一序列分析向多序列分析发展
在早期的植物分子系统学研究中大多仅选用一种来源的 (nDNA或 cpDNA)甚至一个 DNA片段
作为数据来源。如在蔷薇科中 (表 1), 2002年前的研究中均只选用了一种 DNA片段或单一来源的片
段 。Morgan等 (1994)利用叶绿体基因 rbcL序列首次对整个蔷薇科进行了分子系统重建 , 从分子角
度提出了绣线菊亚科并非单系 , 而苹果亚科可能直接起源于绣线菊亚科的观点。而后 Evans等
(2000)和 Poter等 (2002)分别应用低拷贝核基因 GBSSI(granule-boundstarchsynthase)和 cpDNA
的 trnL-F和 matK的分析结果支持了上述观点 , 且通过增加样本数量首次阐明了苹果亚科的确切起
源 。
大多数被子植物的叶绿体基因组为母系遗传 (Corriveau& Coleman, 1988), 而核基因为双亲遗
传 。因此 , 仅选用其中一种来源的 DNA序列无法全面揭示杂交和异源多倍化等系统进化问题。此外 ,
不同植物分类群间 DNA片段的进化速率并不一致 , 且一段长度有限的序列有时无法提供足够的信息
位点。如蔷薇科中苹果亚科植物的序列分化度显然低于其它亚科 。以最常用的 ITS序列为例 , 其在蔷
薇亚科中进化速率最快 , 其次是绣线菊亚科和李亚科 , 而在苹果亚科中最低 (表 1), 不能有效地解
决种间系统发育关系 。
近年来 , 越来越多的研究选用多种 DNA片段来进行植物分子系统重建。 Poter等 (2007a)应用
6个核基因和 4个叶绿体 DNA片段对蔷薇科进行了全面地分析 , 获得了更高的分支支持率。他们的
研究颠覆了传统的 4个亚科的分类 , 而将蔷薇科分为 3个亚科:(1)绣线菊亚科 (Spiraeoideae), 包
含了传统概念上的李亚科和苹果亚科;(2)蔷薇亚科 (Rosoideae), 但比原来的蔷薇亚科大为缩小;
(3)Dryadoideae, 包含了 4个与固氮放线菌 Frankia共生的属:仙女木属 Dryas、 Chamaebatia、 Purshia
和 Cercocarpus。
1.2 由常用 DNA片段分析向低拷贝核基因分析发展
长期以来 , 基于 DNA序列分析的植物系统学研究依赖于 cpDNA和 nrDNA的重复区 , 特别是内转
录间隔区 (ITS)的应用最为频繁。但这两类 DNA片段有时无法提供足够的信息位点 , 且 nrDNA因
1828
12期 郑小艳等:DNA序列分析在植物分子系统学研究中的应用现状———以蔷薇科为例
存在不完全协同进化 (incompleteconcertedevolution), 在一些植物类群中并不能预期地解决其系统关
系问题 。因此 , 低拷贝核基因 (Low-copynucleargene, LCNG)因其丰富的资源和较快的进化速率被
广泛的开发和应用。
1.2.1 个体内 ITS序列的多态性问题
诸多研究发现一些植物类群个体内存在 ITS多态性 , 即同一基因组内存在多种差异 ITS拷贝 , 其
中可能包含了基源拷贝 (paralog)和退化的假基因拷贝 , 对系统发育分析造成了困扰 。因此在应用
nrDNA重复区进行系统研究时应引起重视 (Nieto-Feliner&Rosselo, 2007)。
ITS区在蔷薇科不同分类阶元的系统研究中得到了广泛的应用。在蔷薇亚科的蔷薇属 Rosa及苹果
亚科的唐棣属 Amelanchier、 苹果属 Malus和梨属 Pyrus的一些个体中均发现存在 ITS序列的多态性
(表 1)。个体内 ITS序列多态性是 rDNA串联重复未完成协同进化 (concertedevolution)的结果 , 从
植物进化角度看常见的原因有杂交 、 多倍化及基因漂流等 , 使得参与其起源的祖先拷贝渗入并长期保
留在同一个基因组 (Alvarez&Wendel, 2003), 因此 , 通过分析个体内差异 ITS拷贝在系统树上的位
置可以对植物的进化史进行判断。 Iwata等 (2000)通过分析蔷薇属的 4个古老淡红玫瑰 (Damask
roses)个体内差异 ITS拷贝推测出了参与其杂交起源的祖先 , 并通过 cpDNA序列分析进一步揭示了
这些品种的共同母系祖先 。但这种较幸运的情况通常发生在起源较晚且进化史比较简单的植物类群
中 。作者在梨属大多数种的个体内发现了不同水平的 ITS序列多态性 , 且个体内差异拷贝在系统树上
并非单系 , 而是分散在各亚支内 , 并不能解决种间关系 , 但暗示了梨属存在复杂进化史 (Zhenget
al., 2008)。
此外 , 当发现个体内存在 ITS序列多态性时 , 应检验是否存在假基因拷贝。假基因脱离了功能约
束和协同进化以较快的核苷酸替代速率独立进化 , 如果无意地将其加入到系统分析中可能导致错误的
推断。因此 , 在进行系统分析前有必要对所得 ITS序列根据 5.8S区的插入缺失状况 、 ITS区的二级结
构特征 、 5.8S区和 ITS区序列的相对变异速率检测及构树法等进行假基因判断 (Alvarez& Wendel,
2003;Baileyetal., 2003)。作者在梨属中发现了不同类型 、 起源较早的 ITS假基因拷贝 (Zhenget
al., 2008)。但在蔷薇科其它植物的研究中还未见 ITS假基因的报道 , 其中有些可能直接通过 PCR优
化阻止了假基因的扩增 (Alice&Campbel, 1999;Ritzetal., 2005), 而有些虽然发现了 ITS的多态
性 , 但并没有进行假基因的检测 。ITS假基因能否应用于系统发育分析取决于其起源和在系统树上的
位置 (Razafimandimbisonetal., 2004;Harpke&Peterson, 2006;Ochiengetal., 2007)。由于在梨属
中发现的 ITS假基因在系统树上区别于所有功能拷贝而独立成支 , 可以作为具有潜在的系统学价值的
独立数据资源重建梨属系统关系 (Zhengetal., 2008)。
1.2.2 低拷贝核基因的应用
核基因存在外显子和内含子两部分 , 其进化速率不同 , 因此分别适用于不同分类阶元的系统发育
分析 (Sang, 2002)。当 cpDNA和 ITS序列由于前述原因而无法预期解决系统关系时 , 合适的 LCNG
具有最大的潜力来重建系统发育 (Alvarez&Wendel, 2003)。在许多植物类群的研究中 , LCNG相比
ITS和 cpDNA能提供更多的信息位点 (Sang, 2002), 且在揭示异源多倍体的起源问题上非常有用
(刘志鹏 等 , 2007;Vilatersanaetal., 2007)。
由于获得目的 LCNG需要根据预知序列信息设计引物 , 长期以来其应用受到限制 。近年来 , 随着
基因序列数据库的不断扩大 , 搜索近缘类群的同源基因已成为可能 。Steel等 (2008)对 Cucurbitace-
ae和 Geraniaceae两个科内不同分类水平的植物类群进行了 141个 LCNG的评价 , 最终选出了具有较
好应用性的 32个 LCNG。目前在被子植物中应用较多的 LCNG有 Adh(编码乙醇脱氢酶)、 RPB2 (编
码 RNA聚合酶Ⅱ的第二大亚基)、 LEAFY(调控花分生组织和花期功能)、 GBSSI(编码结合型淀粉
合成酶)及 MADS-box(编码精氨酸脱氢酶)等。在蔷薇科中得到开发和应用的 LCNG不多 (表 1),
1829
园 艺 学 报 36卷
其中以 GBSSI和 LEAFY的应用最为普遍。研究表明在蔷薇科植物中普遍存在两种 GBSSI位点 , 而在
苹果亚科植物中则存在 4种 。通过分析不同 GBSSI位点的拷贝在系统树上的位置推测了苹果亚科植物
是以 Gilenia(原绣线菊亚科)为祖先之一的单一谱系多倍化而来 , 且起源地为北美 (Evansetal.,
2000;Evans&Campbel, 2002)。LEAFY在绣线菊亚科 NeiliaD.Don和 StephanandraThunb.的所有
种内都只存在一个位点 , 与 ITS(3.2%)和 cpDNA(0.7%)相比 , 其第二内含子提供了更多的变异
信息 (7.4%), 适合种间系统关系研究 (Oh&Poter, 2003);而 LEAFY在苹果属 、 梨属和山楂属中
均为多拷贝 (曹秋芬 等 , 2003;Loetal., 2007)。
表 1 DNA序列在蔷薇科各分类阶元系统研究中的应用概况
Table1 DNAsequencesusedforphylogeneticanalysisinRosaceae
分类群 Taxa
所用 DNA片段:分化度或Pi位点百分率 /%
DNAregion:sequencedivergenceorpercentageof
parsimonyinformativesites
文献 Reference
蔷薇科 Rosaceae rbcL:编码区 , 21;非编码区 , 50 Morganetal., 1994
GBSSI:外显子 , 26~ 30;编码区 , 4~ 14 Evansetal., 2000
matK+trnL-trnF:0.24 ~ 14.21 Poteretal., 2002
18S, GBSSI, ITS, PGIP, PPO;matK, ndhF, rbcL, trnL-F Poteretal., 2007a
苹果亚科 Maloideae ITS:2.7 ~ 16.1(含 Vauquelinia) Campbel&Donoghue, 1995
GBSSI;atpB-rbcL, trnL-F; Evans&Campbel, 2002
trnK, rpl16, rps16intron;matK, ndhF;
GBSSI-1A Campbeletal., 2007
唐棣属 Amelanchier ITSP:5M Campbeletal., 1997
苹果属 Malus ITSP:1.7A;matK:0.2A Robinson&Harris, 2001
梨属 Pyrus ITSP:2.6A Zhengetal., 2008;
18S:3.2M Kimetal., 2005
山楂属 Crataegus 多种 cpDNA:2.7M;ITS:7.8M;LEAFY:4.9M; Loetal., 2009
PISTILATA:0.2~ 11.34;PEPC:0.78~ 4.65
绣线菊亚科 Spiraeeae ITS:30.3(Pi);trnL-F:6.4(Pi) Poteretal., 2007b
绣线梅属 Neilia LEAFY:7.4A;ITS:3.2A Oh&Poter, 2003
野珠兰属 Stephanandra trnL-F+trnD-T+matK-trnK:0.7A Oh&Poter, 2003
李亚科 Amygdaloideae ITS;Prunus属内:1.5~ 8.6; Lee&Wen, 2001
Prunus与其它属间:11~ 21
李属 Prunus,樱属 Cerasusrpl16intron.0.7A;trnL-F:0.9A; Ohtaetal., 2007
rps16intron:0.3A;trnH-psbA:0.5A
李属 Prunus, ITS1:16.39M 刘艳玲 等 , 2007
桃属 Amygdalus,
杏属 Armeniaca ITS2:17.34M
蔷薇亚科 Rosoideae ITS:40(Pi);trnL-F:23(Pi) Erikssonetal., 2003
委陵菜属 Potentila ITS:1.7 ~ 24.6 Erikssonetal., 1998
悬钩子属 Rubus ITS1P:0.4 ~ 9.4;ITS2:0~ 16 Alice&Campbel, 1999
蔷薇属 Rosa matK:7M Matsumotoetal., 1998
ITSP;psbA-trnH Iwataetal., 2000
ITS-1P:28M;atpB-rbcL:9.6M Wissemann&Ritz, 2005
ITS1P:4.6M Ritzetal., 2005
羽衣草属 Alchemila, trnL-F:10.8(Pi); Gehrkeetal., 2008
Aphanes, Lachemila ITS:31.3(Pi)
草莓属 Fragaria GBSSI-2:3.5M;DHAR:5.1M Rousseau-Gueutinetal., 2009
注:P检测到个体内多态性的 ITS序列;A序列分化度为平均值;M序列分化度为最大值。
Note:PIntra-individualpolymorphismfoundamongITSsequences;AAverageofsequencedivergence;MMaximumofsequencedivergence.
1.2.3 应用 LCNG需注意的问题
应用核基因进行系统学分析需注意的基本问题是种源 (orthologues)和基源 (paralogues)拷贝 、
重组子及假基因的辨别。
1830
12期 郑小艳等:DNA序列分析在植物分子系统学研究中的应用现状———以蔷薇科为例
在不同种内存在的同源拷贝为种源 (垂直同源)拷贝 , 其进化史反映了物种的进化史 , 是进行
系统进化分析所需要的拷贝。核基因通过复制产生的同源拷贝存在于同一基因组中 , 这些拷贝与物种
形成无关 , 称之为基源 (平行同源)拷贝 (Sonnhammer&Koonin, 2002)。理论上 , 基源拷贝问题在
较高分类阶元研究中更普遍 (Sang, 2002)。显然 , 当在同一植物种内得到多种差异 LCNG拷贝时 ,
必须对其进行种源 /基源拷贝的鉴定 , 鉴定的方法主要有系统发育分析和序列的遗传距离比较 (Evans
etal., 2000;Loetal., 2007;Rousseau-Gueutinetal., 2009)。
核基因易通过减数分裂期同源染色体的交换发生重组 , 在 PCR过程中同一基因组内的同源拷贝
也可能发生重组 , 从而产生 “荒诞” 拷贝———重组子。重组子同时具备了两种拷贝的序列信息 , 是
没有系统学意义的一种 “嵌合体 ”, 将其加入到系统分析中 , 必然会影响正常的系统推断 (Posada&
Crandal, 2001;Zhang&Hewit, 2003;Pokeetal., 2006)。研究发现基因重组频率与序列多态性程
度呈正相关 (Zhang&Hewit, 2003)。因此 , 当在同一基因组内发现多种差异 LCNG拷贝时 , 应进行
重组子的检测。目前重组子检测的方法主要有 4种:距离模式 、 邻接序列的系统树分支模式 、 位点兼
容模式和替代分布模式 , 其中以替代分布模式最为有效 (Posada& Crandal, 2001)。根据后一种模
式已开发出具有多种计算方法的 RDP软件包 (Martinetal., 2005), 得到了很好的应用 。当序列分
化度较低 (<5%)时 , 以上软件可能无法检测出可疑重组子 , 则可以采用经典分析方法 (Posada&
Crandal, 2001)。
此外有较多的研究发现 LCNG的某些同源拷贝可能会退化成为假基因拷贝 , 在这些拷贝的编码区
中可以发现终止密码子 、 不同长度的缺失及替代速率的变化 (Vilatersanaetal., 2007;Alvarezetal.,
2008), 它们可能会干扰系统树的拓扑结构 , 一般应将其去除 。
2 在植物分子系统学研究中常见的难题
在试图利用多种 DNA片段进行分类群的系统学研究时可能会遇到两大难题:基于不同 DNA片段
的系统分析结果存在冲突;足够多的序列信息仍不能理想地解决系统关系 。引起这两大难题的原因主
要与所选用的 DNA序列片段的进化机制及植物内在的系统进化历史相关。
2.1 系统分析结果存在冲突
通常基于 DNA序列所构建的系统树为基因树 (genetree), 它并不一定能反映真实的物种树
(speciestree)。基于不同 DNA片段构建的基因树间可能会存在分歧 , 即某些个体或群体在不同的基
因树上的位置并不一致。主要有如下几种情况:(1)基于同一核基因位点的系统树上 , 同一种内的
基因序列在系统树的位置冲突 , 即种内序列并非单系;(2)基于细胞质和核基因序列的系统结果矛
盾;(3)基于不同核基因位点间的系统结果矛盾;(4)基于叶绿体不同区域间的系统结果矛盾。发
现基因树存在冲突时 , 应首先排除取样不足及 DNA序列信息位点不足的影响。其次 , 需考虑选用的
DNA片段的进化速率和进行系统分析时选用的替代模式是否妥当 (邹新慧和葛颂 , 2008)。在此基础
上 , 应着重考虑基因位点的谱系重排 、基因的复制和丢失 , 或植物进化过程中经历的杂交 、多倍化和
基因水平转移等历史 。本文中就基因位点的谱系重排及植物的杂交和多倍化进行重点讨论 。
谱系重排或谱系分选 (incompletelineagesorting, deepcoalescence)是后代对祖先多态等位基因
进行随机保留的结果 , 即后代不同物种携带了祖先的不同等位基因。谱系重排在核基因家族的进化中
很普遍 , 在叶绿体基因组上也存在 (Jakob&Blatner, 2006)。谱系重排与种源 /基源拷贝区分问题有
相似之处 , 但不同的是谱系重排的潜在威胁性随所研究植物类群的分化时间越短而越大 , 因此在低水
平的系统发育研究中问题尤为突出 (Sang, 2002)。当所应用的 LCNG位点因谱系重排在植物后代中
的保留不一致时 , 必然会导致一些物种或个体在系统树上的位置冲突或与以往其它分析结果相矛盾。
最近 Meng和 Kubatko(2009)开发了新的计算模型用于当存在谱系重排时重建植物系统发育 。
1831
园 艺 学 报 36卷
杂交和多倍化是植物物种形成的主要途径 , 这会使得亲本的核基因位点同时整合到后代的核基因
组中 , 从而表现为个体内差异拷贝分别与亲本祖先聚合 。同时 , 由于 cpDNA在大多数被子植物中为
母系遗传 , 在取样全面的前提下 , 基于 LCNG和 cpDNA的系统发育分析可以清楚地揭示杂种或异源
多倍体的双亲祖先 (Albach& Chase, 2004;Smedmarketal., 2005)。而某些物种如蔷薇科中的
Stephanandra属可能存在复杂的网状进化 (reticulation)历史 , 即杂交同时伴随基因渗透 (introgres-
sion), 使得属内种间在 cpDNA和 LEAFY系统树上的位置存在强烈冲突 (Oh&Poter, 2003)。
基因位点的谱系重排和植物的杂交 、 多倍化事件作为引起系统关系结果冲突的两大原因是可以区
分的。如前所述 , 谱系重排是后代对基因位点的随机保留引起的 , 具有偶然性;而杂交及多倍化事件
是植物进化过程中固有的 。因此如果基于多种独立的核基因的系统树中 , 某些分类群其冲突的系统关
系是一致的 , 则说明这些植物分类群存在杂交或异源多倍化的进化历史 , 反之则可能是基因位点的谱
系重排引起的。
2.2 系统关系无法得到解决
基于 DNA序列信息所构建的系统树可能存在分支不理想及支持率低 , 主要表现为多叉分支 poly-
tomy(呈现为灌木丛状 bush)或短枝 (shortbranch), 从而无法达到解决系统关系的初衷。主要原因
如下:
(1)序列数据不足或序列 “噪音 ” 的影响 。即选用的 DNA片段在所研究的植物分类群中分化度
过低 , 或数据中因存在较多的非信息位点 (如重组子的存在), 可以相应的通过增加植物分类群样
本 、选用较快进化速率的 DNA片段及排除重组子并采用最适宜的核苷酸替代模型进行计算得到改善
(Baurainetal., 2007)。
(2)植物的快速分化 (rapiddiversification)和网状进化等复杂进化史的影响 。有时足够的序列
数据可能依然无法得到理想的系统树分支 , 主要表现为某些分类群在系统树上始终为短枝 , 其枝长为
0或接近 0, 暗示了组成短枝的植物存在快速分化 (rapidradiation, 也称适应性辐射进化), 即这些植
物种在较短时间内从祖先中分化出 , 在分子上的变异较小 , DNA序列上表现为同一核苷酸位点较短
时间内可能经历了多次突变 , 因此即使应用足够的 DNA数据都无法解决其间的系统关系 。适应性辐
射进化现象广泛存在于动植物的进化中 (Banks&Whitfield, 2006;Calvinoetal., 2008)。如基于多
种 DNA序列的研究发现蔷薇科苹果亚科的各分类群经历了早期快速分化 , 表现为系统树上的短枝
(Campbeletal., 2007;Loetal., 2009)。理论上 , 为了解决快速进化植物分类群间的系统进化问题
必须选用在分化当时进化速率同样较快的分子片段 , 但寻找这样的片段比较困难;也有学者建议结合
传统的形态学指标来解决 。杂交被认为是引起物种快速分化的一个重要原因 , 因此快速进化通常伴随
着频繁的杂交 , 使得重建系统发育困难 , 目前仍是系统进化研究中的难点 。
虽然序列 “噪音 ” (主要是重组子的干扰)和植物的快速进化都会引起相似的短枝 , 但可以通过
检验加以区分。 Erixon和 Oxelman(2008)通过比较随机分割序列及邻接分区两种模式所构建系统树
的支持率来判断引起短枝的原因 。如果随机分割所获得的支持率高于邻接分区则意味着这些分类群存
在快速辐射进化历史 , 反之则是重组子对系统树的干扰 。另外 , 当发现一些分化时间并不很短的类群
在系统树上表现短枝及多叉分支时 , 到底需要多少序列信息来解决其间的关系成为目前的讨论热点
(Whitfield&Lockhart, 2007)。也有研究表明应用 AFLP标记反而可以解决 nDNA和 cpDNA序列难于
澄清的系统关系问题 (Desprésetal., 2003)
综上所述 , 当基于 DNA序列所构建的系统树因支持率低或存在冲突而并不能解决系统关系时 ,
应对序列数据进行全面的分析 , 包括对谱系重排 、基源 /种源拷贝 、 重组子和假基因拷贝的检验和判
断 , 并结合已知的植物遗传背景或进化史 , 采取相应的有效措施进行改善 , 才能正确地揭示分类群内
的系统关系 、推断植物分化过程中经历的复杂进化史。
1832
12期 郑小艳等:DNA序列分析在植物分子系统学研究中的应用现状———以蔷薇科为例
3 展望
DNA序列分析已在植物各分类阶元的系统发育研究中得到了广泛的应用 , 为解决植物类群间的
系统关系 、 解明其进化史提供了重要证据 。在蔷薇科内 , 通过对多种 DNA片段的序列进行分析可以
为解决一些长期存在争议的热点问题如苹果亚科起源提供重要线索 , 但在较低分类阶元的分子系统研
究中仍缺乏有力的 DNA数据 , 尤其是苹果亚科内属间和一些属内都存在杂交和快速分化等进化史 ,
使得对其进行系统重建仍困难重重。因此应进一步开发强有力序列特别是 LCNG内含子用于系统重建
和进化历史的阐释。
已有的大量研究表明 , 基于多种 DNA序列所构建的基因树并不一定能反映真实的物种树 , 为了
更有效和正确地进行系统重建研究 , 在应用 DNA序列进行植物系统发育研究时要特别注意:1)要充
分选取具有代表性的样本;2)根据植物的分类水平和遗传背景选择合适的 DNA片段;3)尽量选用
来源不同的多种非连锁 DNA片段进行比较分析;4)当所研究的植物类群存在杂交 、多倍化等进化历
史时 , 最好选用多种 LCNG进行分析;5)当遇到多叉分支和短枝问题时 , 需考虑快速进化 、网状进
化的可能性 。
总之 , 在应用 DNA序列进行植物系统关系研究时 , 需要充分了解 DNA片段本身的分子进化历史
和植物类群的繁育系统及扩散模式等基本遗传背景 , 才能对相应的系统进化问题进行科学的推测和阐
释 。
References
AlbachDC, ChaseMW.2004.IncongruenceinVeroniceae(Plantaginaceae):EvidencefromtwoplastidandanuclearribosomalDNAre-
gion.MolecularPhylogeneticsandEvolution, 32: 183-197.
AliceLA, CampbellCS. 1999.PhylogenyofRubusbasedonnuclearribosomalDNAinternaltranscribedspacerregionsequences.American
JournalofBotany, 86: 81-97.
AlvarezI, CostaA, Nieto-FelinerG. 2008.Selectingsingle-copynucleargenesforplantphylogenetics:ApreliminaryanalysisfortheSene-
cioneae(Asteraceae).JournalofMolecularandEvolution, 66:276-291.
AlvarezI, WendelJF. 2003.RibosomalITSsequencesandplantphylogeneticinference.MolecularPhylogeneticsandEvolution, 29: 417-
434.
BaileyCD, CarrTG, HarrisSA, HughesCE.2003.CharacterizationofangiospermnrDNApolymorphismparalogy, andpseudogenes.Mo-
lecularPhylogeneticsandEvolution, 29: 435-455.
BanksJC, WhitfieldJB.2006.Dissectingtheancientradiationofmicrogastrinewaspgenerausingadditionalnucleargenes.MolecularPhylo-
geneticsandEvolution, 41: 690-703.
BaurainD, BrinkmannH, PhilippeH.2007.Lackofresolutionintheanimalphylogeny:Closelyspacedcladogenesesorundetectedsystematic
errors? MolecularBiologyandEvolution, 24:6-9.
CampbelCS, DonoghueMJ.1995.PhylogeneticrelationshipsinMaloideae(Rosaceae):Evidencefromsequenceoftheinternaltranscribed
spacersofnuclearribosomalDNAandITScongruencewithmorphology.AmericanJournalofBotany, 82: 903-918.
CampbelCS, EvansRC, MorganDR, DickinsonTA, ArsenaultMP. 2007.PhylogenyofsubtribePyrinae(formerlytheMaloideae, Rosa-
ceae):Limitedresolutionofacomplexevolutionaryhistory.PlantSystematicsandEvolution, 266:119-145.
CampbelCS, WojciechowskiMF, BruceGB.1997.PersistentnuclearribosomalDNAsequencepolymorphismintheAmelanchieragamic
complex(Rosaceae).MolecularBiologyandEvolution, 14:81-90.
CaoQiu-fen, WadaM, MengYu-ping, HuangJing, SunYi, WangGuo-ping. 2003.CloningandexpresionanalysisofLEAFYhomologues
genesfromapple.ActaHorticulturaeSinica, 30 (3): 267-271.(inChinese)
曹秋芬 , 和田雅人 , 孟玉平 , 黄 静 , 孙 毅 , 王果萍. 2003.苹果 LEAFY同源基因的 cDNA克隆与表达分析.园艺学报 , 30
(3): 267-271.
CalvinoCI, MartinezSG, DownieSR. 2008.TheevolutionaryhistoryofEryngium(Apiaceae, Saniculoideae):Rapidradiations, longdis-
tancedispersals, andhybridizations.MolecularPhylogeneticsandEvolution, 46:1129-1150.
1833
园 艺 学 报 36卷
CorriveauJL, ColemanAW.1988.RapidscreeningmethodtodetectpotentialbiparentalinheritanceofplastidDNAandresultsforover200
angiospermspecies.AmericanJournalofBotany, 75:1443-1458.
DesprésL, GielyL, RedoutetB, TaberletP.2003.UsingAFLPtoresolvephylogeneticrelationshipsinamorphologicalydiversifiedplantspe-
ciescomplexwhennuclearandchloroplastsequencesfailtorevealvariability.MolecularPhylogeneticsandEvolution, 27:185-196.
EriksonT, DonoghueMJ, HibbsMS. 1998.PhylogeneticanalysisofPotentilausingDNAsequencesofnuclearribosomalinternaltranscribed
spacers(ITS), andimplicationsfortheclassificationofRosoideae(Rosaceae).PlantSystematicsandEvolution, 211:155-197.
EriksonT, HibbsMS, YoderAD, DelwicheCF, DonoghueMJ. 2003.ThephylogenyofRosoideae(Rosaceae)basedonsequencesofthe
internaltranscribedspacer(ITS)ofnuclearribosomalDNAandthetrnL-FregionofchloroplastDNA.InternationalJournalofPlantSci-
ences, 164:197-211.
ErixonP, OxelmanB. 2008.Reticulateortree-likechloroplastDNAevolutioninSileneae(Caryophylaceae)? MolecularPhylogeneticsandE-
volution, 48: 313-325.
EvansRC, AliceLA, CampbelCS, KeloggEA, DickinsonTA. 2000.TheGranule boundstarchsynthase(GBSSI)geneintheRosa-
ceae:Multiplelociandphylogeneticutility.MolecularPhylogeneticsandEvolution, 17:388-400.
EvansRC, CampbelCS.2002.Theoriginoftheapplesubfamily(Maloideae;Rosaceae)isclarifiedbyDNAsequencedatafromduplicated
GBSSIgenes.AmericanJournalofBotany, 89: 1478-1484.
FehrerJ, GemeinholzerB, JrJC, BräutigamS.2007.IncongruentplastidandnuclearDNAphylogeniesrevealancientintergenerichybridiza-
tioninPiloselahawkweeds(Hieracium, Cichiorieae, Asteraceae).MolecularPhylogeneticsandEvolution, 42: 347-361.
GehrkeB, BrauchlerC, RomolerouxK, LundbergM, HeublG, ErikssonT.2008.MolecularphylogeneticsofAlchemila, AphanesandLa-
chemila(Rosaceae)inferredfromplastidandnuclearintronandspacerDNAsequences, withcommentsongenericclassification.Molecular
PhylogeneticsandEvolution, 47:1030-1044.
HarpkeD, PetersonA.2006.NonconcertedITSevolutioninMammilaria(Cactaceae).MolecularPhylogeneticsandEvolution, 41:579-
593.
IwataH, KatoT, OhnoS. 2000.TriparentaloriginofDamaskroses.Gene, 259:53-59.
JakobSS, BlatnerFR.2006.AchloroplastgenealogyofHordeum(Poaceae):Longtermpersistinghaplotypes, incompletelineagesorting,
regionalextinction, andtheconsequencesforphylogeneticinference.MolecularBiologyandEvolution, 23:1602-1612.
KimCS, LeeCH, ParkKW, KangSJ, ShinIS, LeeGP.2005.PhylogeneticrelationshipsamongPyruspyrifoliaandP.communisdetec-
tedrandomlyamplifiedpolymorphicDNA(RAPD)andconservedrDNAsequences.ScientiaHorticulturae, 106:491-501.
LeeS, WenJ. 2001.AphylogeneticanalysisofPrunusandtheAmygdaloideae(Rosaceae)usingITSsequencesofnuclearribosomalDNA.A-
mericanJournalofBotany, 88: 150-160.
LiuZhi-peng, WangNeng-fei, ZhaoAi-yun, ShenJi-hong, LiuXiao-li, LiuGong-she. 2007.Theevolutionandexpressionoflow-copynucle-
argenesinalopolyploidplants.Hereditas, 29: 163-171.(inChinese)
刘志鹏 , 王能飞 , 赵爱云 , 沈继红 , 刘小丽 , 刘公社. 2007.低拷贝核基因在异源多倍体植物中的进化与表达.遗传 , 29:
163-171.
LiuYan-ling, XuLi-ming, ChengZhong-ping.2007.Phylogeneticanalysisofstonefruitssuchaspeach, plum, apricot, mumeandchery
basedonITSsequences.ActaHorticulturaeSinica, 34(1):23-28.(inChinese)
刘艳玲 , 徐立铭 , 程中平.2007.基于 ITS序列探讨核果类果树桃 、 李 、 杏 、 梅 、 樱的系统发育关系.园艺学报 , 34 (1):23-
28.
LoEYY, StefanovicS, DickinsonTA. 2007.MolecularreappraisalofrelationshipsbetweenCrataegusandMespilus(Rosaceae, Pyreae)-
Twogeneraorone? SysematicBotany, 32: 596-616.
LoEYY, StefanovicS, ChristensenKI, DickinsonTA. 2009.EvidenceforgeneticassociationbetweenEastAsianandWesternNorthAmer-
icanCrataegusL.(Rosaceae)andrapiddivergenceoftheEasternNorthAmericanlineagesbasedonmultipleDNAsequences.Molecular
PhylogeneticsandEvolution, 51:157-168.
MartinDP, WiliamsonC, PosadaD.2005.RDP2:Recombinationdetectionandanalysisfromsequencealignment.Bioinformatics, 121:
260-262.
MatsumotoS, KouchiM, YabukiJ, KusunokiM, UedaY, FukuiH. 1998.PhylogeneticanalysesofthegenusRosausingthematKse-
quence:Molecularevidenceforthenarrowgeneticbackgroundofmodernroses.ScientiaHorticulturae, 77:73-82.
MengC, KubatkoLS. 2009.Detectinghybridspeciationinthepresenceofincompletelineagesortingusinggenetreeincongruence:Amodel.
TheoreticalPopulationBiology, 75:35-45.
1834
12期 郑小艳等:DNA序列分析在植物分子系统学研究中的应用现状———以蔷薇科为例
MorganDR, SolitsDE, RobertsonKR.1994.SystematicsandevolutionaryimplicationsofrbcLsequencevariationinRosaceae.American
JournalofBotany, 81: 890-903.
NewtonKJ. 1988.Plantmitochondrialgenomes:Organization, expressionandvariation.AnnualReviewsPlantPhysiologyPlantMolecularBi-
ology, 39:503-532.
Nieto-FelinerG, RosseloJA. 2007.Beterthedevilyouknow? GuidelinesforinsightfulutilizationofnrDNAITSinspecies-levelevolutionary
studiesinplants.MolecularPhylogeneticsandEvolution, 44:911-919.
OchiengJW, HenryRJ, BaverstockPR, SteaneDA, ShepherdM. 2007.Nuclearribosomalpseudogenesresolveacoroboratedmonophyly
oftheeucalyptgenusCorymbiadespitemisleadinghypothesesatfunctionalITSparalogs.MolecularPhylogeneticsandEvolution, 44:752-
764.
OhSH, PotterD. 2003.PhylogeneticutilityofthesecondintronofLEAFYinNeiliaandStephanandra(Rosaceae)andimplicationsfortheor-
iginofStephanandra.MolecularPhylogeneticsandEvolution, 29: 203-215.
OhtaS, YamamotoT, NishitaniC, KatsukiT, IketaniH, OmuraM. 2007.PhylogeneticrelationshipsamongJapanesefloweringcheries
(PrunussubgenusCerasus)basedonnucleotidesequencesofchloroplastDNA.PlantSystematicsandEvolution, 263:209-225.
PokeFS, MartinDP, SteaneDA, VailancourtRE, ReidJB. 2006.Theimpactofintragenicrecombinationonphylogeneticreconstruction
atthesectionallevelinEucalyptuswhenusingasinglecopynucleargene(cinnamoylCoAreductase).MolecluarPhylogeneticsandEvolu-
tion, 39: 160-170.
PosadaD, CrandalKA.2001.EvaluationofmethodsfordetectingrecombinationfromDNAsequences:Computersimulations.Proceedingsof
theNationalAcademyofSciences, USA, 98:13757-13762.
PoterD, ErikssonT, EvansRC, OhS, SmedmarkJEE, MorganDR, KerrM, RobertsonKR, ArsenaultM, DickinsonTA, Campbel
CS.2007a.PhylogenyandclasificationofRosaceae.PlantSystematicsandEvolution, 266: 5-43.
PoterD, GaoF, BortiriE, OhS, BaggetS.2002.PhylogeneticrelationshipsinRosaceaeinferedfromchloroplastmatKandtrnL-trnFnu-
cleotidesequencedata.PlantSystematicsandEvolution, 231:77-89.
PoterD, StillSM, GrebencT, BalianD, BozicG, FranjiJ, KraigherH.2007b.PhylogeneticrelationshipsintribeSpiraeeae(Rosaceae)
inferedfromnucleotidesequencedata.PlantSystematicsandEvolution, 266:105-118.
RazafimandimbisonSG, KeloggEA, BremerB.2004.RecentoriginandphylogeneticutilityofdivergentITSputativepseudogenes, acase
studyfromNaucleeae(Rubiaceae).SystematicBiology, 53: 177-192.
RitzCM, SchmuthsH, WissemannV.2005.Evolutionbyreticulation:Europeandogrosesoriginatedbymultiplehybridizationacrossthegenus
Rosa.JournalofHeredity, 96: 4-14.
RobertsonKR. 1974.ThegeneraoftheRosaceaeinsoutheasternUnitedStates.JournaloftheArnoldArborerum, 55:303-332, 344-401,
611-662.
RobinsonJP, HarisSA. 2001.TaxonomyofthegenusMalusMil. (Rosaceae)withemphasisonthecultivatedapple, Malusdomestica
Borkh.PlantSystematicsandEvolution, 226: 35-58.
Rousseau-GueutinM, GastonA, AnoucheA, AnoucheML, OlbrichtK. 2009.TrackingtheevolutionaryhistoryofpolyploidyinFragaria
L.(strawberry):Newinsightsfromphylogeneticanalysesoflow-copynucleargenes.MolecluarPhylogeneticsandEvolution, 51: 515-
530.
SangT. 2002.Utilityoflow-copynucleargenesequencesinplantphylogenetis.CriticalReviewsinBiochemistryandMolecularBiology, 37:
121-147.
Schulze-MenzGK.1964.Rosaceae∥MelchiorH.Englerssylabusderpflanzenfamilien(II).Berlin:GebruederBornträger: 209-218.
SmedmarkJEE, ErikssonT, BremerB. 2005.AllopolyploidevolutioninGeinae(Colurieae:Rosaceae)-buildingreticulatespeciestrees
frombifurcatinggenetrees.Organisms, Diversity&Evolution, 5:275-283.
SoltisDE, SoltisPS. 1998.Choosinganapproachandanappropriategeneforphylogeneticanalysis∥SoltisDE, SotisPS, DoyleJJ.Mo-
lecularsystematicsofplants(Ⅱ).Boston:KluwerAcademicPublishers:1-42.
SonnhammerELL, KooninEV.2002.Orthology, paralogyandproposedclassificationforparalogsubtypes.TrendsinGenetics, 18:619-
620.
SteelPR, Guisinger-BelianM, LinderCR, JansenRK.2008.Phylogeneticutilityof141low-copynuclearregionsintaxaatdiferenttaxo-
nomiclevelsintwodistantlyrelatedfamiliesofrosids.MolecluarPhylogeneticsandEvolution, 48: 1013-1026.
TianXin, LiDe-zhu.2002.ApplicationofDNAsequencesinplantphylogeneticstudy.ActaBotanicaYunnanica, 24: 170-184.(inChinese)
田 欣 , 李德铢.2002.DNA序列在植物系统学研究中的应用.云南植物研究 , 24:170-184.
1835
园 艺 学 报 36卷
VilatersanaR, BrystingAK, BrochmannC. 2007.MolecularevidenceforhybridoriginsoftheinvasivepolyploidsCarthamuscreticusandC.
tukestanicus(Cardueae, Asteraceae).MolecularPhylogeneticsandEvolution, 44: 610-621.
WissemannV, RitzCM. 2005.ThegenusRosa(Rosoideae, Rosaceae)revisited:MolecularanalysisofnrITS-1 andatpB-rbcLintergenic
spacer(IGS)versusconventionaltaxonomy.BotanicalJournaloftheLinneanSociety, 147:275-290.
WhitfieldJB, LockhartPJ. 2007.Decipheringancientrapidradiations.TrendsinEcologyandEvolution, 22: 258-265.
WolfeKH, LiW H, SharpPM. 1987.Ratesofnucleotidesubstitutionvarygreatlyamongplantmitochondrial, chloroplast, andnuclear
DNAs.ProceedingsoftheNationalAcademyofSciences, USA, 84:9054-9058.
WuZheng-yi, LuAn-min, TangYan-cheng, ChenZhi-duan, LiDe-zhu. 2003.ThefamiliesandgeneraofangiospermsinChina-Acompre-
hensiveanalysis.Beijing:SciencePres:643-649.(inChinese)
吴征镒 , 路安民 , 汤彦承 , 陈之端 , 李德铢. 2003.中国被子植物科属综论.北京:科学出版社:643-649.
YuDe-jun.1984.OriginandevolutionofRosaceae.ActaPhytotaxonomicaSinica, 22(6):431-444.(inChinese)
俞德浚.1984.蔷薇科植物的起源和进化.植物分类学报 , 22 (6):431-444.
ZhangD, HewitGM. 2003.NuclearDNAanalysesingeneticstudiesofpopulations:Practice, problemsandprospects.MolecularEcology,
12:563-584.
ZhengX, CaiD, YaoL, TengY.2008.Non-concertedITSevolution, earlyoriginandphylogeneticutilityofITSpseudogenesinPyrus.Mo-
lecularPhylogeneticsandEvolution, 48: 892-903.
ZouXin-hui, GeSong. 2008.Conflictinggenetreesandphylogenomics.JournalofSystematicsandEvolution, 46: 795-807.(inChi-
nese)
邹新慧 , 葛 颂.2008.基因树冲突与系统发育基因组学研究.植物分类学报 , 46:795-807.
《中国蔬菜栽培学》 (第二版)出版发行
《中国蔬菜栽培学》 (第二版)于 2009年 10月由中国农业出版社出版发行。全书约 250万字 , 分总论 、 各论 、 保
护地蔬菜栽培 、 采后处理及贮藏保鲜共 4篇。总论篇概要地论述了中国蔬菜栽培的历史 、 产业现状 , 中国蔬菜的起
源 、 来源和种类 , 蔬菜作物生长发育和器官形成与产品质量的关系 , 蔬菜生产分区 、 栽培制度和技术原理 , 蔬菜栽培
的生理生态基础以及环境污染与蔬菜的关系等;各论篇较详细地介绍了根菜类 、 薯芋类 、 葱蒜类 、 白菜类 、 芥菜类 、
甘蓝类 、 叶菜类 、 瓜类 、 茄果类 、 豆类 、 水生类 、 多年生类 、 芽苗菜以及食用菌类蔬菜的优良品种 、 栽培技术 、 病虫
害综合防治 、 采收等方面的技术经验和研究成果;保护地蔬菜栽培篇论述了中国蔬菜保护地的类型 、 构造和应用 , 主
要栽培设施的设计 、 施工 , 保护地环境及调节 , 保护地蔬菜栽培技术;采后处理及贮藏保鲜篇重点介绍了蔬菜采后处
理技术及贮藏原理和方法等。与原著 (1987年版)相比较 , 具有如下特点:
1.重点增加了自 20世纪 80年代后期以来 , 中国在蔬菜栽培理论 、 无公害蔬菜栽培技术 、 推广应用的新品种 、
病虫害综合防治以及在蔬菜产品质量 、 产品采后处理及贮藏保鲜原理和技术等方面取得的新成果 、 新进展;概述了改
革开放以来中国蔬菜产 、 销通过商品基地建设 、 流通体系建设等在解决蔬菜周年生产和供应方面所取得的成绩。
2.对蔬菜栽培历史 , 蔬菜的起源 、 来源 , 分类 , 蔬菜学名 , 病虫害学名等进行了复核 , 校勘。
3.尽可能地反映不同学术思想和观点;尽量反映不同生态区 , 包括台湾地区在内的栽培技术特点。
4.删去了 “蔬菜的加工” 和 “野生蔬菜” 两章 , 以使本书的内容更加切题。另在附录中增加了 “主要野生蔬菜
简表” 、 “主要野生食用菌简表” 和 “主要香辛料蔬菜简表” 3个附表。
本书由中国农业科学院蔬菜花卉研究所主编 , 组织全国有较高学术水平和实际工作经验的专家 、 学者和技术人员
130余人分别撰写 , 反映了 21世纪初中国蔬菜栽培科学研究和蔬菜生产技术的水平 , 内容较全面 、 系统 , 科学性 、 学
术性强 , 亦有较强的实用性 , 并插有近 500张彩图 , 可供相关科研人员 、 农业院校师生 、 专业技术人员或管理人员等
参考。定价 330元 (含邮费)。
购书者请通过邮局汇款至北京中关村南大街 12号中国农科院蔬菜花卉所 《园艺学报》 编辑部 , 邮编 100081。
1836