全 文 :DNA分析与基因组序列和植物系统学研究
李炜
(北京林业大学材料科学与技术学院,北京 100083)
摘 要: 从 DNA 杂交、RFLP 分析、DNA 的限制酶图谱分析等方面描述 DNA 分析技术在植物学研究中的
应用,讨论了 DNA 分析技术与植物系统学的关系及分子数据的分析方法。并以高等植物为对象,从核 DNA、叶绿
体 DNA 和线粒体 DNA 三方面对植物分子系统学进行了论述。
关键词: 植物系统学 DNA 分析技术 数据分析 DNA 序列
Application of DNA Analysis Technology and
DNA Sequencesin in Plant Systematics Research
Li Wei
( S chool of Material S ci ence and T ech nology , B eij ing Fore stry Univ ersi ty , B eij ing 100083)
Abstract: This paper descr ibed the applicat ion of DNA analysis technolog y in bo tanical resear ch in detail from
the fo llow ing seven aspects: DNA hybridization, RFLP analysis, DNA restr iction mapping and so on . T he relation-
ship betw een DNA analysis techno lo gy and Plant Systematics, the phylog enetic ana lysis and test ing methods using
DNA date were especially discussed. We gener al r eview the recent pr og resses o f the studies on plant sy st emat ics.
Key words: Plant Sy stematics DNA analysis technolog y Phylo genetic analy sis DNA Sequencesin
植物系统学是一门综合性学科,它不断地从植
物学其他分支学科的发展中丰富、完善自身, 进而推
动自身的发展。历史上, 植物胚胎学、孢粉学、植物
化学及细胞学等学科的发展均对植物系统学的发展
起到了巨大的推动作用。20世纪 80年代以来, 分
子生物学的迅速发展以及分子生物学技术的日益完
善,使人们有可能根据核酸结构的比较分析来探讨
植物系统与进化,从而产生了以核酸资料为基础探
讨生物类群间系统演化关系的一门新的边缘学科
DNA 系统学( DNA sy stemat ics)或称分子系统学
( mo lecular sy stematics) [ 1] 。DNA 系统学的研究历
史虽然不到 30年, 但其发展, 尤其近年来的发展十
分引人注目,已成为植物系统学研究的热点, 也必将
对植物系统学产生巨大影响。
DNA 系统学研究的基础是 DNA 分析技术。
DNA 分析技术随着分子生物学的发展而不断完善,
正是 DNA 分析技术的发展推动了 DNA 系统学研
究的发展繁荣[ 2]。
1 DNA分析技术及应用
1. 1 DNA杂交技术
DNA 杂交是指不同来源的 DNA 通过变性解
链后互补的 DNA 部分重新联合复性或退火的过
程。DNA-DNA 杂交分为液相杂交和固相杂交。
在植物系统学研究中多用液相杂交。液相杂交有羟
磷灰石法、核酸酶 S1分析及复性动力学分析法, 在
植物系统学中多用后一种,其基本原理是将不同来
源的 DNA 溶液加热使之变性, 形成单链 DNA, 然
后冷却复性。若异源 DNA 之间具有相同序列区
域,则复性时就会形成杂交 DNA 分子。在液相杂
交中, DNA分子的热稳定性或熔解温度( T m )与两
子链的互补性成正相关, 杂交 DNA 分子的 T m 值
低于同源 DNA 分子,通过测定同源 DNA分子和杂
收稿日期: 2005-11-07
作者简介:李炜( 1980- ) ,男,在读硕士
通讯地址: 100083,清华东路 35号北京林业大学 987信箱 联系电话: 13811185892 shakali@ 163. com
生物技术通报
技术与方法 BIOTECHNOLOGY BULLETIN 2006年第 2期
交 DNA 分子的 Tm 值, 就可推测和比较分类群
DNA 之间相同序列区域所占比例, 进而判断它们亲
缘关系的远近。应用这一研究方法, Bendich 等
( 1987)研究了黑麦属( Secale)、小麦属 ( Tr it i cum )
和大麦属(H ord eum )的 DNA 重复顺序部分, 揭示
出黑麦属与小麦属亲缘关系较近而与大麦属亲缘关
系较远; Goldberg 等( 1993)研究了南瓜属( Cucurb-
i ta) 13种间的系统演化关系。Belfor d等( 1995)则
对滨藜属( A trip iex ) 8 种植物的 DNA 单一拷贝顺
序进行了研究, 不仅为该属属下分类提供了有力的
证据,而且对该属主要种的分化形成时期进行了判
断。Hilu等( 1997)研究了禾本科叶绿体 DNA, 探
讨了禾本科植物的系统演化关系。由此可见, DNA
液相杂交技术在植物系统学研究中可用于科、属、种
的系统发育研究以及种的分化形成时期的推测等方
面。但是这种方法实验繁琐, 获得的杂交资料难于
定性, 很难排除误配、插入等因素的影响, 而且对
DNA 样品的数量要求大, 再加上放射性同位素标记
的使用等大大限制了这种方法在植物系统学研究中
的广泛应用。
DNA 固相杂交是根据互补碱基顺序配对的原
理,将分子量较大的无放射性单链 DNA (预先固定
在膜上) , 与分子量较小的放射性标记的单链 DNA,
在最适杂交条件下, 使其互补碱基之间形成氢键, 从
而把两条单链联结成为一种双链杂交分子。洗脱除
去末配对的标记 DNA片段,然后进行放射性测定,
就可得到两种 DNA 链杂交百分比。英国分子生物
学家 Southern 所发明的 Southern 印迹法 ( South-
ern blot t ing )是目前应用最为广泛的一种 DNA 膜
杂交技术。这一方法是将 DNA 样品经限制性内切
酶降解后,用琼脂糖凝胶电泳进行分离,将胶浸泡在
碱液中使 DNA 变性,然后将变性 DNA转移到硝酸
纤维素膜上,在 80 烘烤数小时,使 DNA 牢固地吸
附在膜上。在较高的盐浓度及适当的温度下将其与
经放射性同位素标记的变性 DNA 探针进行杂交,
通过洗涤除去未杂交上的标记物,将纤维素膜烘干
后进行放射自显影。Souther n 印迹法的发明对分
子生物学技术的发展起了巨大推动作用, 它是目前
进行 DNA 杂交普遍使用的方法, 并且成为其它
DNA 分析技术的基础。
1. 2 RFLP 分析
植物基因组因其结构和功能上的差异, 进化速
率也有所不同。总的来说, 核基因组进化最快, 约为
叶绿体基因组进化速率的 2倍; 线粒体基因组进化
最慢,还不到叶绿体基因组的 1/ 3。基因组内不同
部分间的序列变异速度也不同, 一般情况下非编码
区序列(包括内含子、基因间区)因其功能上的限制
较少,比编码区表现出更快的进化速率,而叶绿体单
拷贝区的同义替代率总的来说约为反向重复序列的
4倍;至于同一基因组内的各编码序列或非编码序
列的变异方式和速率也是千差万别。这些序列在进
化速率上的差异为不同分类阶元的系统发育研究提
供了可供选择的多样化的性状来源。
RFLP 分析即限制性内切酶酶切片段长度多态
性分析,是目前植物系统与进化研究中使用较多的
一种 DNA 分析技术, 是指用限制性内切酶处理不
同生物个体的 DNA 所产生的大分子片段的大小差
异。其基本原理是植物由于长期进化的结果,在种
属间甚至品种间同源 DNA 序列上限制性内切酶识
别位点不同,或者由于点突变、重组等原因,引起限
制性内切酶识别位点上核苷酸的替换、插入或缺失
变化从而引起 DNA 线性分子某一特定内切酶的识
别位点发生变化。这样, 植物 DNA 经适当的限制
性内切酶切割成不同的限制性片段, 由于不同大小
的片段在凝胶上泳动速率不同, 在凝胶上便形成了
连续涂片, 经 Southern 杂交、放射自显影后就能得
到 DNA 的限制性片段多态性即 RFLP。由于
RFLP 起源于基因组 DNA 的变异、不受显隐性关
系、环境条件和发育阶段的影响,具有稳定遗传和特
异性的特点,可以获得能够反映种属遗传差异的大
量多态性,为研究植物类群特别是属间、种间甚至品
种间的亲缘关系、系统发育和演化提供有力的依据。
Molnar等( 1996)以小麦 rDNA 为探针研究了大麦
属 25个种的 rDNA 重复序列, 揭示了它们之间的
亲缘关系; Cor desse等( 1991)使用克隆水稻 rDNA
探针研究了稻属( Ory z a) 47个野生种和水稻 58个
栽培品系的 rDNA 间隔区的 RFLP; Steanl ( 1999)
对桉属 ( Eucaly p lus) 6 种的叶绿体 DNA 进行了
RFLP 分析; Caputo ( 1997) 分析了美国 Zamiaccae
科植物的叶绿体 DNA 的 RFLP,探讨了该科的系统
44 生物技术通报 Biotechnology Bullet in 2006年第 2期
发育。目前, RFLP 分析是植物系统学研究中使用
较多的一种 DNA 分析技术。
1. 3 DNA 的限制酶图谱分析
DNA 的限制酶图谱是表示 DNA 分子所有限
制酶切点位置的简图, 是进一步深入分析 DNA 的
基础。植物种属间甚至品种间同源 DNA 序列上对
不同限制性内切酶识别位点不同。将纯化的 DNA
(往往用分子克隆法即从单一克隆扩增而制备) , 用
不同的限制酶切割, 进行凝胶电泳分析。对环形
DNA (如叶绿体 DNA和线粒体 DNA 等)则要求先
找出一个对该 DNA 只有一个切点的酶,以此点作
为参考点,根据测量凝胶电泳图上各酶切片段的长
度, 决定各切点的位置, 并用简图的形式表示出
来[ 3]。叶绿体 DNA 因其相对较小, 缺乏异质性, 易
于提纯, 并且在进化上较为保守。所以对叶绿体
DNA 的限制酶图谱的确定和比较, 常为研究较高的
分类单位间(属间、科间、目间等)的系统演化关系提
供准确信息[ 4]。Kato 等用 7种限制性内切酶构建
了 azukibean的限制性内切酶图谱, 分析结果进一
步确定了将其分类地位从菜豆属( Phaseduss)划到
豇豆属( V igna ) , 并发现它的杂草型类群在大单拷
贝区有 96bp的缺失, 指出这是由重复序列分子内
重组所致, 这在遗传学上有较大意义。H ilu 等
( 1997)对一些禾本科植物的叶绿体 DNA 限制酶图
谱进行了研究分析, 结果表明雀麦属( Br omus)在早
熟禾亚科中处于孤立位置。他们进一步的研究发现
在族级水平上, 限制性片段图谱差异很大,在早熟禾
族内黑麦草属( L ol ium )与羊茅属 ( F estuca)叶绿体
DNA 同源值高达 75%, 显示了两属较近的亲缘关
系,而在不同族的属间同源值仅为 20%~ 40%。
1. 4 核苷酸序列分析
核酸分子包含着生物遗传的信息, 同时也记载
着生物进化的历史,即核酸结构不仅指导生物的形
态建成和个体发育,而且还能够反映生物之间的亲
缘关系,目前生物分子系统的构建,都是基于这一原
理而进行的。DNA核苷酸序列的测定, 对于了解基
因及其产物的结构、基因表达以及分子进化等具有
重要意义, 同时确定 DNA 核苷酸序列也是获得
DNA 分子间变异最为本质的信息。DNA 测序方法
有 Sanger 的酶法双脱氧法和 Maxa Giber t 化学
法。目前多采用 Sanger 酶法, 其原理是用 2、3双
脱氧核苷三磷酸 ( ddNT PS)代替 DNA 的合成原料
脱氧核苷三磷酸 ( DN TPS ) , ddNT PS 具有与
DN TPS相同的 5磷酸,故有掺入合成 DNA 新链的
能力,但 3位上已非-OH 而是-H ,故 ddNTP 不能与
下一个 DN TP 形成磷酸二酯键,单链合成到此就会
终止。反应物在高压聚丙烯酰胺凝胶中进行变性电
泳后,作放射自显影, 从 X 光片上即可读出序列。
DNA 测序系统运用电子计算机技术, 提高测序速度
以及用荧光标记或化学发光物质标记代替放射性同
位素标记,是这一方法的重大发展。据以上原理,美
国、瑞典等国已研制出了 DNA 自动分析仪, 为核酸
测序的研究工作提供了方便[ 5] 。同时,还要考虑到
系统与进化的问题是十分复杂的, 有些蛋白质比较
保守,编码这种蛋白质的基因也是保守的,有些蛋白
质在演化后期才出现, 在种、属内变异较大,反映在
DNA 上也是这样的。所以, 在序列分析中选择适当
的 DNA片段或基因是很重要的。目前在植物系统
学中,多是对 r bcL 基因(编码 RU BP 羧化酶大亚基
基因)序列进行分析, 亦有对 18SrDN A顺序进行测
定分析的,研究表明其对科、目等高级分类单位系统
发育的探讨具有重要意义。
1. 5 PCR技术
多聚酶链式反应 ( po lymerase chain react ion,
PCR) ,又称为特异 DNA 倍增技术, 1985年首次报
道,是近年来应用最为广泛的一种分子生物学新方
法。PCR技术是利用两种寡聚核苷酸引物, 分别与
特异性 DNA 区段的正链和负链末端互补, 经过膜
板 DNA变性, 模板 DNA 引物复性和在 DNA 聚
合酶作用下发生的引物链延伸反应。引物链在延伸
产物与原来的模板 DNA 经加热变性后, 作为模板
DNA 和另一种引物互补, 在 DNA 聚合酶作用下又
发生引物链的延伸反应。这样反复循环数十次, 可
使特异性 DNA 区段成几何级数倍增。PCR技术因
其所需实验材料少,对 DNA 的纯度要求不严格,不
需要分子克隆就可以从其产物中直接获得序列信
息,再加上其具有快速、简便、灵敏和特异性高等优
点,使得以 PCR 技术为基础的 DNA 分析, 成为植
物系统学研究中, 比较类群间遗传差异的最为合适
的实验方法[ 6] 。在植物系统学研究中, PCR技术可
452006年第 2期 李炜: DNA 分析与基因组序列和植物系统学研究
用于比较研究现存物种与已灭绝的物种间的遗传信
息,如 Go lenberg 等( 1992)报道,他们已成功地对中
新世一种木兰属(Magnol ia)植物化石进行了 DNA
片断(叶绿体 rbcL 基因)的扩增,并用它的序列与现
存种类的该基因序列进行了比较,为探讨植物类群
的起源和演化提供了可靠的依据。PCR技术可在
种内或居群水平上反映其遗传变异,对研究种内变
异有重要意义。Barbier 等( 1995)对水稻 9 个品种
光敏素 3个基因内区序列进行了研究, 证明这个方
法对揭示种下核苷酸变异以及植物系统发育有很大
价值。由于 PCR技术的产生及人们对植物基因组
了解的日益加深, DN A测序正蓬勃发展并成为比较
分子数据的一个主要手段, 为植物系统发育研究开
辟了广阔的前景。
1. 6 DNA 指纹技术
DNA 指纹技术( DNA fingerprinting) , 是一种
在单一实验中可检测出大量 DNA 位点差异性的分
子生物学技术, 它是利用卫星 DNA 作探针,探测不
同生物的卫星区, 产生相应的 DNA 指纹图谱的杂
交方法。在上个世纪 80年代, 人类遗传学家发现,
在人体基因组中含有许多分散的具有串联重复单位
的小卫星( minisatellite) ,一般含 11~ 60个碱基对,
由于重复单位的数字不同和重复拷贝数的等位性不
同,使其表现出高度多态性。Jeffer ys 等( 1991) 发
现,同一家族的小卫星位点的基本序列单位, 都含有
一个 11~ 16 个碱基对的相同核心序列 ( corese-
quence) ,由核心序列串联重复构成的人源小卫星探
针,可以同时与众多的基因组的酶切 DNA 片段杂
交,得到具有个体特异性的 DNA 图谱[ 7]。不同生
物、同一生物的不同品种, 甚至同一品种的不同个
体,其所含小卫星各异, 杂交产生的 DNA 图谱各不
相同,就象人的指纹一样, 所以, 把这种具有个体特
征和种属特性的 DNA 图谱称之为 DNA 指纹图谱。
这种利用人体卫星 DNA 作为探针, 探则不同生物
的小卫星,产生相应的 DNA 指纹图谱的杂交方法
称为 DNA指纹法。DNA 指纹图具有高度的特异
性,不同个体或群体有不同的 DNA 指纹图。DNA
指纹图中的图带遵循孟德尔遗传方式遗传并具有体
细胞稳定性。以上特点使 DNA 指纹图成为目前最
为先进的遗传标记系统, 同时也预示了这一技术, 将
会在植物个体和种群的变异及其演化的研究中起到
重要作用, 对物种生物学的研究有着重要意义。
Rogstad用这一技术研究了 A siminatr iloba (番荔
枝科)的地理分布变异,为揭示该种植物种内变异提
供了依据,同时也为植物地理学提供了一种客观可
靠的研究方法 [ 8]。此外, DNA 指纹技术还可用于植
物栽培种与野生种类间演化关系的研究以及杂交种
亲本的识别等方面的研究, 如 Jang ( 1996)对甜菜属
( Beta)栽培种和野生种间演化关系的研究即是一
例。目前,这一技术在植物系统学研究中使用尚不
是很多。
1. 7 RAPD分析
随意进行扩增的 DNA 多态性( r andom ampl-i
f ied polymorphlic DNA, RAPD) 分析, 容易观察
DNA 的多态性, 实验操作简便快速, 哪怕是一个
DNA 片段也能扩增出用肉眼可以观察到的 DNA
带,其感应度高,而且利用极少量的 DNA 也能达到
预期的研究结果[ 9]。因此, 已广泛应用于遗传多样
性分析、基因定位、遗传连锁图谱构建、种子纯度的
鉴定、种质鉴定及起源、演化和分类等诸多领域, 成
为当今最重要的分子生物技术之一。
RA PD 是 Williams 和 Weish 两个研究小组
1990年同时提出的一种运用随机引物扩增, 寻找多
态性 DNA 片段的遗传标记技术。这一技术建立于
PCR技术基础上, 是以随机的短脱氧核苷酸作为
PCR反应引物, 对基因组 DNA 进行扩增而产生能
显示多态性的 DNA 指纹图谱 [ 10]。与常规 PCR技
术不同, RAPD引物是随机合成或任意选定的寡聚
核苷酸单链,每个 RAPD反应中反加单个引物, 通
过引物和模板 DNA 链随机配对实现扩增, 扩增没
有特异性。此外, RAPD的退火温度较低, 一般为
36 , 允许适当的错误配对, 以扩大引物在基因组
DNA 中配对的随机性。由于 RAPD引物没有特异
性,合成一套引物可用于不同生物基因组的分析,其
技术简便易行, 不需要克隆制备, 同位素标记及
Southern印迹等预备性工作, 且具有分析速度快,
所需 DNA 样品量少等优点。其在植物系统学研究
中的应用是大有潜力的, 可以在对物种没有任何分
子生物学研究的情况下, 对这些物种进行基因组指
纹图谱的构建。通过统计分析, 为物种进化和分类
46 生物技术通报 Biotechnology Bullet in 2006年第 2期
提供 DNA分子水平的证据, 对于种、亚种、变种在
DNA 分子水平的鉴别和演化关系的研究具有重要
意义。Halw ard 等 ( 1997) 利用 10 个引物对花生
( A rachishypogaea)的 29个野生种基因组分别进行
了 RAPD检测, 并根据 10个引物在 29 个种基因组
扩增产物经电泳产生的图谱中之 DNA 条带, 进行
统计分析,建立了它们的亲缘关系图。结果表明, 利
用 RAPD获得的 29个野生种进化和分类结果与经
典方法得到的结果基本一致。此外, Demeke 对芸
苔属的研究, Mo sseler 对多脂松( Pinusresinosa)种
内遗传变异的研究等, 均为这一技术在植物系统学
研究中应用的成功范例[ 8] 。目前, RAPD 分析是植
物 DNA 系统学研究普遍应用的方法之一。
Olmstead和 Palmer ( 1994)强调, 选择一个序
列进行系统发育分析时, 通常要考虑到以下问题:
( 1)这个序列要足够长,以提供足够的带有系统发育
的核苷酸位点, 且所选序列的差异百分率必须适于
所要解决的系统问题。一般认为所比较的分类群间
的序列差异率在 5% ~ 15%间最为合适, 这时既可
以使性状间的多次置换降至最低,又能提供足够数
量的性状; ( 2)此序列必须易于排序,这对性状的同
源性的正确评价是十分必要的; ( 3)此序列必须是直
系同源( ortholog ous) 的。用于系统发育分析的许
多核基因存在一个严重的问题即区分直系同源(与
生物体系统发育有关的基因)和异系同源 ( paralo-
gous,基因组内与基因重复有关的基因)。
2 数据分析
用于分子数据进行系统学分析的计算机软件主
要有 PAU P( Phylog enet ic Analysis Using Parsimo-
ny)程序和PHYLIP( Phy logene Inference Package)
软件包, 其中包含多个有关软件; 其它还有 W.
Maddsion and D. M addsion 编写的 MacClade; J. S.
Farris编写的 HENNIG-86和PHYSYS; Kent F iala
编写的 CLINCH ; Christopher M eacham 编写的
COMPROB; Dav id Penny 编写的 Turbot ree; Ku-
mar and Nei编写的 MEAG等等。不同的计算机软
件,其假设条件与算法都各有不同,如何选择适合自
己的数据的计算软件。首先, 应充分了解所要使用
软件的计算方法和假设条件; 其次,根据数据矩阵的
需要选择合适的选项, 这包括不同的推断分支树的
方法,一般可分为简约法( parsimony) ,最大似然法
( maximum likelihood) , 距离矩阵法 ( distance-ma-
trix)以及不变量法( invariants)四类。在每一类中,
其假设的条件也各有不同,如简约法中根据假设条
件的不同又可分为 Wagner 简约法、Dollo 简约法、
Camin-Sokal简约法等等; 不同的计算方法, 如
PAUP 中的分支界限法 ( branch-and-bound meth-
od)和逐步加入( stepw ise OU T addition)以及树重
排, PHYLIP 软件包中的局部重排( local rearrange-
ments)和全局重排( g lobal rearrangements)等; 根
据需要对运算程序进行改变,如性状的不等加权、定
义外类群及假定祖先等等。对所获数据进行检验和
校正的重抽样技术( re-sampling ) , 如折刀法( jack-
knif ing)和自助法( bootst rapping)。一般来说, 利用
上述不同的计算机软件, 我们可以从事表征的
( phenic)或者分支的( cladist ic)分析。
3 DNA序列的应用
在植物细胞中, 存在着核 DNA、叶绿体 DNA
和线粒体 DNA 三种类型。随着 DNA 技术的发展,
大量物种的核 DNA、叶绿体 DNA、线粒体 DNA 的
部分基因被克隆、测序,使分子系统学如新军突起,
迅速发展起来。植物界中, 线粒体 DNA 的变化很
大,给植物系统学研究带来困难,它仅应用于低等级
分类群上的研究。核基因组由于其庞大的分子量,
复杂的结构与功能, 现代的分子生物学仍对它知之
甚少,植物分子系统学也仅只是集中在一些高度重
复序列或多基因家族的研究上,如编码核糖体 RNA
的基因( Ribosomal RNA gene, nrDNA)等。叶绿体
基因组由于其拷贝数高、分子量小以及相对保守性,
目前,大部分的植物分子系统学工作都基于对 cpD-
NA 的比较分析的基础上。
3. 1 核基因组与植物系统学
核基因组结构又大又复杂, 核叶绿体基因组相
比相差甚远。由于它太大和太复杂, 且包括许多重
复的和非编码的序列, 使得对其不可能进行限制性
位点图谱分析。限制性片段长度多态性分析( RLF-
Ps)表明随机核探针应用于系统发育研究中有许多
缺点。大部分核基因中存在种源(来源于物种形成)
和基源(来源于基因重复)拷贝, 使得核基因的应用
复杂化。尽管对核基因进行比较研究非常困难, 但
472006年第 2期 李炜: DNA 分析与基因组序列和植物系统学研究
基因组中编码核糖体 RNA 的重复区( nrDNA )却是
一个可以进行比较研究的片段。nrDNA 由含 nr-
RNA 基因的非编码间隔区 DNA 的串联重复片段
组成, 并且表现出足够快的一致进化( concertedevo-
lut ion) ,以至于在大多数情况下,可把它看成长度相
当的 cpDNA 片段来分析。目前对核基因组序列的
应用也主要集中在核核糖体 DNA ( nrDNA)上。
高等植物核核糖体 DNA ( nrDNA)的每个重复
单位从 5端开始,包括外转录间隔区( ex ter nal t ran-
scribed spacer, 简称 ET S)、18S基因、第一内转录间
隔区 ( internal t ranscr ibed spacer1, 简称 ITS1 )、
5. 8S基因、第二内转录间隔区 ( IT S2)和 26S 基因,
重复单位之间为基因间隔区( intertg enic soacer, 简
称 IGS ) 称为非编码区 ( non- transcr ibed spacer,
NTS)。nrDNA 的编码区序列( 18S、5. 8S和 26S 基
因)选择压大, 属高度保守区。非编码区序列 (如
IGS, NT S)是高变区,选择压小得多, 序列差异主要
表现在该区上。而 IT S区是中度保守区,序列的变
异度处于两者之间。nrDNA 的这些特点可为系统
发育研究提供信息。高度保守的编码区序列( 18S、
5. 8S 和 26S)主要用于种、属以上分类层次的系统
学研究中,中度保守的重复序列(如上述的 IT S1 和
IT S2)比较适合于种以下和种间关系的研究, 而非
编码区序列( ET S、IGS、NT S)则在近缘类群间的系
统学研究、杂交研究及居群进化学研究上具有一定
的应用潜力。
植物系统学应用: nrDNA 由于其编码区序列的
高度同源性,在植物系统学研究上主要应用于属级
以上(科、目)的系统研究。主要在于探讨种子植物
的起源以及大类群之间的亲缘关系。而非编码区的
序列比较常用于种间及种下等级的系统学研究, 对
于植物系统学研究来说真正的单拷贝基因也许更为
有用。在分子生物学中, 这种基因常用作标记
( marker) , 进行基因图谱工作。同样, 这种基因作
为探针,利用限制性片段长度多态性分析,来比较不
同分类群之间的差异,从而构建分支系统树, 类似的
方法被用来研究作物之间的遗传背景。另外, 单位
拷贝基因的序列比较也可以作为植物系统学资料。
由于这一方面工作的难度较大, 需要随机筛选核基
因库或 cDNA 库, 系统学研究资料较少, 但这可能
是植物分子系统学最有前途的发展方向。
3. 2 叶绿体基因组与植物系统学
植物叶绿体基因组的一般结构: 叶绿体 DNA
( chloroplast DNA, cpDNA)为闭环双链 DNA, 原核
生物型,约占植物总 DNA 的 10% ~ 20%。大小为
120~ 210kb。这些 DNA 分子存在于叶绿体基质
中。常以 10~ 20个分子聚成簇,与叶绿体内被膜或
类囊体膜结合。迄今为止,有四种植物叶绿体基因
组被全序列测定, 它们是烟草 ( N icotiana taba-
cum)、地钱(M ar chantia p olymorp ha )、水稻(Ory z a
sativa)和 Ep if agus v ir ginana。从这些序列以及
许多其它植物叶绿体 DNA 中已鉴定的基因, 可以
知道叶绿体基因组大约有 123 个基因, 大多数植物
cpDNA 均有两个反向重复序 ( nverted repeat se-
quence, IR) , 长约 22 ~ 25kb, 其上主要为一些
rRNA基因, 重复区内基因完全相同, 但序列相反,
即存在两套 rRNA 基因, 两个 IR之间为大的单拷
贝区( Large single-copy reg ion, LSC)和小的单拷贝
区( Small sing le-copy region, SSC)。
植物系统学应用: 核基因组及线粒体基因组相
比较, cpDN A应用于植物系统学研究至少存在下述
优点: ( l)拷贝数多,有利于提取与分离。( 2)序列资
料全面。三种植物被全序列分析,一些叶绿体 DNA
基因在许多植物中已被测定,如 rbcL , psbA, atpBE
等。( 3)相对保守保证了分类群之间的可比性。一
个叶绿体探针可用于所有分类群的比较研究。( 4)
cpDNA 有其独立的进化路线, 而不依赖其它任何数
据即可构建分子系统树。正因为如此, 迄今为止的
植物分子系统学研究大多基于对 cpDNA 比较分析
的基础上。研究结果表明,在分类群中亲缘关系越
近,其 DNA 的同源性越高。即符合协同进化的理
论。另外,在 cpDNA的不同区域 DNA序列的进化
速率存在着差异, 这也预示着 cpDNA 序列的比较
可以适合于任何一级分类群的系统学研究。在一些
保守区域(如 IR区)的序列比较可以应用于研究大
类群的系统与进化。而在特定的非编码区,由于其
序列结构特征而出现突变热点区, 这对于较低等分
类群的研究有重要价值。
3. 3 线粒体基因组与植物系统学
目前,对植物线粒体基因组的了解较少,其最主
48 生物技术通报 Biotechnology Bullet in 2006年第 2期
要的特征就是存在一些重复序列。线粒体 DNA
( M itochondrial DNA, m tDNA)分析广泛应用于动
物系统学及居群生物学的研究中。在植物中, 由于
其基因序列的高度保守性及结构上极高的重排率,
在植物系统学上的价值远没有叶绿体 DNA 大。已
完整测序的苔藓植物地钱的线粒体基因组( Oda等,
1992)含有 90 个基因, 包括 3个 rRNA 基因, 27 个
tRNA 基因和约 60 个蛋白编码基因。被子植物线
粒体基因组在大小、结构和基因次序上变异很大, 但
沉默置换( silentsubt i tut ion)机率远远小于植物的
其它基因组和动物线粒体基因组,因而植物线粒体
基因的比较测序可能在解释植物系统发育的深层分
支时会起一定的作用。随着对拟南芥全基因组测序
的完成,人们对被子植物线粒体基因组的认识也在
增加,正如 Olmstead和 Palmer ( 1994)所预测,植物
线粒体基因组因具有已知任何主要真核基因组中最
低的同义置换率,已被发展用于研究陆生植物早期
分化问题。
mtDNA 的结构特点:
( 1)与 cpDNA相似,亦为闭环双链 DNA, 大小
约 200~ 2000kb, 不同类群间差异很大,大多数被子
植物为 300~ 600kb。
( 2)在基因组中存在许多外源序列, 如已知的
mtDNA 中, 均存在着约 12kb 的 cpDNA 序列。这
些外源序列一般是无功能的假基( pseudogene)。
( 3)在已知的植物 mtDNA 中都存在大的反向
重复序列, 其长度为 1~ 14kb, 不同类群间变化很
大。
( 4)普遍的体内重组现象使得基因组结构变化
多样。
( 5)在线粒体中同时存在有许多环状或线状的
小质粒( l~ 11kb) ,它们的来源和功能尚不清楚。
( 6)有大量的短(约 50~ l 000bp)而分散的重复
序列散布于整个 mtDNA 中。
( 7) 重排现象非常普遍, 在已研究过的植物
mtDNA中,基因排列都不同, 甚至在亲缘关系很近
的类群中仍然存在一个或多个大的倒位。
( 8)单个基因核苷酸序列非常保守。在核苷酸
置换率上,低于动物 mtDNA40~ 100倍, 低于 cpD-
NA3~ 4倍,低于核基因组约 12倍。
植物系统学应用:由于植物 mtDNA 的上述特
点,即重排率高而突变率低, 加之在植物组织中,
m tDNA的拷贝数低,难于提取与纯化, 这都限制了
其在植物系统学上的应用。主要的研究内容包括下
述两方面: l)由于 mtDNA 的高重排率, 利用限制性
酶切式样分析其在低级分类群上的变异。2)利用其
基因的低突变率研究高等级分类群之间的进化。
4 结束语
目前 DNA 系统学研究正处于方兴未艾的阶
段,随着现代生物技术的发展,用于 DNA 系统学研
究的手段和方法会更多,更合理,这必将为探讨植物
的发生、发展及演变, 从而进一步为植物资源的保
存、开发、利用、新品种的培育提供理论依据,并为研
究整个生物界的系统演化过程作出贡献。同时在使
用各种分析技术时有必要考虑各自的应用特点和使
用范围,以便得到更合理的效果。
参 考 文 献
1 丁士友,张春林. 西北植物学报, 1996, 16( 4) : 446~ 456.
2 孟广震.生物工程学报, 1987, 3( 1) 20~ 21.
3 高欢欢,杨军,细胞生物学杂志, 2001, 23( 4) : 196~ 199.
4 赵晓娟.生物工程进展, 1997, 17( 4) .
5 姚志建.国外分析仪器, 1994, 1: 1.
6 Johansen B. Ann. Bot, 1997, 80: 697~ 700.
7 Kats ioti s M H, H eslop-H arrison JS. Ann Bot , 1996, 79: 103 ~
109.
8 Oiki S, Kaw ahara T K, et al. Ann Bot, 2001, 87: 661~ 667.
9 Saw-H oon l , Chye-Peng P , Yew- Hw a TL . Ann Bot , 1999, 83:
193~ 196.
10 H ulya llbi. Sci H ort icul , 2003, 97: 211~ 218.
492006年第 2期 李炜: DNA 分析与基因组序列和植物系统学研究