全 文 :生物技术通报
BIOTECHNOLOGY BULLETIN·综述与专论· 2008年第1期
收稿日期:2007-07-31
基金项目:本工作得到云南省自然科学基金面上项目(批准号:2006c0079M)和西南地区生物多样性保育国家林业局重点实验室的资助
作者简介:刘杰(1982-),女,在读硕士研究生,研究方向:分子生物学
通讯作者:何德,博士,副教授;E-mail:hedexiner@yahoo.com.cn
前言
遗传图谱(geneticlinkagemap)是指通过遗传
重组分析得到的基因或专一的多态性遗传标记
(marker)在染色体上线性排列顺序图,其间的距离
通常用遗传重组值来表示。构建遗传图谱,一是需
要适当的分离群体(作图群体)和家系,二是需要大
量能揭示亲本多态性的遗传标记[1]。利用 DNA标记
构建分子连锁图谱的原理与构建传统遗传图谱一
样,都是以染色体重组与交换为基础,其基本步骤
包括①选择适合作图的 DNA标记;②根据遗传材
料之间的 DNA多态性,选择用于建立作图群体的
亲本组合;③建立具有大量 DNA标记处于分离状
态的分离群体或衍生系;④测定作图群体中不同个
体或株系的标记基因型:⑤对标记基因型数据进行
连锁分析,构建标记连锁图[2~3]。由于分子标记的迅
速发展大大促进了遗传连锁图的构建,至今为止,
已构建了许多植物的高密度分子标记连锁图遗传
图谱已成为植物遗传育种学家的有力工具,利用遗
传图谱可为植物重要经济性状、生物胁迫和非生物
胁迫的基因进行数量性状定位和质量性状定位,为
分子标记辅助选择奠定基础,使植物早期选择成为
可能。而对于林木,由于其自身世代长、高度杂合、
遗传负荷大等遗传特性,致使林木遗传学及遗传图
谱研究工作远远落后于其他植物物种[4]。而构建林
木遗传图谱却是有重要的理论价值和潜在的应用
价值的,特别是分子标记的出现促进了高密度遗传
林木遗传图谱构建的研究进展
刘杰 何德 李永红
(西南林学院,昆明 650224)
摘 要: 高密度分子遗传连锁图谱对分析植物遗传变异、标记目标性状、数量性状定位和分子辅助选择改良性状
均具重要价值。由于林木具有世代长、高度杂合、遗传负荷大等遗传特性,使其遗传图谱研究不同于其他物种,其遗传连
锁图谱的构建相对复杂。目前,一些林木的遗传连锁图谱已经产生。简要综述了林木遗传图谱研究现状和策略,并对构建
高质量林木遗传图谱作了展望。
关键词: 高密度分子遗传连锁图谱 分子标记 数量性状定位和质量性状定位 辅助选择育种 基因克隆
ResearchProgressinConstructionoftheGeneticLinkageMaps
ofForest
LiuJie HeDe LiYonghong
(SouthWesternForestryColege,Kunming650224)
Abstract: Ahighdensitymolecularlinkagemapwilbeputahighvalueonstudiesdesignedtoanalyzegenetic
variation,toidentifyqualitativecharacter,tolocatequantitativecharacterloci,andtoperform marker-asistedselectionin
plants.Duetolonggeneration,highheterozygosityandgeneticloadoftrees,itwasrathercomplicatedtoconstructtheir
geneticlinkagemaps.Atpresent,somegeneticlinkagemapsoftreeshavebeenconstructed.Thispapersummarizedthe
presentconditionsandstrategyinconstructingthegeneticlinkagemapsoftrees,andmakeprospectforconstructingthe
highdensitygeneticmapsoftrees.
Keywords: Highdensitymolecularlinkagemap MolecularmarkersQTLsMAS Genecloning
2008年第1期
图谱的建立和发展,林木分子遗传图谱的研究工作
也随之开展了起来,迄今已有许多树种建立了分子
遗传图谱,使人们可以借助图谱上的分子标记对目
标基因进行定位和分离对林木的抗性等进行早期
测定,并开展分子标记辅助选择育种。因此,林木遗
传图谱的构建已成为当前林木遗传学领域中的一
个热点[1,5]。简要综述了林木遗传图谱研究的现状
和新策略,对构建高质量林木遗传图谱做了展望。
1 林木遗传图谱研究的历史与现状
1.1 初期的林木遗传图谱的构建
林木遗传图谱构建研究最早是从火炬松开始
的[6],1981年 Conlde等使用 43个同工酶标记对 6种
针叶树种进行遗传图谱研究,但是只是对部分基因
组进行了作图[7]。其后,随着分子标记技术的发展
和一些针对林木作图策略的提出,林木的遗传图谱
构建开始取得进展。20世纪 90年代 Lomas等报道
了用白云杉单倍体胚乳,61个 RADP分子标记构
建了第一张含有 47个标记和 12个连锁群的分子
遗传图谱,连锁图长 660cM。随后 Gratapaglia等[8]
报道用拟测交群体构建了桉树的遗传图谱,虽然连
锁图的长度有所增加,标记的位点数也增多,但还
远不够完善,连锁群的数目与林木染色体的数目远
不相符。实际上,初期的所谓林木遗传连锁图只是
一些含有分子标记的遗传连锁片断,标记数目稀
少,连锁图长度也十分有限。
1.2 多种分子标记的高密度遗传图谱的构建
随着实验技术的改进和发展,各种分子标记被
广泛应用于林木遗传图谱构建工作中,主要有
RFLP(限制片段长度多态性),RAPD(随机扩增多
态型 DNA),AFLP(扩增片断长度多态型),SSR(简
单序列重复),STS(序列标记位点)等[9]。在已建立
的遗传连锁图中,RADP是常用的分子标记。其所
用的引物的碱基序列是随机排列的,无需专门设
计,虽然每个引物可检测的 DNA多态性是有限的,
但是可用的引物数量众多,理论上能覆盖整个基因
组;对 DNA质量和数量的要求低,无需事先分析基
因组 DNA序列,也不需要克隆 DNA探针,可以在
没有任何分子生物学研究背景下就可分析 DNA多
态性[10]。这些特点使 RAPD技术的操作比较简单,
实验成本也较低,成为目前在林木遗传图谱构建中
应用最为广泛的一种标记技术[11]。但 RAPD易受各
种实验因素,如模板 DNA、引物、Tag酶、dNTP、Mg+2
浓度,反应温度等影响,导致了它稳定性和重复性
差,这就要求必须通过严格控制反应条件,规范操
作,使反应标准化;此外 RAPD技术是显性标记,不
能区分纯合子和杂合子,而且错配机率较大,导致
假带比例增加,影响扩增结果[10]。于是,那些多态性
丰富、可重复性强、稳定性好的标记(如 AFLP等)
逐渐添加到已有或新构建的遗传连锁图中。
近年来发表的林木遗传连锁图的标记位点数
不断增加,连锁群趋于完整,连锁图对全基因组的
覆盖率增加,标记间的平均距离减少。标记位点数
的增加,这些有利于基因的精细定位。目前用分子
标记构建了毛果杨×美洲黑杨的遗传图[12],标记达
343个,产生了 19个连锁群,覆盖长度是 1527.3cM,
约占杨树基因组总长度的一半;而短叶红豆杉,仅
有 41个,覆盖基因组 305.8cM。欧洲云杉图谱总图
距长度达 3584cM,作图群体是 F1,共产生了 96个
标记,解释了 185个 DNA多态性,分配到 17个连
锁群中,平均图距是 22cM[13]。
1.3 多种作图群体遗传图谱的构建
由于林木的生物学特点使其作图群体与其他
物种有所不同,目前林木的作图群体主要有:单株
树的大配子体(单倍体胚乳群体)、回交二代群体、
拟测交群体、F1群体、F2群体等。例如:(1)针叶树
属裸子植物,其大配子体(胚乳)是单倍体,其分离
和重组交换不受近交和开放家系影响,因此单株树
的大配子体可作为针叶树种的遗传图谱研究群体,
结合分子标记技术可以快速作图,该方法广泛用于
针叶树的遗传图谱构建;(2)许多树种自交不亲和,
因此较难获得多世代作图群体,但是由于长期异
交,使其遗传组成高度杂合,大量的基因位点 F1代
便出现分离,因此 F1群体可用于遗传图谱构建。另
外有一部分树种容易进行无性繁殖,所以 F1群体
可作为永久性群体长期利用;(3)许多林木改良的
材料来自自由授粉的半同胞家系,林木育种学家已
经建立了大量的半同胞子代测定林,也可作为遗传
作图材料,这就拓宽了林木遗传图谱研究的作图群
体来源。扩大作图群体、选择高度保守的标记系统
以及研究适合林木作图的理论和方法将有助于林
刘杰等:林木遗传图谱构建的研究进展 39
生物技术通报Biotechnology Buletin 2008年第1期
木基因组研究向纵深发展。
1.4 新型算法应用遗传作图
对于特定的一个杂交组合所构建的作图群体,
其相邻标记的分离类型不是简单的 Aa×Aa,而是
包含了 7种类型,可能的分离比有 1:1:1:1、1:2:
1、3:1和 1:1,有些标记具有完全信息,如 ab×cd
(4个等位基因),而所有显性标记具有不完全信
息,因此使用近交物种的 F2或回交 (“拟测交”策
略)模型无疑将损失大量的遗传信息。如此之多分离
类型的分子标记之间重组值 (recombinationfraction)
和标记顺序的估计是目前林木遗传图谱研究所急
需解决的问题。现在 Wu等在 EM算法的基础上引
入了一种新的算法,可同时对来自异交物种全同胞
家系内 4种不同的标记分离类型之间的重组分数
进行估算[14];并充分考虑到了两个亲本之间的重组差
异,因此能够判断对称交配类型(symmetricalCROSS
type)标记间的连锁相,而传统的算法是假设双亲
具有完全一致的重组率,显然无法做到这一点[15]。
因此该算法在林木等异交物种的遗传作图中将有
广泛的应用前景。
1.5 多个树种进行了遗传图的构建
目前已在几十个树种上构建了遗传图谱,主要
集中在几类重要的经济树种,其中针叶树种主要有
松属、云杉属、落叶松属等树种。阔叶树种主要集中
在杨属和桉属等树种。Tulsieram等[16]于 1992年利
用 RAPD标记和单株树的大配子体构建了白云杉
的分子标记连锁图谱,首次作出了林木的分子标记
连锁图。至今国内外已完成了杨属[17~19]、松属、云杉
属、落叶松属[16,20~22]、桉属[23,24]、花旗松属、杉木属、
红豆杉属、柳杉属、黄杉属、栎属等 10多个属中的
30个树种的遗传连锁图谱的绘制[25]。我国林木遗传
连锁图谱构建相对较晚,但发展较为迅速,目前已
对松属、杉属、桉属以及杨属的多个品种的经济林
木及其他一些果树品种等建立了遗传图谱。但是对
于常绿阔叶林优势树种(例如樟树、楠木等)的遗传
图谱国内外尚未见报道,相信应该会很快开展起来
并得到不断的完善。
2 林木遗传图谱的应用
2.1 数量性状基因位点的定位和分析
林木的许多重要性状是受多基因控制的数量
性状,且易受环境因素的影响。利用传统的数量遗
传学研究方法,不能说明控制数量性状基因的数
目、数量性状基因位点在染色体上的位置和各位点
的贡献大小,以及基因间的相互关系。林木遗传图
谱构建的一个重要方面就是将数量性状分解成多
个 QTL(数量性状位点),再将这些 QTL定位到染
色体的精确位点上,并计算每一 QTL对表型的贡
献率以及各个相对 QTL间的相互作用方式 (如加
性效应、显性效应和隐性效应等)及不同 QTL之间
的互助关系。这不仅可以阐明复杂的多基因控制的
数量性状的遗传基础,而且可以根据 QTL相邻的
分子标记及 QTL对表型的贡献大小,实现对数量
性状的分子标记辅助选择。如:Nelson[26]报道了利用
湿地松遗传图谱进行抗松锈病 QTLs的研究;
Bradshaw等[27]利用232个RFLP标记和111个RAPD
标记,构建杨树的遗传图谱,进行了重要数量性状
(树高、胸径、材积、十形和分枝角)的 QTLs位,还
进一步研究了控制数量性状的多基因数及单基因
的作用效应等。
2.2 基于遗传图谱的基因克隆
克隆基因是分子遗传图谱构建最重要的应用
之一。基于遗传图谱的基因克隆也叫定位克隆
(Positionalcloning),又称图位克隆(Map-basedcloning)。
随着高密度遗传图谱和物理图谱的构建,基因定位
和克隆已成为可能。其过程为首先利用分子遗传图
谱,在目标基因的侧翼得到连锁非常紧密的标记;
然后由这些标记去筛选大片段 DNA文库,鉴定出
与标记有关的克隆,继之以亚克隆和染色体步移
(Chromosomewalking)获得含有目的基因的克隆片
段,最终再辅之以转化和互补测验加以验证。近年
来,运用基于图谱的克隆技术已分离得到了大量的
植物基因,尤其是与抗病有关的基因。林木图位克
隆研究也取得了很大进展,加拿大哥伦比亚大学对
白云杉进行遗传作图,并对抗松树象鼻虫的 QTLs
在遗传连锁群中的位置进行了定位。
2.3 比较基因组研究
比较基因组研究主要是利用相同的 DNA分子
标记在相关物种之间进行遗传或物理作图,比较这
些标记在不同物种基因组中的分布特点,揭示染色
体或染色体片段上的基因及其排列顺序的相同(共
40
2008年第1期
线性)或相似性(同线性),并由此对相关物种的基
因组结构和起源进化进行分析。比较基因组研究除
了对进化研究领域有重大影响外,还可显著增加各
种植物可供利用的遗传标记的数量,这对遗传研究
较为滞后的植物尤为重要,对林木的研究更有指导
意义。目前,一些生物的基因组全序列测序已经完
成(如拟南芥等),比较基因组研究也随之步入了一
个新的时代,即可直接在 DNA序列水平上对不同
生物基因组进行分析,从而对生物的遗传本质达到
更深刻的了解。
2.4 分子标记辅助选择育种(MAS)
MAS是通过对与目标性状(基因)紧密连锁的
分子标记的检测达到对目标性状的控制。而只有有
了完整的、高密度的遗传图谱,MAS才有可能。MAS
可直接从 DNA水平检测目的基因的有无,不受植
株生长、性状表现与否(如隐性基因的表达问题)的
影响,真实可靠。MAS的优越性主要体现在以下几
个方面:可克服性状基因型鉴定的困难;可克服性
状表现型鉴定的困难;可以在早期进行选择;可以
进行更广泛和强度更大的选择;可进行非破坏性性
状评价和选择;可提高回交育种效率。可见对于林
木这种生长周期长的物种,通过 MAS进行选择育
种是非常有力的[28]。
3 问题与展望
构建遗传连锁图谱是基因克隆的基础,也是遗
传育种工作的前提。图谱质量的高低取决于图谱的
通用性和饱和度。构建连锁图谱的目的是用一定大
小的作图群体进行主基因的定位,其平均间隔要求
在 10~20cM。而用于 QTL定位的连锁图,其标记的
平均间隔要求在 10cM以下。但是林木生长周期
长,且多为异交物种,遗传组成高度杂合,这些都为
林木遗传图谱的构建增加了难度。目前,林木遗传
图谱构建所用的群体一般在 100个单株左右,样本
数目少,这样虽然有的林木遗传图谱标记数达到
1000个以上,但是连锁群中仍包含有大段的间隙
区,饱和度还远远不够;且所用标记中通用性标记
所占比例较少,不利于图谱整合工作的开展。因此
对林木遗传图谱的研究有待进一步深入。
随着分子生物学技术和林木作图统计方法的
发展,基于大规模测序获得的 EST标记和 SNP标
记在图谱中应用越来越广泛。有关林木 BAC文库
的建立,比较基因组学的研究最近才陆续被报道,
这些研究的继续深入将为林木遗传图谱在林木育
种和基因组结构与功能的研究中发挥更大的作用。
更多的林木高密度遗传图谱的不断产生将大大促
进林木遗传育种研究的深入,对目标基因的克隆、
性状改良、新品种的培育等具有重大意义。
参考 文献
1 尹佟明,黄敏仁.世界林业研究,1995,3:7~11.
2 方宣钧,吴为人.作物 DNA标记辅助育种.北京:科学出版社,
2002,35~42.
3 刘峰,庄炳昌,等.遗传学报,2000,27(11):1018~1026.
4 张博,杜生明,等.中国生物工程杂志,2003,23(4):14~17.
5 苏晓华,张绮纹.林业科技通讯,1995,5:10~12.
6 黄发新,张新叶,等.湖北林业科技,2000,114(4):15~17.
7 ConlkeMT.Genetics,1981,27(5):46~48.
8 GratapagliaD,SederofR.Genetics,1994,137:1121~1137.
9 田敏,谭晓风,等.生命科学研究,2000,4(1):14~19.
10 张日清,谭晓风,等.吉首大学学报(自然科学版),2001,21
(3):16~21.
11 尹佟明,黄敏仁.世界林业研究,1995,3:6~11.
12 BrashawHD,Vilarm,etal.TheorApplGenet,1994,89:167~
178.
13 尹佟明,沈永宝,等.江苏林业科技,2000,27(6):38~42.
14 WuRL,MaCX,etal.Genetres,2002,79(1):85~96.
15 MaliepaardC,JansenJ,etal.GenetRes,1997,70(3):237~250.
16 TulsieramLK,GlaubitzJC,etal.Biotechnology,1992,10:686~
690.
17 BradshawHD,VilarM,etal.TheorApplGenet,1994,89:167~
178.
18 YinTM,ZhangXY,etal.Genome,2002,45:541~555.
19 CerveraMT,StormeV,etal.Genetics,2001,158:787~809.
20 BrownGR,Kadel,etal.Genetics,2001,159:799~809.
21 PagliaGP,OlivieriAM.MolecularandGeneralGeneticsMGG,
1998,258(5):466~478.
22 ArcradeA,AnselinF,etal.TheorApplGenet,2000,100:299~
307.
23 GratapagliaD,SederofR.Genetics,1994,137:1121~1137.
24 GratapagliaD.TheorApplGenet,1996,144(3):1205~1214.
25 张志毅,林善枝.北京林业大学学报,2002,24(5/6):250~258.
26 Nelson.TheorApplGenet,1993,87:145~151.
27 Bradshaw.TheorApplGenet,1993,86:301~307.
28 潭晓风,胡芳名.经济林研究,1997,15(2):19~22.
刘杰等:林木遗传图谱构建的研究进展 41