全 文 :作物学报 ACTA AGRONOMICA SINICA 2014, 40(3): 397−404 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
本研究由中国烟草总公司烟草基因组计划重大专项[110201201003(JY-03)]和中国烟草总公司云南省公司科技项目(2011YN04,
2012YN01)资助。
* 通讯作者(Corresponding author): 肖炳光, E-mail: xiaobg@263.net
Received(收稿日期): 2013-07-11; Accepted(接受日期): 2013-11-28; Published online(网络出版日期): 2014-01-16.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20140116.1608.005.html
DOI: 10.3724/SP.J.1006.2014.00397
利用基因组简约法开发烟草 SNP标记及遗传作图
肖炳光 1,* 邱 杰 2 曹培健 3 桂毅杰 2 卢秀萍 1 李永平 1 樊龙江 2
1云南省烟草农业科学研究院, 云南昆明 650021; 2浙江大学农学系, 浙江杭州 310058; 3国家烟草基因研究中心, 河南郑州 450001
摘 要: 提出了一种基于基因组简约法开发 SNP 标记的方法, 即利用特定限制性内切酶酶切降低基因组复杂度, 利
用高通量测序平台对酶切位点周围的目标片段进行富集测序, 设计一个生物信息学流程进行序列分析和 SNP鉴定。
以烤烟 DH群体为例, 通过基因组简约法收集烟草基因组代表性片段和高通量测序产生 11.4 Gb数据, 经生物信息学
分析获得了 1015 个高质量 SNP 位点。以 SSR 标记为骨架, 绘制包括 SNP 标记在内、标记总数为 1307 的烤烟遗传
连锁图。最后利用该遗传图谱和普通烟草 2个祖先种的基因组序列, 分析烟草 24个连锁群(染色体)之间的同源关系,
发现了大量染色体之间的重组或交换事件以及部分染色体之间的共线性。
关键词: 烤烟; SNP标记; 基因组简约法; 限制性内切酶; 遗传图谱
Development and Genetic Mapping of SNP Markers via Genome Complexity
Reduction in Tobacco
XIAO Bing-Guang1,*, QIU Jie2, CAO Pei-Jian3, GUI Yi-Jie2, LU Xiu-Ping1, LI Yong-Ping1, and FAN
Long-Jiang2
1 Yunnan Academy of Tobacco Agricultural Sciences, Kunming 650021, China; 2 Department of Agronomy, Zhejiang University, Hangzhou 310058,
China; 3 China Tobacco Gene Research Center, Zhengzhou 450001, China
Abstract: We proposed an approach for development of the SNP markers via genome complexity reduction in this study. The
restriction enzymes were employed to digest target genome and then collect and sequence the fragments flanking the restriction
sites by next-generation sequencing platform. A bioinformatics pipeline was developed for the SNP calling. A flue-cured tobacco
DH population was used as a case to test the approach. The tobacco representative fragments were collected via a genome com-
plexity reduction method and sequenced by using Illumina GA sequencer. A total of 1015 SNPs were found based on 11.4 Gb
Illumina data using the bioinformatics pipeline. Taken available SSR markers (as backbone markers) together, a genetic linkage
map with 1307 molecular markers was constructed. Large-scale inter-chromosomal (linkage group) DNA combinations or ex-
changes and several homologous pairs among the tobacco 24 chromosomes were detected based on the genetic map and the
available genomic sequences of two tobacco (Nicotiana tabacum L.) wild progenitors.
Keywords: Flue-cured tobacco; SNP marker; Genome complexity reduction; Restriction enzyme; Genetic map
普通烟草 (Nicotiana tabacum L.)属于茄科
(Solanaceae)烟草属(Nicotiana), 其基因组为异源四
倍体, 是由 2 个野生种绒毛状烟草(N. tomentosiformis,
T 基因组)和林烟草(N. sylvestris, S 基因组)杂交而
来 [1-2], 基因组大小约为 4.5 G [3], 其中含有大量的
重复序列, 并且品种间遗传多态性非常低[4-5]。由于
烟草基因组的复杂性, 其分子标记开发进展较慢。
迄今应用于烟草的分子标记主要包括 RAPD[6]、
AFLP[7]、SSR[8]、ISSR[9]、SRAP[10]、IMP[11]和 DArT[12]
等。这些标记已经成功应用于烟草种质遗传多样性
分析、遗传图谱构建、重要性状基因定位/QTL分析
等方面[13-25]。但这些标记技术因自身存在的局限性
限制了其进一步的发展与应用, 如通量小、精确性
低、所需人力和时间成本高、在基因组上不能广泛
分布等[26]。SNP (single nucleotide polymorphisms)是
指在基因组上由单个核苷酸变异所引起的 DNA 序
398 作 物 学 报 第 40卷
列多态性, SNP相较之前的标记不仅具有多态性好、
能广泛均匀分布于全基因组的特点, 而且随着高通
量测序及生物信息学数据分析技术的发展, 可以实
现大规模自动化检测 [27]。然而与先前的标记一样 ,
SNP 标记在对非模式物种的研究与应用中仍存在很
大的困难和挑战[28]。近几年来, 逐渐出现了几种通
过特异性酶切降低基因组复杂度、利用高通量测序
技术对代表性文库测序的技术 , 如 RRL[29]、
CRoPS[30]、RAD-Seq[31]和 GBS[32]。这些技术不仅可
以应用于有高质量参考基因组序列的模式物种上 ,
也可解决无参考基因组物种的标记开发及基因型分
型难题[33]。
烟草分子标记遗传连锁图的构建始于21世纪初,
Lin 等[15]利用 RFLP 和 RAPD 构建了第一张烟草野
生种间分子标记遗传连锁图。Nishi等[34]利用 AFLP
标记构建了第一张白肋烟分子标记遗传连锁图。肖
炳光等[35]利用 ISSR 和 RAPD 标记构建了第一张烤
烟遗传图谱。Bindler 等 [24]基于烤烟品种 “Hicks
Broad Leaf”和晒烟品种“Red Russian”间杂交产生的
186个 F2植株, 构建了一张由282个 SSR标记组成、
覆盖长度为1920 cM的遗传图谱; Bindler等[25]进一
步开发了 SSR 标记, 并更新了之前的图谱。烟草包
括烤烟、晒烟、香料烟、雪茄烟等不同类型, 烤烟
是我国最主要的烟草类型 (占烟草产量的80%以
上)[36]。通过近年来的努力, 分别利用 SSR 标记和
DArT 标记, 获得了包含800余个分子标记的烤烟遗
传连锁图[37,22]。
本研究通过基因组简约法收集烟草基因组代表
性片段和高通量测序, 设计了一个生物信息学分析
流程鉴定 SNP, 并利用获得的 SNP 数据对前期构建
的烤烟 SSR标记遗传图谱进行了加密和同源分析。
1 材料与方法
1.1 植物材料
本课题组前期建立的烤烟 DH群体(包含 207个
DH 株系), 其亲本为烤烟品种红花大金元(HD)和宽
叶烟草(hicks broad leaf, HBL)[37], 本研究选取其中
166个株系用于 SNP标记开发分析。
1.2 基因组 DNA提取与高通量测序
采用 CTAB 法提取烟草基因组 DNA [38]。DNA
利用限制性内切酶 Pst I和 Hpa II进行组合酶切, 收
集长度 500~1500 bp 片段 , 构建测序文库。采用
Illumina GAII测序。
1.3 序列数据处理与 SNP分析流程
1.3.1 测序数据的预处理 将测序获得的 FASTQ
格式文件首先利用 Fastx软件进行质量过滤(Q>20)。
接着切除用于区分样品 4~8 bp的条形码序列, 考虑
到 Illumina 产生的读序 3′端错误率较高, 进一步切
除了读序末端 2~6 bp的碱基, 最终获得的读序长度
为 67 bp。为了便于后续序列联配, 保留了 5′端 5 bp
的酶切位点序列。
1.3.2 SNP 检测及基因型分型 利用 Usearch 软
件[39]对亲本(HD和HBL)及DH群体各株系的读序进
行序列联配(聚类), 允许的错配数为 1 bp。为了保证
后续分析的质量, 选取读序覆盖度在 3~50的联配结
果(簇)用于生成株系的一致性序列。在获取个体样品
序列聚类结果的一致性序列时采用了如下方法: 将
每个簇中的序列用 Usearch 进行联配, 若某个碱基
位点错配数目≥3或≥25%, 即用此位点上所含碱基
的兼并码(如 W 代表 A 和 T)表示; 若错配数目未达
到该标准, 则该碱基位点用最多出现的碱基表示。
将所获得的株系一致性序列汇总, 利用 Usearch
软件进行序列联配, 一致性序列之间允许 1 个碱基
的错配。通过筛选获得亲本至少存在一个、并且含
有至少 30个 DH株系一致性序列支持的簇用于 SNP
检测及基因型分型。对于每一个候选簇, 其中若某
一碱基位点出现的普通错配碱基个数≥3, 则将该
碱基位点视作简单 SNP (simple SNP); 若某一碱基
位点出现简并码(WRSKMY)个数≥3, 将该碱基位
点视作杂合 SNP (hemi-SNP)[40](图 1)。然后把在一个
簇中变异个数超过 2 次的结果筛除。通过自制 Perl
脚本实现基因型分型。
图 1 烟草基因组中两种 SNP (简单和杂合 SNP)模式图
Fig. 1 Two types of SNPs (simple and hemi-SNP) in tobacco
genome
图中 S和 T分别代表烟草 2个祖先基因组(以本研究由HD和HBL
构建的 DH群体为例)。
S and T represent genomes of two tobacco progenitors, respectively
(tobacco DH population from offspring of HD × HBL).
第 3期 肖炳光等: 利用基因组简约法开发烟草 SNP标记及遗传作图 399
1.4 遗传图谱构建及同源分析
将获得的SNP基因型分型结果进行PIC (poly-
morphism information content)值检验 , 筛选 PIC>
0.375的标记用于构建遗传连锁图, 同时以Tong等[37]
构建的遗传连锁图上611个SSR标记作为骨架标记,
利用JoinMap 4.0[41]构建遗传连锁图, 采用回归作图
算法计算标记的顺序及遗传距离 , 参数设定为
Kosambi函数, LOD值≥7, 并利用MapChart2.2 [42]绘
制遗传图谱。
由于 Bindler 等[25]开发的 SSR 标记是基于美国
烟草基因组测序项目 TGI (Tobacco Genome Initia-
tive)数据库 (http://www.pngg.org/tgi/)中的序列 , 为
了获取其 SSR 标记全长序列以便于后续分析, 将其
SSR 标记左、右引物分别锚定至 TGI 序列上, 分别
找出左、右引物序列对应 TGI 序列的 5 个最佳匹配
序列(-p BlastN-m8-b5-v5), 根据其匹配序列的位置
及正反向信息, 提取在同一拼接序列且左右引物序
列之间序列长度大于 50 的序列。由于 Tong 等[37]开
发的标记除了基于TGI序列外还根据EST序列设计,
故下载了相应序列数据, 并用同样方法获取其 SSR
标记全长序列。将构建的遗传图谱上的分子标记序
列和 Bindler等 [25]构建的标记序列分别锚定到 (-p
BlastN-m8-b1-v1-e1e-20)已拼接完成的 2个烟草祖先
种的基因组序列(国家烟草基因研究中心)上进行染
色体进化及同源性分析。
2 结果与分析
2.1 DH群体测序结果及其 SNP检测分析
利用 Illumina GAII共获得 11.4 Gb原始测序数
据。对原始读序进行质量过滤及序列预处理后, 对
各个株系的读序进行序列联配。汇总联配结果后 ,
统计各联配的读序数目, 发现 56.1%的联配中只有
1~2条序列, 而包含 3~50条读序的联配占 39.7%, 说
明在本实验中通过酶切测序的位点中, 有约 40%位
点测序达到了 3~50倍的覆盖。为了保证后续分析的
质量, 并减少重复序列的影响, 仅将这些包含 3~50
倍覆盖度的联配序列(簇)用于下步分析。
在得到每个株系一致性序列后, 统计每个株系
一致性序列的个数, 获得亲本及80个 DH 株系一致
性序列的平均个数为21 039个, 即平均每个株系基因
组上有2万多个酶切位点的测序覆盖度达到3~50倍
覆盖。
将80个 DH株系和2个亲本的一致性序列汇总、
联配并筛选2个亲本至少存在一个的联配结果(图2),
发现共有42 347个符合要求的联配结果, 其中某一
位点仅含1~5个株系的一致性序列占多数(62%)。为
保证株系个数, 选取至少含30个株系一致性序列的
联配结果 , 最终获得10 623条候选联配结果用于
SNP检测及基因型分型。进一步分析发现, 867个序
列联配中变异数目为1~2个 , 经过统计发现变异碱
基位点总数为1015个, 即大致可以推断在烟草基因
组上每701个碱基(10 263×67/1015)出现一个 SNP 变
异; 这1015个 SNP中, 158个为简单 SNP位点, 857个
为杂合 SNP位点。
2.2 利用 SNP标记构建烤烟遗传图谱
以 Tong 等[37]构建的含 611 个 SSR 标记的遗传
连锁图为骨架, 加入 1015 个 SNP 候选标记并整合
Lu 等[22]构建的 315 个 DArT标记, 最终获得一张包
含 1307个分子标记的遗传图谱(图 3, 限于篇幅仅列
出部分连锁群)。
图 2 含有不同株系一致性序列个数的联配比例分布
Fig. 2 Percentage of alignments or clusters with different numbers of consensus sequences of individuals
400 作 物 学 报 第 40卷
图 3 基于 SSR、DArT和 SNP标记的烤烟遗传连锁图
Fig. 3 Genetic linkage map of flue-cured tobacco based on SSR, DarT, and SNP markers
限于篇幅仅列出 5个连锁群, 数字“10”开头表示 SNP标记; TM、PT开头表示 SSR标记; DT开头表示DArT标记; 后缀“_”表示与Bindler
等[25]遗传图谱共有的标记。
Five linkage groups are selected because of limited pages. The markers with “10”, “PT/TM”, “DT” refer to SNP, SSR, and DArT markers,
respectively. Markers with “_” as suffix are ones sharing with genetic map by Bindler et al. [25]
该遗传图谱总长 3002 cM, 标记密度为 2.3 cM,
其中 SNP标记 555个(表 1)。总体上, SNP标记均匀
分别在各个连锁群上(平均每个连锁群 23.1个, 其中
有 3个连锁群上的 SNP数量超过 40个, 另有 3个连
锁群上的 SNP数量少于 10个)。在 166个株系中, 所
有 SNP标记的平均基因型缺失率为 7.1%。SNP标记
的加入, 基本没有改变原有 SSR 标记遗传连锁图的
骨架[37], 验证了本研究开发的烟草 SNP标记的可靠
性和可用性。
2.3 同源分析
将本研究中构建的遗传图谱和 Bindler 等[25]构
建的遗传图谱标记分别在普通烟草祖先种基因组(T
和 S 基因组)拼接序列上定位的结果可以分为2种情
况: 一是部分标记可以在 S 和 T 基因组同时定位;
二是部分标记只能在其中一个基因组中定位, 仅能
在一个祖先基因组上定位的标记数量列于表2。由表
2可知: (1) 2张图谱标记在2个祖先基因组上定位的
数量分布趋势基本一致。(2)遗传图谱标记定位在2
个祖先基因组上的数量虽有差别 , 但在2个祖先种
基因组上均有分布。该结果表明, 自2个祖先种杂交
形成四倍体烟草以来 , 来自2个祖先种的24条染色
体之间 DNA 的交换或染色体重组非常频繁, 远不
第 3期 肖炳光等: 利用基因组简约法开发烟草 SNP标记及遗传作图 401
表 1 利用 SNP等标记构建的烤烟遗传图谱
Table 1 Linkage map of flue-cured tobacco with SNP and other molecular markers
连锁群
Linkage group
(LG)
SNP标记个数
SNP number
其他标记个数
Number of other
markers
标记总数
Total number
连锁群长度
Total length
(cM)
平均标记间距离
Average marker
distance (cM)
标记间最大距离
Maximal marker
distance (cM)
1 5 19 24 78.1 3.3 6.6
2 39 60 99 130.4 1.3 11.4
3 29 49 78 157.1 2.0 17.9
4 16 33 49 93.5 1.9 14.3
5 2 20 22 62.6 2.8 4.6
6 20 24 44 138.3 3.1 17.3
7 41 38 79 133.8 1.7 7.2
8 16 30 46 101.2 2.2 10.9
9 26 32 58 107.3 1.9 9.5
10 24 21 45 118.2 2.6 10.1
11 24 24 48 90.0 1.9 10.9
12 19 47 66 154.0 2.3 10.0
13 10 24 34 102.8 3.0 7.8
14 24 55 79 120.1 1.5 5.8
15 27 22 49 175.0 3.6 14.4
16 24 21 45 165.1 3.7 14.4
17 31 36 67 102.8 1.5 7.6
18 14 18 32 76.5 2.4 6.5
19 51 24 75 196.5 2.6 13.4
20 28 29 57 157.1 2.8 14.6
21 15 16 31 78.1 2.5 13.8
22 40 57 97 196.5 2.0 9.2
23 23 36 59 174.2 3.0 18.8
24 7 17 24 92.8 3.9 19.5
合计 Total 555 752 1307 3002.0 – –
止 Bindler等[25]建议的 4次重组。(3)第 22染色体(连
锁群)等几个染色体明显发生了 S/T基因组间的大片
段重组。
在进行标记定位祖先种基因组过程中, 发现有
些来自不同连锁群的分子标记可以定位在同一条
祖先基因组拼接序列上。这一定位结果可能是这 2
个染色体具有高度同源性导致的序列相似性造成
的。为此统计了 2个连锁群标记定位在同一祖先种
基因组序列的数量(表 3)。很明显, 有些染色体间表
现出明显的共线性或同源性。基于该结果, 推测出
部分染色体间同源性(共线性)的大致关系, 如连锁
群 3和 17, 7和 19等。其中一些染色体与多个染色
体具有共线性, 可能由染色体重组造成。另外, 有
些连锁群(如第 24 连锁群)可能因丢失而没有明显
的同源染色体。
3 讨论
本研究提出了一种基于基因组简约法开发 SNP
标记的方法, 并在烟草上开发了 SNP 标记, 与其他
标记整合获得了包含1307个标记的高密度烤烟遗传
连锁图。利用该遗传图谱和 Bindler等[25]构建的遗传
图谱标记比对2个烟草祖先种序列 , 采用生物信息
学方法发现了目前的栽培烟草中24条染色体与祖先
种染色体之间的对应关系, 同时也找出了这24条染
色体之间存在的共线性或同源关系, 为今后深入研
究栽培烟草的起源进化奠定了基础。
本研究开发的 SNP标记是基于高通量测序平台
的基因组简约技术。与另外几种通过测序获得 SNP
基因型的技术一样, 主要在于选择特异性限制性内
切酶或组合对整个基因组进行酶切, 利用酶切位点
402 作 物 学 报 第 40卷
表 2 普通烟草遗传图谱标记仅能在一个基因组(S和 T基因组)特异定位的标记数量
Table 2 Number of linkage map markers which could only be mapped in one of two ancient genomes (S/T genome)
Bindler等[25]构建的连锁群及其来源推测
Linkage group and origin by Bindler et al.[25]
Bindler[25]遗传图谱标记数 Number of
linkage map markers by Bindler et al.[25]
本研究遗传图谱标记数
Number of linkage map markers in this study
连锁群
Linkage group (LG)
来源推测
LG origin
S基因组
S-genome
T基因组
T-genome
S基因组
S-genome
T基因组
T-genome
1 S 79 5 6 10
2 T 4 45 5 66
3 S 62 9 41 7
4 T 9 63 6 29
5 S 38 3 5 6
6 S 66 8 26 10
7 S 79 7 43 6
8 S 55 4 28 2
9 S/T 13 40 5 46
10 S 57 4 29 3
11 S 52 5 31 3
12 T 5 56 0 29
13 S/T 7 56 2 19
14 T 4 39 5 49
15 T 10 58 4 31
16 S 60 9 26 3
17 T 13 68 4 44
18 S 48 18 20 4
19 T 10 63 1 59
20 S 34 3 40 5
21 S/T 17 31 2 22
22 S/T 43 46 27 36
23 T 7 71 1 39
24 T 9 38 3 12
表 3 来自 2个连锁群标记定位在同一条祖先种基因组拼接序列的数量
Table 3 Scaffold number anchored by markers from two linkage groups
支持连锁群同源关系的拼接序列数量 Scaffold number for the homologous LG pairs连锁群同源关系(对)
Homologous LG pair 基于 Bindler
[25]遗传图谱
Based on LG by Bindler[26]
基于本研究遗传图谱
Based on LG in this study
LG3-LG17 18 6
LG7-LG19 14 7
LG4-LG6 14 4
LG8-LG22 11 4
LG9-LG18 7 7
LG19-LG22 6 6
LG10-LG2 5 7
表中仅列出部分连锁群对。Only parts of putative homologous linkage group pairs were listed.
附近的序列构建代表性文库, 进而实现对整个基因
组上的特定位点序列的富集和测序。对于植物而言,
可选择甲基化敏感的酶, 从而避免酶切基因组上的
重复区域[33]。对于基因组已测序的物种, 可以根据
参考基因组和所选限制性内切酶序列估测酶切位点
个数, 从而设定测序量大小。然而对于无参考基因
组的物种, 无法精确获得酶切位点个数, 因而无法
估计测序量的大小, 有待开发新的方法。本研究在
前期开发烟草 DArT 标记的基础上[22], 摸索获得了
烟草基因组简约的最佳酶切组合。由于不同植物基
因组序列构成不同, 需要不同的酶切方式以求达到
最佳代表性基因组序列样本。在本研究的测试流程
中, 发现在个体样品序列联配结果中, 有近 55%的
联配因只含有 1~2 条序列而被过滤。若对酶切位点
第 3期 肖炳光等: 利用基因组简约法开发烟草 SNP标记及遗传作图 403
个数能有较好的预估, 适当增加测序量, 提高测序
深度 , 将会大大提高候选位点的个数 , 相应改善
SNP 检测以及基因型分型效率。此外, 还需进一步
优化 SNP 检测方法, 尤其是对 1~3 个碱基插入缺失
的鉴定。这种变异也广泛存在于基因组中, 据估计
其比例约为 SNP 数目的 50%, 若能加以利用将大大
增加总标记数目。
4 结论
利用基因组简约法开发与分析烤烟 DH 群体的
SNP 标记, 以 SSR 标记遗传连锁图为骨架, 获得包
括 SNP 标记在内、标记总数为 1307 的烤烟遗传连
锁图。利用该遗传图谱和普通烟草两个祖先种的基
因组序列分析 24个连锁群(染色体)之间的同源关系,
发现了大量染色体之间的重组或交换事件以及部分
染色体之间的共线性。
致谢: 感谢 Diversity Arrays Technology Pty Ltd公司
Adrzej Kilian博士对本研究的技术支持。
References
[1] Lim K Y, Matyasek R, Kovarik A, Leitch A R. Genome evo-
lution in allotetraploid Nicotiana. Biol J Linn Soc, 2004, 82:
599–606
[2] Clarkson J J, Lim K Y, Kovarik A, Chase M W, Knapp S,
Leitch A R. Long-term genome diploidization in allopolyploid
Nicotiana section Repandae (Solanaceae). New Phytol, 2005,
168: 241–252
[3] Arumuganathan K, Earle E D. Nuclear DNA content of some
important plant species. Plant Mol Biol Rep, 1991, 9:
208–218
[4] Kenton A, Parokonny A S, Gleba Y Y, Bennett M D.
Characterization of the Nicotiana tabacum L. genome by
molecular cytogenetics. Mol Gen Genet, 1993, 240: 159–169
[5] Leng X D, Xiao B G, Wang S, Gui Y J, Wang Y, Lu X P, Xie J
H, Li Y P, Fan L J. Identification of NBS-type resistance gene
homologs in tobacco genome. Plant Mol Biol Rep, 2010, 28:
152–161
[6] Adams R P, Demeke T. Systematic relationships in Juniperus
based on random amplified polymorphic DNA (RAPDs).
Taxon, 1993, 42: 553–571
[7] Vos P, Hogers R, Bleeker M, Reijans M, Van De Lee T, Hor-
nes M, Frijters A, Pot J, Peleman J, Kuiper M, Zabeau M.
AFLP: a new technique for DNA fingerprinting. Nucl Acids
Res, 1995, 23: 4407–4414
[8] Gupta M, Chyi Y S, Romero-Severson J, Owen J L. Amplifi-
cation of DNA markers from evolutionarily diverse genomes
using single primers of simple-sequence repeats. Theor Appl
Genet, 1994, 89: 998–1006
[9] Zietkiewicz E, Rafalski A, Labuda D. Genome fingerprinting
by simple sequence repeats (SSR)-anchored PCR amplifica-
tion. Genomics, 1994, 20: 176–183
[10] Li G, Quiros C F. Sequence-related amplified polymorphism
(SRAP), a new marker system based on a simple PCR reac-
tion: its application to mapping and gene tagging in Brassica.
Theor Appl Genet, 2001, 103: 455–461
[11] Chang R Y, O’Donoughue L S, Bureau T E. Inter-MITE
polymorphism (IMP): a high throughput transposon-based
genome mapping and fingerprinting approach. Theor Appl
Genet, 2001, 102: 773–781
[12] Wenzl P, Carling J, Kudrna D, Jaccoud D, Huttner E, Klein-
hofs A, Kilian A. Diversity arrays technology (DArT) for
whole-genome profiling of barley. Proc Natl Acad Sci USA,
2004, 101: 9915–9920
[13] Coussirat J C. Genetic diversity and varietal identification in
Nicotiana tabacum with RAPD markers. Annual du Tabac
Section 2, 1994
[14] Bai D, Reeleder R, Brandle J E. Identification of two RAPD
markers tightly linked with the Nicotiana debneyi gene for
resistance to black root rot of tobacco. Theor Appl Genet,
1995, 91: 1184–1189
[15] Lin T Y, Kao Y Y, Lin S, Lin R F, Chen C M, Huang C H,
Wang C K, Lin Y Z, Chen C C. A genetic linkage map of
Nicotiana plumbaginifolia / Nicotiana longiflora based on
RFLP and RAPD markers. Theor Appl Genet, 2001, 103:
905–911
[16] Ren N, Timko M P. AFLP analysis of genetic polymorphism
and evolutionary relationships among cultivated and wild
Nicotiana species. Genome, 2001, 44: 559–571
[17] Johnson E S, Wolff M F, Wernsman E A, Rufty R C. Marker-
assisted selection for resistance to black shank disease in to-
bacco. Plant Dis, 2002, 86: 1303–1309
[18] Lewis R S, Milla S R, Levin J S. Molecular and genetic char-
acterization of Nicotiana tabacum L. chromosome segments
in tobacco mosaic virus-resistant tobacco accessions. Crop Sci,
2005, 45: 2355–2362
[19] Julio E, Verrier J L, de Borne F D. Development of SCAR
markers linked to three disease resistances based on AFLP
within Nicotiana tabacum L. Theor Appl Genet, 2006, 112:
335–346
[20] 祁建民, 王涛, 陈顺辉, 周东新, 方平平, 陶爱芬, 梁景霞,
吴为人. 部分烟草种质遗传多样性与亲缘关系的 ISSR标记
分析. 作物学报, 2006, 32: 373–378
Qi J M, Wang T, Chen S H, Zhou D X, Fang P P, Tao A F,
Liang J X, Wu W R. Genetic diversity and genetic relatives of
tobacco germplasm based on inter-simple sequence repeat
(ISSR). Acta Agron Sin, 2006, 32: 373–378 (in Chinese with
English abstract)
[21] 马红勃 , 祁建民 , 李延坤 , 梁景霞 , 王涛 , 兰涛 , 陈顺辉 ,
陶爱芬, 林荔辉, 吴建梅. 烟草 SRAP 和 ISSR 分子遗传连
锁图谱构建. 作物学报, 2008, 34: 1958–1963
Ma H B, Qi J M, Li Y K, Liang J X, Wang T, Lan T, Chen S H,
Tao A F, Lin L H, Wu J M. Construction of A molecular ge-
netic linkage map of tobacco based on SRAP and ISSR mark-
ers. Acta Agron Sin, 2008, 34: 1958–1963 (in Chinese with
English abstract)
[22] Lu X P, Gui Y J, Xiao B G, Li Y P, Tong Z J, Liu Y, Bai X F,
404 作 物 学 报 第 40卷
Wu W R, Xia L, Hunttner E, Kilian A, Fan L J. Development
of DArT markers for a linkage map of flue-cured tobacco.
Chin Sci Bull, 2013, 58: 641–648
[23] 高玉龙, 桂毅杰 , 肖炳光, 薄世平, 严广号, 樊龙江 . 烟草
MITE 位点间多态性(IMP)标记开发及其遗传作图应用. 浙
江大学学报(农业与生命科学版), 2012, 38: 655–661
Gao Y L, Gui Y J, Xiao B G, Bo S P, Yan G H, Fan L J. De-
velopment of tobacco inter-MITE polymorphism (IMP)
markers and its application in genetic mapping. J Zhejiang
Univ (Agric & Life Sci), 2012, 38: 655–661 (in Chinese with
English abstract)
[24] Bindler G, van der Hoeven R, Gunduz I, Plieske J, Ganal M,
Rossi L, Gadani F, Donini P. A microsatellite marker based
linkage map of tobacco. Theor Appl Genet, 2007, 114:
341–349
[25] Bindler G, Plieske J, Bakaher N, Gunduz I, Ivanov N, Van der
Hoeven R, Ganal M, Donini P. A high density genetic map of
tobacco (Nicotiana tabacum L.) obtained from large scale
microsatellite marker development. Theor Appl Genet, 2011,
123: 219–230
[26] Semagn K, Bjornstad A, Ndjiondjop M N. An overview of
molecular marker methods for plants. Afr J Biotechnol, 2006,
5: 2540–2568
[27] Helyar S J, Hemmer-Hansen J, Bekkevold D, Taylor M I,
Ogden R, Limborg M T, Cariani A, Maes G E, Diopere E,
Carvalho G R, Nielsen E E. Application of SNPs for
population genetics of nonmodel organisms: new
opportunities and challenges. Mol Ecol Resour, 2011,
11(suppl-1): 123–136
[28] Altshuler D, Pollara V J, Cowles C R, Van Etten W J, Baldwin
J, Linton L, Lander E S. An SNP map of the human genome
generated by reduced representation shotgun sequencing.
Nature, 2000, 407: 513–516
[29] Du Y, Jiang H, Chen Y, Li C, Zhao M, Wu J, Qiu Y, Li Q,
Zhang X. Comprehensive evaluation of SNP identification
with the Restriction Enzyme-based Reduced Representation
Library (RRL) method. BMC Genomics, 2012, 13: 77
[30] van Orsouw N J, Hogers R C, Janssen A, Yalcin F, Snoeijers S,
Verstege E, Schneiders H, van der Poel H, van Oeveren J,
Verstegen H, van Eijk M J. Complexity reduction of poly-
morphic sequences (CRoPS): a novel approach for large-scale
polymorphism discovery in complex genomes. PLoS ONE,
2007, 2: e1172
[31] Baird N A, Etter P D, Atwood T S, Currey M C, Shiver A L,
Lewis Z A, Selker E U, Cresko W A, Johnson E A. Rapid SNP
discovery and genetic mapping using sequenced RAD mark-
ers. PLoS ONE, 2008, 3: e3376
[32] Elshire R J, Glaubitz J C, Sun Q, Poland J A, Kawamoto K,
Buckler E S, Mitchell S E. A robust, simple genotyping-
by-sequencing (GBS) approach for high diversity species.
PLoS ONE, 2011, 6: e19379
[33] Davey J W, Hohenlohe P A, Etter P, Boone J, Catchen J,
Blaxter M L. Genome-wide genetic marker discovery and
genotyping using next-generation sequencing. Nat Rev Genet,
2011, 12: 499–510
[34] Nishi T, Tajima T, Noguchi S, Ajisaka H, Negishi H. Identifi-
cation of DNA markers of tobacco linked to bacterial wilt
resistance. Theor Appl Genet, 2003, 106: 765–770
[35] 肖炳光 , 徐照丽 , 陈学军 , 申爱荣 , 李永平 , 朱军 . 利用
DH 群体构建烤烟分子标记遗传连锁图 . 中国烟草学报 ,
2006, 12(4): 35–40
Xiao B G, Xu Z L, Chen X J, Shen A R, Li Y P, Zhu J. Genetic
linkage map constructed by using a DH population for the
flue-cured tobacco. Acta Tab Sin, 2006, 12(4): 35–40 (in
Chinese with English abstract)
[36] Lu X P, Xiao B G, Li Y P, Gui Y J, Wang Y, Fan L J. Diversity
arrays technology (DArT) for studying the genetic polymor-
phism of flue-cured tobacco (Nicotiana tabacum). J Zhejiang
Univ-Sci B (Biomed & Biotechnol), 2013, 14: 570–577
[37] Tong Z, Yang Z, Chen X, Jiao F, Li X, Wu X, Gao Y, Xiao B,
Wu W. Large-scale development of microsatellite markers in
Nicotiana tabacum and construction of a genetic map of
flue-cured tobacco. Plant Breed, 2012, 131: 674–680
[38] Murry H G, Thomspon W F. Rapid isolation of weight DNA.
Nucl Acids Res, 1980, 8: 4321–4322
[39] Edgar R C. Search and clustering orders of magnitude faster
than BLAST. Bioinformatics, 2010, 26: 2460–2461
[40] Trick M, Long Y, Meng J, Bancroft I. Single nucleotide
polymorphism (SNP) discovery in the polyploid Brassica
napus using Solexa transcriptome sequencing. Plant
Biotechnol J , 2009, 7: 334–346
[41] Van Ooijen J W. JoinMap 4.0, Software for the Calculation of
Genetic Linkage Maps in Experimental Populations. Kyazma
B V, Wageningen
[42] Voorrips R E. MapChart: software for the graphical presenta-
tion of linkage maps and QTLs. J Hered, 2002, 93: 77–78