免费文献传递   相关文献

Next-generation Sequencing for Molecular Marker Development in Maize Inbred H99

基于全基因组重测序信息开发玉米H99自交系特异分子标记



全 文 :作物学报 ACTA AGRONOMICA SINICA 2014, 40(2): 191−197 http://zwxb.chinacrops.org/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由江苏省农业科技自主创新资金[CX(12)5020]和江苏省“六大人才高峰”B类项目(005085311107)资助。
* 通讯作者(Corresponding author): 赵涵, E-mail: zhaohancn@gmail.com
第一作者联系方式: E-mail: lyd0527@126.com (吕远大); litan221@163.com (李坦) **同等贡献(Contributed equally to this work)
Received(收稿日期): 2013-06-03; Accepted(接受日期): 2013-08-30; Published online(网络出版日期): 2013-11-14.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20131114.1709.007.html
DOI: 10.3724/SP.J.1006.2014.00191
基于全基因组重测序信息开发玉米 H99自交系特异分子标记
吕远大 1,** 李 坦 1,** 石 丽 2 张晓林 1 赵 涵 1,*
1江苏省农业科学院农业生物技术研究所, 江苏南京 210014; 2扬州大学生物科学与技术学院, 江苏扬州 225009
摘 要: 随着基因组测序技术和计算生物学的发展, 利用生物信息学的方法大规模挖掘基因组特异分子标记已成为
可能。玉米自交系 H99 具有较强的可再生能力, 是玉米转基因研究的主要供体材料, 但是目前对 H99 基因组信息了
解甚少。本研究利用高通量 Illumina 测序技术, 对 H99 全基因组进行重测序, 利用生物信息学手段大规模挖掘并开
发了 4043个 H99特异性的 SSR分子标记。随后利用模拟 PCR策略, 对开发的 SSR分子标记进行电子多态性筛选, 针
对 B73×H99、Mo17×H99 和 B73×Mo17 三个群体亲本组合共开发 2699 候选的特异多态性 SSR 分子标记。随机挑选
20对 SSR分子标记对群体亲本 B73、H99和 Mo17进行多态性筛选, 进一步证实候选的多态性具有 95%的准确率。
此外, 基于 B73 参考序列对开发的多态性 SSR 分子标记进行全基因组染色体定位及基因注释, 揭示了候选多态性
SSR 分子标记在全基因组及基因内的分布特征。为玉米自交系 H99 开发了大量的分子标记资源, 同时也为快速开发
品种间多态性分子标记提供了一套高效可行的分析方法。
关键词: 玉米 H99自交系; 高通量测序; 电子 PCR; 多态性 SSR
Next-generation Sequencing for Molecular Marker Development in Maize In-
bred H99
LÜ Yuan-Da1,**, LI Tan1,**, SHI Li2, ZHANG Xiao-Lin1, and ZHAO Han1,*
1 Institute of Agricultural Biotechnology, Jiangsu Academy of Agricultural Sciences, Nanjing 210014, China; 2 College of Bioscience and Biotechno-
logy, Yangzhou University, Yangzhou 225009, China
Abstract: Next Generation Sequencing (NGS) has provided an effective approach to reveal the large scale of DNA polymorphic
loci used as molecular markers to distinguish the genetic variations among different genotypes. Maize inbred line H99 is a com-
mon transgenic genotype with its desirable regeneration capacity. However, the genome sequence of H99 is unsequenced, which
lags the molecular marker development for further maker assisted selection. Here, we used next generation sequencing to rese-
quence H99 whole genome. The contigs assembled with SOAPdenovo2 were further scanned for potential SSR loci by MISA
software. Out of 8268 SSR loci, 4043 site-specific primers flanking SSR loci were designed and surveyed in silico for locus
polymorphism among H99, B73, and Mo17. Around 2699 SSR loci showed the polymorphism among above three genotypes.
Twenty primer pairs from 20 arms of maize chromosomes were selected and validated, and 19 primers amplified the predicted
fragments. In addition, we physically mapped and annotated the polymorphic SSR loci, and elucidated the loci distribution in
genome. Taken all together, the new developed SSR primers and their information, as a complement to previous ones, were ex-
pected to be beneficial to map based cloning and marker-assisted selection.
Keywords: Maize inbred line H99; High throughout sequencing; ePCR; Polymorphic SSR
分子标记是重要农艺性状基因的克隆和分子育
种必不可少的工具。目前常用的分子标记主要有
RFLP、RAPD、AFLP、SSR、STS 和 SNP 等[1-4]。
其中, SSR标记具备多态性丰富、重复性好、易于使
用、可检测位点多、共显性且均匀分布整个基因组
等优点, 已成为遗传和育种研究中最为广泛应用的
分子标记[3,5]。利用玉米 B73及 Mo17杂交的 F1群体
内个体进行 4 代互交, 随后连续自交发展的重组自
192 作 物 学 报 第 40卷


交系 IBM 群体, 用该群体已成功将上千个根据 B73
基因组中重复序列设计的 SSR分子标记定位在玉米
10 条染色体上[6]。SSR 分子标记已被广泛应用于其
他玉米亲本组合连锁群构建、多样性分析、杂种纯
度检测等研究中, 但是由于它们主要来源于 B73 基
因组并应用于 B73 和 Mo17 的分离群体, 导致其多
态性在其这些亲本组合中相对较低[7-9]。
近年来, 基因组测序技术的迅猛发展, 尤其是
以 Illumina公司发展的边合成边测序(sequencing by
synthesis)为技术核心的第二代测序已被广泛应用于
动植物全基因组测序、基因组重测序、转录组、sRNA
和表观基因组等方面的研究[10-15]。Lai实验室利用该
技术对中国6个玉米优良自交系重测序后 , 又对近
250个自交系进行了重测序工作[16]。冷泉港实验室也
对近200个从全世界搜集的玉米自交系测序 , 将原
始测序结果提交 NCBI 数据库[17]。通过生物信息学
分析比较发现, 玉米不同基因型中存在着大量的序
列变异, 其中 SNP和小 InDel的数量尤为突出。Lai
等 [16]估算中国6个玉米优良自交系的非重复区大约
存在1 272 134个 SNP 和30 178个 InDel, 其中约有
68 966个 SNP和571个 InDel位于功能基因内。这些
序列的变异直接导致了玉米表现型的多样性, 同样
也为揭示玉米重要农艺性状的遗传基础提供了标记
位点。SNP 标记被认为是高通量、低成本的分子标
记, 但是由于芯片设计、试剂、检测仪器成本高等
原因, 限制了其应用范围[4]。SSR与 InDel则主要表
现在序列长度的多态性。但是由于生物信息算法的
局限性和测序深度较低等原因, 发现的 InDel 往往
分布在1~10 bp范围内, 为多态性检测带来了一定的
难度[18-20]。玉米中由于存在较多转座子, SSR位点的
多态性表现得极为丰富且长度差异加大[21]。通过特
异性引物的 PCR扩增、琼脂糖凝胶电泳或聚丙烯酰
胺凝胶电泳、放射自显影或银染技术等, 就可以检
测到在简单重复序列重复次数不同的 DNA 区域的
多态性。
与传统 SSR分子标记的开发相比, 基于 NGS高
通量测序数据的大规模 SSR 开发, 因其高通量、高
覆盖度、高密度及可操作性等优点而被应用于多个
物种的分子标记资源开发。Zalapa 等[22]提出了利用
NGS 高通量454测序技术开发植物 SSR 分子标记的
策略, 利用大果越桔(Vaccinium macrocarpon) 454高
通量测序数据开发了 SSR 分子标记, 随后通过实验
检测了该方法的可行性和准确性。Yu 等[23]利用454
高通量测序数据快速高效开发了河鹿 (Hydropotes
inermis argyropus)的 SSR分子标记。Wang等[24]利用
Illumina 高通量测序技术对菊花脑(Chrysanthemum
nankingense)转录组进行 Paired-end 双末端测序, 并
进一步开发了 SSR 分子标记。然而, 在高通量 SSR
分子标记开发的同时也带来了引物合成等实验成本
的增加, 加上 SSR 分子标记的多态率普遍较低, 更
造成了资源上的浪费和时间的损耗。Yonemaru等[25]
利用高粱(Sorghum bicolor)全基因组鸟枪法测序数
据开发了 SSR 分子标记, 进一步利用 ePCR 策略进
行电子多态性预筛选, 提高了 SSR 标记的多态率和
可用性。Lü 等 [26-27]基于海岛棉 (Gossypium barba-
dense)基因组数据资源, 先后利用 ePCR策略对挖掘
的 SSR、InDel分子标记进行了多态性预筛选, 极大
地增加了多态性分子标记资源, 同时也大大降低了
实验成本。
本研究利用 Illumina 高通量基因组重测序技术,
及生物信息学手段, 准确、快速地开发了一套基于
玉米 H99基因型的 SSR分子标记, 随后通过计算机
模拟筛选出可用于 B73×H99、Mo17×H99 和 B73×
Mo173 个群体的候选多态性 SSR分子标记, 为其相
关分子育种研究提供重要的基础, 同时也为发展分
子标记提供一套高效的分析方法。
1 材料与方法
1.1 供试材料及全基因组测序
供试材料为 B73、Mo 17、H99三种玉米自交系。
用其叶片按照Karroten植物基因组DNA提取试剂盒
相关步骤提取 DNA。用 0.8%的琼脂糖凝胶检测提取
的 DNA 样本质量。H99 全基因组重测序采用
Illumina HiSeq 2000 测序仪, 由上海翰宇生物技术
有限公司完成。
1.2 序列清理及全基因组装
H99 全基因组 Illumina 下机测序数据 , 通过
CASAVA 1.8.2 (http://www.illumina.com/)程序将测
序峰图转化产生碱基及质量值。进一步利用
SolexaQA[28]软件包对原始测序数据进行质量(Q20,
Phred-Score≥20 即 1%的错误率)和测序长度(L20,
长度≥20 bp)过滤。
随后, 利用 SOAPdenovo2[29]组装软件对清理后
的序列进行后续的全基因组从头 de novo 组装。
SOAPdenovo2 采用 De Bruijn Graph 算法, 组装对
K-mer值设置有较大的依赖。本研究中, 通过 31~49
第 2期 吕远大等: 基于全基因组重测序信息开发玉米 H99自交系特异分子标记 193


共 10 个梯度值(K 值须为奇数)分别组装, 最终根据
组装后 Scaffolds N50 大小来选取最优 K-mer, 进而
确定最优组装结果, 其余参数均为默认。
1.3 全基因组 SSR挖掘及标记开发
利用 MISA (http://pgrc.ipk-gatersleben.de/misa/)
SSR挖掘程序搜索 H99全基因组 SSR信息, 进一步
利用 SSR侧翼序列设计 PCR特异引物, 开发 SSR分
子标记。本研究中, SSR的查找标准为单核苷酸重复
≥20, 二核苷酸重复次数≥10, 三核苷酸重复次数
≥7, 四核苷酸重复次数≥5, 五核苷酸重复次数≥4,
六核苷酸重复次数≥4, 复合型的 SSR 整体长度不
小于 24 bp。SSR引物设计由 Primer3程序完成[30]。
引物设计的主要参数为引物长度 18~20 bp, 最适
20 bp; PCR产物长度 100~250 bp; Tm值 45~55℃, 最
适 50℃; GC含量为 45%~65%, 最适 50%。所有引物
均由上海生工生物科技有限公司合成。
1.4 多态性 SSR分子标记电子筛选
鉴于 B73、Mo17基因组序列资源的存在, 使得
利用模拟 PCR策略对H99 SSR标记引物进行电子多
态性筛选成为可能。用所有 SSR引物分别与 B73、
Mo17 及 H99 基因组进行了模拟 PCR 扩增 , 进一
步 通 过 ePCR 软 件 (http://www.ncbi.nlm.nih.gov/
projects/e-pcr/)分析了 SSR标记位点的多态性。利用
本地数据库预测 PCR在不同基因型材料之间的扩增
长度, 模拟中碱基错配值 Mismatch≤3 bp。随后, 通
过电子多态性筛选的候选多态性 SSR 分子标记, 用
于进一步的染色体定位和基因组注释。
1.5 全基因组定位及注释
为了进一步揭示 SSR相关的基因组信息及变异
效应, 利用所开发的 SSR 分子标记保守侧翼序列,
结合玉米 B73 (V2)基因组序列及基因注释信息, 采
用 SNPeff [31]全基因组注释程序对候选多态性标记
进行物理定位和基因组注释。
1.6 PCR扩增和电泳多态性检测
为了进一步考察候选多态性 SSR 的准确性, 我
们在每条染色体臂上共随机挑选 20对新开发的 SSR
引物, 在 B73、Mo17和 H99基因组中进行了多态性
验证。PCR反应总体系为 25 μL, 包括 10×buffer (含
Mg2+) 2.5 μL, dNTP 2.5 μL, Taq DNA聚合酶 0.1 μL,
引物 2 μL, 模板 DNA 2 μL, ddH2O 15.9 μL, 上覆
20 μL矿物油。PCR反应程序为, 94℃预变性 3 min,
94℃变性 30 s, 58℃退火 1 min, 72℃延伸 80 s, 共进
行 38个循环。用 2%琼脂糖凝胶加压 100 V电泳, 紫
外透射仪上观察、照相。
2 结果与分析
2.1 H99全基因组测序及 de novo组装
利用 Illumina Paired-End 双端 100 bp×2 测序,
共获得 21 Gb玉米 H99基因组数据。NCBI中 SRA
数据库释放了一组 Paired-End 150 bp×2的 H99基因
组数据(SRR671686), 总碱基数约 1.9 Gb, 合计约 23
Gb 碱基量, 约覆盖 10×基因组。随后, 通过 Q20 质
量过滤和 L20长度清理, 数据碱基数约 22 Gb, 平均
序列长度 98.4 bp (表 1)。证实了 H99基因组数据具
有较高的测序质量。

表 1 H99全基因组测序数据汇总
Table 1 Summary of H99 whole-genome sequencing
基本信息
Basic information
原始数据
Raw data
清理后数据
Cleaned data
总碱基数 Total bases 23176097676 22068714091
总序列数 Total reads 125147493×2 117144630×2
平均长度Mean length (bp) 100 98.4
组装重叠群 Contigs 2894673 (N50200 bp)
组装框架 Scaffolds 186042 (N50236 bp)
最长重叠群序列 Longest contig 6594 bp
最长框架序列 Longest scaffold 8258 bp

清理后数据经 SOAPdenovo2组装程序, de novo
从头拼接, 通过多 k-mer 值(31–49)组装筛选, 根据
N50 大小筛选出最优 k-mer 为 43, 确定为最优组装
结果。组装后共获得 2 894 673条 Contig (≥100 bp),
N50为 200 bp, 最长的 Contig为 6594 bp, 总共拼接
的长度为 570 456 877 bp。利用 Paired-end信息, 进
一步构建 Scaffolds后, 获得 186 042条 Scaffolds序
列, 最长 Scaffold 为 8258 bp, N50 为 236 bp, 共
128 707 495 bp (表 1)。随后, ≥400 bp的 Scaffolds
序列被用于后续的 SSR挖掘。
2.2 SSR发掘及分子标记开发
利用 MISA软件搜寻含 1~6个重复基元的 SSR
区间, 共获得 8268 个 SSR 位点, 分布于 8139 条
Contigs 序列中。其中, 单一重复类型(单个重复基
元) SSR有 8200个(99.18%), 而复合型(多个重复基
元) SSR则有 68个(0.82%)。重复基元分析显示, 分
布最多的重复基元为二核苷酸重复, 占 32.99%, 随
后五核苷酸重复占 22.08%, 四核苷酸重复占
20.26%, 三核苷酸重复占 15.04%, 六核苷酸重复
占 9.15%以及单核苷酸重复仅 0.47%。此外, 重复
194 作 物 学 报 第 40卷


基元类型分析结果显示, 8268个 SSR中共有 368种
重复基元(Motif), 其中, 所占比例最大的是 AG/CT
(19.77%), 其次为 AT 占 9.98%, AAAT/ATTT 占
4.06% (图 1)。
进一步利用 Primer3程序, 针对 SSR位点两端侧
翼序列, 共设计出 4043对 SSR引物, 用于后续分析。

图 1 SSR重复基元类型分布频率
Fig. 1 Frequency of SSR motif types

2.3 电子多态性筛选
鉴于 B73、Mo17基因组序列资源的存在, 使得
利用 ePCR策略对 H99 SSR标记引物进行电子多态
性筛选成为可能。4043 对 SSR 引物分别与 B73、
Mo17及 H99基因组序列进行了 ePCR扩增, 进一步
分析了标记位点的多态性。结果发现, B73×H99间差
异的有 2223个候选位点, ≥10 bp的标记有 1023个;
Mo17×H99 间有 1684 个候选多态性位点, ≥10 bp
有 746个; B73×Mo17间则有 1427个多态性位点, ≥10
bp的有 664个(图 2)。因此, 针对不同群体组合及电
子多态性统计结果, 选取多态片段≥10 bp, 分别针
对 B73×H99、Mo17×H99和 B73×Mo17群体开发了
3套候选的多态性 SSR标记。此外, 826个 SSR分子
标记同时适用于 3个群体中, 呈现了较好的通用性。

图 2 分别用于 B73×H99、Mo17×H99和 B73×Mo17群体的候
选多态性 SSR标记
Fig. 2 Candidate polymorphic SSR markers for B73×H99,
Mo17×H99, and B73×Mo17 populations
详细的候选多态性分子标记引物信息可见网址
(ftp://ftp.maizegenes.org/pub/H99paper_S1.xls)。
2.4 候选多态性 SSR基因组定位及注释
基于 B73 参考基因组, 利用 SNPeff V3 基因组
注释程序, 对 3套候选的多态性 SSR合计 2699分子
标记进行了染色体定位和基因组注释。染色体定位
结果显示, 在 2699个新开发的 SSR标记中, 2557个
SSR 标记被成功定位到 B73 参考基因组上, 其中
2074 (76.84%) 特异性地定位到一个位点 , 仅有
483 (17.90%)定位到多个位点, 而余下 142 (0.53%)
则未能定位到玉米 B73 (V2)参考基因组。此外, 有
18个 SSR被定位在未知区域, 缺少染色体信息, 1个
SSR被定位在线粒体中。除预测的着丝粒位置附近,
SSR 引物位置在染色体上基本呈均匀分布。详细的
SSR标记物理定位图见网址(ftp://ftp.maizegenes.org/
pub/H99paper_S2. pdf)。
进一步通过全基因组注释, 2074 SSR标记特异
性定位位点中, 非编码区 3′ UTR存在 92个, 5′ UTR
存在 101 个; 内含子区存在 360 个; 外显子区存在
186 个; 调控区(启动子区 Promoter-TSS 有 427 个;
TTS有 303个); 基因间区含 605个(图 3)。而 483 SSR
标记定位多达 6052个位点, 这些 SSR标记往往涉及
多个基因信息。详细的基因组定位及注释信息见网
址(ftp://ftp.maizegenes.org/pub/H99paper_S3.xls)。
2.5 SSR分子标记多态性检测
为了进一步考察候选多态性 SSR 的准确性, 在
每条染色体臂上随机挑选一个新开发引物, 共计 20
对, 在 B73、Mo17和 H99基因组中进行了多态性验
第 2期 吕远大等: 基于全基因组重测序信息开发玉米 H99自交系特异分子标记 195


证。通过琼脂糖凝胶电泳发现, 在检测的 20对 SSR
引物中, 19对引物可以清楚揭示 B73、Mo17和 H99
基因组 DNA之间的多态, 多态率达 90% (图 4)。同
时, PCR产物片段大小与 ePCR预测结果完全吻合。
这一结果进一步证实了通过 ePCR 模拟策略预测分
子标记多态性的准确性和可行性。

图 3 基于 B73基因组的 SSR基因组注释分析
Fig. 3 Variant annotation of SSR based on B73 gene set

图 4 3个玉米自交系(B73、Mo17和 H99)中 20对 SSR引物基因组扩增的电泳图
Fig. 4 Banding patterns of 20 SSR primer pairs in three maize inbred lines (B73, Mo17, and H99)
m: marker; B: B73; M: Mo17; H:H99.

3 讨论
玉米自交系 H99具有较好的二型愈伤诱导率 ,
已被广泛作为农杆菌介导转基因受体亲本[32]。但是
H99配合力差 , 很难直接作为杂交种亲本 , 只有使
用其他自交系作为轮回亲本, 结合前景和背景选择,
才能把目的基因快速转入优良自交系中[33]。背景选
择的关键是要获得足够的均匀分布在全基因组的分
子标记。本研究利用 Illumina HiSeq 2000对 H99自交
系10倍理论覆盖率进行全基因组测序, 经过一系列
的优化组装 , SSR 位点扫描 , 分别针对3个群体
B73×H99、Mo17×H99以及 B73×Mo17亲本基因组序
列进行 SSR电子多态性筛选, 共开发了2699个分布于
玉米10条染色体的候选的多态性 SSR标记引物。
高通量测序技术的发展以及数据分析软件的不
断完善, 利用二代测序结果发展各种分子标记已经
成为可能[11,15]。NCBI目前已公布近 400个玉米自交
系重测序结果, 通过简单的过滤、比对、拼接及位
点查找 , 可以很快找到自交系组合间多态性位点 ,
如 SNP、InDel、SSR等。据估计, 玉米每 76个碱基
就存在一个 SNP位点, 但由于受到检测费用的限制,
SNP 分子标记主要应用于遗传图谱构建, 全基因组
关联分析(GWAS)等群体单株数目相对较少的遗传
研究, 而很少用于遗传育种中大群体样本选择过程,
如分子标记辅助遗传育种中的背景选择[34-38]。InDel
在玉米基因组中也广泛分布 , 但是受重测序深度 ,
算法等因素限制, 目前往往仅检测到小于 10 bp 的
小 InDel, 且假阳性率较高[39]。而且根据单个小 InDel
设计的分子标记检测起来较为困难。SSR 序列多态
性的出现是由于同一物种中不同基因型的寡聚核苷
酸重复次数不同造成的, 而重复次数的多态性与染
色体复制时的滑动或染色单体的不等交换相关。尽
管 SSR 位点在玉米基因组上分布远不如 SNP 和
InDel密集, 但是侧翼序列通常都是保守性较强的单
一序列, 便于设计 PCR引物。本研究利用 SSR侧翼
序列设计的引物, 在 3种基因型 DNA中扩增成功率
达到了 100%。
通过功能注释发现, 大多数候选的多态性 SSR
位点主要位于玉米功能基因区域(71%), 而分布在
基因间区的标记约占 29%。分布于功能基因区间的
196 作 物 学 报 第 40卷


SSR 分子标记由于与功能基因紧密相连, 可被开发
成功能性分子标记, 显著提高分子标记对目的功能
基因的选择效率。对玉米 H99 SSR位点详细分析后
发现, 仍然有 SSR 位点无法物理定位在玉米测序品
种 B73 参考基因组上。究其原因, 一方面玉米 B73
基因组中仍存在大量的未测序区间, 另一方面玉米
不同品种基因组中广泛存在着 PAV (presence-
absence variation)区段[16], 这些未能定位的 SSR 可
能来自 H99的特异性区域。
4 结论
利用玉米自交系 H99 Illumina 高通量重测序数
据, 针对 B73×H99、Mo17×H99 和 B73×Mo17 三个
群体亲本组合开发了各自特异多态性 SSR 分子标记,
为研究不同群体材料间遗传差异分析、分子遗传图
谱构建、深入揭示基因的染色体分布特征及基因组
变异等奠定了重要的基础。同时, 高通量测序技术
结合多基因组交互 ePCR 的生物信息学分析策略,
为大规模开发基因型专化多态性 SSR分子标记提供
了重要的思路和研究方法。
References
[1] Agarwal M, Shrivastava N, Padh H. Advances in molecular
marker techniques and their applications in plant sciences. Plant
Cell Rep, 2008, 27: 617–631
[2] Blears M J, De Grandis S A, Lee H, Trevors J T. Amplified frag-
ment length polymorphism (AFLP): a review of the procedure
and its applications. J Ind Microbiol Biot, 1998, 21: 99–114
[3] Hayden M J, Sharp P J. Targeted development of informative mi-
crosatellite (SSR) markers. Nucl Acids Res, 2001, 29: e44
[4] Khlestkina E K, Salina E A. SNP markers: methods of analysis,
ways of development, and comparison on an example of common
wheat. Russ J Genet, 2006, 42: 585–594
[5] Gupta P K, Balyan H S, Sharma P C, Ramesh B. Microsatellites
in plants: a new class of molecular markers. Curr Sci, 1996, 70:
45–53
[6] Lee M, Sharopova N, Beavis W D, Grant D, Katt M, Blair D,
Hallauer A. Expanding the genetic map of maize with the inter-
mated B73 times Mo17 (IBM) population. Plant Mol Biol, 2002,
48: 453–461
[7] Barcaccia G, Pallottini L, Parrini P, Lucchin M. A genetic linkage
map of a flint maize (Zea mays var. indurata L.) Italian landrace
using a one-way pseudo-testcross strategy and multilocus
PCR-based markers. Maydica, 2006, 51: 469–480
[8] Cone K C, Mcmullen M D, Bi I V, Davis G L, Yim Y, Gardiner J
M, Polacco M L, Sanchez-Villeda H, Fang Z, Schroeder S G,
Havermann S A, Bowers J E, Paterson A H, Soderlund C A,
Engler F W, Wing R A, Coe E H Jr. Genetic, physical, and infor-
matics resources for maize. On the road to an integrated map.
Plant Physiol, 2002, 130: 1598–1605
[9] Edwards M D, Stuber C W, Wendel J F. Molecular-marker-
facilitated investigations of quantitative-trait loci in maize: I.
Numbers, genomic distribution and types of gene action. Gene-
tics, 1987, 116: 113–125
[10] Mardis E R. Next-generation DNA sequencing methods. Annu
Rev Genomics Hum Genet, 2008, 9: 387–402
[11] Mardis E R. The impact of next-generation sequencing technol-
ogy on genetics. Trends Genet, 2008, 24: 133–141
[12] Morozova O, Marra M A. Applications of next-generation se-
quencing technologies in functional genomics. Genomics, 2008,
92: 255–264
[13] Shendure J, Ji H. Next-generation DNA sequencing. Nat Bio-
technol, 2008, 26: 1135–1145
[14] Su Z, Ning B, Fang H, Hong H, Perkins R, Tong W, Shi L.
Next-generation sequencing and its applications in molecular di-
agnostics. Expert Rev Mol Diagn, 2011, 11: 333–343
[15] Varshney R K, Nayak S N, May G D, Jackson S A. Next-gene-
ration sequencing technologies and their implications for crop
genetics and breeding. Trends Biotechnol, 2009, 27: 522–530
[16] Lai J, Li R, Xu X, Jin W, Xu M, Zhao H, Xiang Z, Song W, Ying
K, Zhang M, Jiao Y, Ni P, Zhang J, Li D, Guo X, Ye K, Jian M,
Wang B, Zheng H, Liang H, Zhang X, Wang S, Chen S, Li J, Fu
Y, Springer N M, Yang H, Wang J, Dai J, Schnable P S, Wang J.
Genome-wide patterns of genetic variation among elite maize in-
bred lines. Nat Genet, 2010, 42: 1027–1030
[17] Chia J M, Song C, Bradbury P J, Costich D, de Leon N, Doebley
J, Elshire R J, Gaut B, Geller L, Glaubitz J C, Gore M, Guill K E,
Holland J, Hufford M B, Lai J, Li M, Liu X, Lu Y, Mccombie R,
Nelson R, Poland J, Prasanna B M, Pyhajarvi T, Rong T, Sekhon
R S, Sun Q, Tenaillon M I, Tian F, Wang J, Xu X, Zhang Z, Ka-
eppler S M, Ross-Ibarra J, Mcmullen M D, Buckler E S, Zhang G,
Xu Y, Ware D. Maize HapMap2 identifies extant variation from a
genome in flux. Nat Genet, 2012, 44: 803–807
[18] Heesacker A, Kishore V K, Gao W, Tang S, Kolkman J M, Gingle
A, Matvienko M, Kozik A, Michelmore R M, Lai Z, Rieseberg L
H, Knapp S J. SSR and INDELs mined from the sunflower EST
database: abundance, polymorphisms, and cross-taxa utility.
Theor Appl Genet, 2008, 117: 1021–1029
[19] Mills R E, Luttig C T, Larkins C E, Beauchamp A, Tsui C, Pittard
W S, Devine S E. An initial map of insertion and deletion
(INDEL) variation in the human genome. Genome Res, 2006, 16:
1182–1190
[20] Pan C, Li A, Dai Z, Zhang H, Liu G, Wang Z, Ma Y, Yin Y, Zhang
Y, Zuo S, Chen Z, Pan X. InDel and SNP markers and their ap-
plications in map-based cloning of rice genes. Rice Sci, 2008, 15:
251–258
[21] Springer N M, Ying K, Fu Y, Ji T, Yeh C, Jia Y, Wu W, Richmond
T, Kitzman J, Rosenbaum H, Iniguez A L, Barbazuk W B, Jed-
deloh J A, Nettleton D, Schnable P S. Maize inbreds exhibit high
levels of copy number variation (CNV) and presence/absence
variation (PAV) in genome content. PLoS Genet, 2009, 5(11):
e1000734
[22] Zalapa J E, Cuevas H, Zhu H, Steffan S, Senalik D, Zeldin E,
Mccown B, Harbut R, Simon P. Using next-generation sequenc-
ing approaches to isolate simple sequence repeat (SSR) loci in the
plant sciences. Am J Bot, 2012, 99: 193–208
第 2期 吕远大等: 基于全基因组重测序信息开发玉米 H99自交系特异分子标记 197


[23] Yu J N, Won C, Jun J, Lim Y, Kwak M. Fast and cost-effective
mining of microsatellite markers using NGS technology: an ex-
ample of a Korean water deer Hydropotes inermis argyropus.
PLoS ONE, 2011, 6(11): e26933
[24] Wang H, Jiang J, Chen S, Qi X, Peng H, Li P, Song A, Guan Z,
Fang W, Liao Y, Chen F. Next-generation sequencing of the
Chrysanthemum nankingense (Asteraceae) transcriptome permits
large-scale unigene assembly and SSR marker discovery. PLoS
ONE, 2013, 8(4): e62293
[25] Yonemaru J, Ando T, Mizubayashi T, Kasuga S, Matsumoto T,
Yano M. Development of genome-wide simple sequence repeat
markers using whole-genome shotgun sequences of sorghum
[Sorghum bicolor (L.) Moench]. DNA Res, 2009, 16: 187–193
[26] Lü Y D, Zhao L, Xu X Y, Wang L, Wang C, Zhang T Z, Guo W Z.
Characterization of expressed sequence tags from developing fi-
bers of Gossypium barbadense and evaluation of insertion-
deletion variation in tetraploid cultivated cotton species. BMC
Genomics, 2013, 14: 170
[27] Lü Y D, Cai C P, Wang L, Lin S Y, Zhao L, Tian L L, Lü J H,
Zhang T Z, Guo W Z. Mining, characterization, and exploitation
of EST-derived microsatellites in Gossypium barbadense. Chin
Sci Bull, 2010, 55: 1889–1893
[28] Cox M P, Peterson D A, Biggs P J. SolexaQA: at-a-glance quality
assessment of Illumina second-generation sequencing data. BMC
Bioinform, 2010, 11: 485
[29] Luo R, Liu B, Xie Y, Li Z, Huang W, Yuan J, He G, Chen Y, Pan
Q, Liu Y, Tang J, Wu G, Zhang H, Shi Y, Liu Y, Yu C, Wang B, Lu
Y, Han C, Cheung D W, Yiu S M, Peng S, Xiaoqian Z, Liu G,
Liao X, Li Y, Yang H, Wang J, Lam T W, Wang J. SOAPdenovo2:
an empirically improved memory-efficient short-read de novo
assembler. Gigascience, 2012, 1: 18
[30] Rozen S, Skaletsky H. Primer3 on the WWW for general users
and for biologist programmers. Methods Mol Biol, 2000, 132:
365–386
[31] Cingolani P, Platts A, Wang L L, Coon M, Nguyen T, Wang L,
Land S J, Lu X, Ruden D M. A program for annotating and pre-
dicting the effects of single nucleotide polymorphisms, SnpEff:
SNPs in the genome of Drosophila melanogaster strain w1118;
iso-2; iso-3. Fly (Austin), 2012, 6(2): 80–92
[32] DHalluin K, Bonne E, Bossut M, De Beuckeleer M, Leemans J.
Transgenic maize plants by tissue electroporation. Plant Cell,
1992, 4: 1495–1505
[33] Frascaroli E, Cane M A, Landi P, Pea G, Gianfranceschi L, Villa
M, Morgante M, Pe M E. Classical genetic and quantitative trait
loci analyses of heterosis in a maize hybrid between two elite in-
bred lines. Genetics, 2007, 176: 625–644
[34] Begum F, Ghosh D, Tseng G C, Feingold E. Comprehensive lite-
rature review and statistical considerations for GWAS meta-
analysis. Nucl Acids Res, 2012, 40: 3777–3784
[35] Cantor R M, Lange K, Sinsheimer J S. Prioritizing GWAS results:
a review of statistical methods and recommendations for their
application. Am J Hum Genet, 2010, 86: 6–22
[36] Imamura M, Maeda S. Genetics of type 2 diabetes: the GWAS era
and future perspectives. Endocrine J, 2011, 58: 723–739
[37] Jeck W R, Siebold A P, Sharpless N E. Review: a meta-analysis
of GWAS and age-associated diseases. Aging Cell, 2012, 11:
727–731
[38] Valiente A, Lafuente A, Bernardo M. Systematic review of the
Genomewide Association Studies (GWAS) in schizophrenia. Re-
vista de Psiquiatría y Salud Mental, 2011, 4: 218–227
[39] Liu B, Wang Y, Zhai W, Deng J, Wang H, Cui Y, Cheng F, Wang
X, Wu J. Development of InDel markers for Brassica rapa based
on whole-genome re-sequencing. Theor Appl Genet, 2013, 126:
231–239