免费文献传递   相关文献

Mining and Identification of SNP from EST Sequences and Convertion of CAPS Markers in Soybean

大豆EST-SNP的挖掘鉴定及其CAPS标记的开发


SNPs widely distribute throughout genomes from non-coding regions to coding regions, constituting the most abundant molecular markers used in animal and plant genetic breeding. With the rapidly growing genome sequencing projects, a large amount of genomic and EST sequences has become available to the public. Many SNPs are identified by comparing genome sequences or ESTs obtained from genetically diverse lines or individuals in plants. However the SNP assay always relies on expensive equipments or reagent, which has limited the application of SNPs in genetics and breeding especially in plants. The CAPS marker, also known as PCR-RFLP marker, is the technique combining PCR and restriction enzymes digestion to detect the restriction fragment length polymorphisms. With the development of high-throughput sequencing technology, more and more SNPs are identified, among them many mutations have altered the restriction enzymes recognition sites. This provides an opportunity for high-through development of CAPS markers. With soybean genome sequences becoming available, high-throughput SNP marker development will significantly improve genetic mapping, map based cloning in soybean. To discover new SNPs in soybean, we aligned the ESTs with whole genome sequences in different soybean varieties and identified 537 EST-SNPs. The function of genes targeted by these EST-SNPs was analysed, the results showed that these genes participated in subcellular localization, protein binding or catalyzing, metabolic process and cell rescue, defense and disease resistance, etc. Most of these functions are involving in various physiological and biochemical processes influencing important agronomic traits. To develop easy assay method for these EST-SNPs, we identified the EST-SNPs which alter the restrict enzyme recognition sites by software EMBOSS, and 48 pair primers were designed to detect these EST-SNPs. forty-four pair primers amplified single bands (400–800 bp) from genomic DNA of Suinong 14 widely planted in the Northeast China. To verify the SNP polymorphisms, we used these primer pairs for PCR amplification from genomic DNA of Suinong 14, Hefeng 25, Acher, Evans, Peking, PI209332, Guxin wild soybean, Kefeng 1, Nannong 1138-2 and pool DNA of the nine soybean varieties. The PCR amplicons were sequenced, the traces of the 36 discordant ones were detected as candidate SNPs, which were then validated by re-sequencing the individuals. SNPs were identified using restriction enzymes


全 文 :作物学报 ACTA AGRONOMICA SINICA 2010, 36(4): 574−579 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家高技术研究发展计划(863 计划)项目(2006AA100104 和 2008AA10Z153), 农业部专项(2008ZX08004-002)和东北农业大学创新团
队项目(CXT004)资助。
*
通讯作者(Corresponding author): 朱延明, E-mail: ymzhu2001@yahoo.com.cn; Tel: 0451-55190734
第一作者联系方式: E-mail: syjun2003@126.com
Received(收稿日期): 2009-11-16; Accepted(接受日期): 2010-01-08.
DOI: 10.3724/SP.J.1006.2010.00574
大豆 EST-SNP的挖掘、鉴定及其 CAPS标记的开发
束永俊 李 勇 吴娜拉胡 柏 锡 才 华 纪 巍 朱延明*
东北农业大学生命科学学院, 黑龙江哈尔滨 150030
摘 要: 采用生物信息学方法将大豆 EST序列联配到大豆基因组序列上, 挖掘到大豆 EST-SNP位点 537个。对其靶
向基因进行功能注释分析, 发现他们主要参与亚细胞定位、蛋白质结合与催化以及代谢等与大豆重要农艺性状形成
相关的生物过程。同时开发了简便易行的 SNP检测方法, 利用 EMBOSS软件筛选导致酶切位点改变的 EST-SNP, 分
别以大豆绥农 14、合丰 25、Acher、Evans、Peking、PI209332、固新野生大豆、科丰 1号、南农 1138-2的 DNA及
其混合的 DNA为模板, 设计引物进行 PCR扩增, 发现 44个 PCR产物中有 36个测序峰图在预期的 EST-SNP位点表
现出多态性。酶切分析发现 26 个 PCR产物具有酶切多态性, 可以作为 CAPS 标记。结果表明该 EST-SNP 挖掘体系
及其 CAPS标记转化系统具有高效率、低成本等优点, 有利于促进大豆的遗传育种研究。
关键词: 大豆; 表达序列标签; 基因组序列; 单核苷酸多态性; 酶切扩增多态性序列
Mining and Identification of SNP from EST Sequences and Convertion of
CAPS Markers in Soybean
SHU Yong-Jun, LI Yong, WU Na-La-Hu, BAI Xi, CAI Hua, JI Wei, and ZHU Yan-Ming*
College of Life Science, Northeast Agricultural University, Harbin 150030, China
Abstract: SNPs widely distribute throughout genomes from non-coding regions to coding regions, constituting the most abundant
molecular markers used in animal and plant genetic breeding. With the rapidly growing genome sequencing projects, a large
amount of genomic and EST sequences has become available to the public. Many SNPs are identified by comparing genome se-
quences or ESTs obtained from genetically diverse lines or individuals in plants. However the SNP assay always relies on expen-
sive equipments or reagent, which has limited the application of SNPs in genetics and breeding especially in plants. The CAPS
marker, also known as PCR-RFLP marker, is the technique combining PCR and restriction enzymes digestion to detect the restric-
tion fragment length polymorphisms. With the development of high-throughput sequencing technology, more and more SNPs are
identified, among them many mutations have altered the restriction enzymes recognition sites. This provides an opportunity for
high-through development of CAPS markers. With soybean genome sequences becoming available, high-throughput SNP marker
development will significantly improve genetic mapping, map based cloning in soybean. To discover new SNPs in soybean, we
aligned the ESTs with whole genome sequences in different soybean varieties and identified 537 EST-SNPs. The function of genes
targeted by these EST-SNPs was analysed, the results showed that these genes participated in subcellular localization, protein
binding or catalyzing, metabolic process and cell rescue, defense and disease resistance, etc. Most of these functions are involving
in various physiological and biochemical processes influencing important agronomic traits. To develop easy assay method for
these EST-SNPs, we identified the EST-SNPs which alter the restrict enzyme recognition sites by software EMBOSS, and 48 pair
primers were designed to detect these EST-SNPs. forty-four pair primers amplified single bands (400–800 bp) from genomic DNA
of Suinong 14 widely planted in the Northeast China. To verify the SNP polymorphisms, we used these primer pairs for PCR am-
plification from genomic DNA of Suinong 14, Hefeng 25, Acher, Evans, Peking, PI209332, Guxin wild soybean, Kefeng 1, Nan-
nong 1138-2 and pool DNA of the nine soybean varieties. The PCR amplicons were sequenced, the traces of the 36 discordant
ones were detected as candidate SNPs, which were then validated by re-sequencing the individuals. SNPs were identified using
restriction enzymes, and the products of 26 pair primers with unequivocal restriction pattern were identified as CAPS markers.
The SNPs discovery and CAPS markers conversion system developed in this study is fast, low cost and efficient, and holds great
promise for molecular assisted breeding of soybean.
Keywords: Soybean; EST; Genome sequences; SNP; CAPS
第 4期 束永俊等: 大豆 EST-SNP的挖掘、鉴定及其 CAPS标记的开发 575


SNP (single nucleotide polymorphism), 单核苷
酸多态性, 是指基因组范围内单个碱基的插入、缺
失、转换、颠换或小片段的突变等。他广泛分布于
基因组范围内, 具有变异来源丰富、潜在数量巨大
等优点, 是理想的第 3 代分子标记[1]。传统的 SNP
的发现主要依靠对一些重要基因的测序, 比较同一
基因在不同个体或品种间的差异 , 这种方法鉴定
SNP 的速度较慢、成本较高, 因此发展缓慢。随着
分子生物学的发展和基因组测序计划的进行, 研究
人员发布了大量的基因组测序信息, 因此可以通过
比较不同个体间的基因组序列, 发现新的 SNP 位
点。如比较分析不同品系小鼠间[2]、水稻的籼稻和
粳稻两个亚种间[3]、拟南芥的哥伦比亚和兰琳伯格
生态型间的序列[4], 发现了大量的 SNP 突变。而对
于一些尚未完成基因组测序的物种, 或测序品种较
少时, 可以通过比较分析不同个体间的 EST 序列信
息, 发现新的 SNP位点[5], 目前在牛[6]、玉米[7]、小
麦[8-9]和大麦[10-11]等物种中均有应用。
由于 SNP 标记检测方法操作复杂、成本昂贵,
或者需要高端的仪器设备 , 如飞行时间质谱仪
(MALDI-TOF), 或者需要特殊的检测试剂 , 如
TaqMan 探针, 因此严重限制了 SNP 标记技术在动
植物遗传育种中的应用。酶切扩增多态性序列
(cleaved amplified polymorphic sequence, CAPS), 又
称 PCR-RFLP, 他是一种将特异引物 PCR 与限制性
内切酶消化结合而产生的一种分子标记检测技术 ,
具有共显性、位点特异性、操作简单和成本低等特
点, 广泛运用于植物基因的分型、定位、图位克隆
和分子鉴定等方面的研究[12]。但是, 一直以来, 由于
突变的酶切位点发现得较少, CAPS标记难以大规模
地开发应用。随着大豆基因组测序计划的进行, 研
究人员鉴定了大量的 SNP 位点, 其中相当一部分
SNP 位点都是酶切位点突变, 这为高通量开发利用
CAPS标记奠定了基础。
大豆是一种古四倍体作物, 是人类所需的植物
油和蛋白的重要来源。大豆基因组复杂, 且高度自
交, 导致其基因组遗传变异较低, 严重阻碍了其遗
传育种的发展[13-14]。随着大豆 EST测序和基因组测
序的进行, 公共数据库中积累了大量的序列信息[15-16],
这为高通量开发 SNP等分子标记提供了便利。
本研究利用大豆基因组测序和 EST 测序数据,
挖掘开发大豆 SNP标记, 并对得到的 SNP标记进行
测序验证。根据获得的 SNP 标记位点, 进行酶切信
息分析, 将其转化为方便实用的 CAPS标记。
1 材料与方法
1.1 植物材料
大豆品种合丰 25、绥农 14、Acher、Evans、Peking、
PI209332 和固新野生大豆由中国农业科学院作物科
学研究所惠赠。大豆品种科丰 1号和南农 1138-2由
南京农业大学国家大豆改良中心惠赠。
1.2 基因组 DNA的提取
采集参试大豆品种的幼叶 100 mg, 于研钵中用
液氮速冻 , 迅速研磨。采用 CTAB 法提取叶片总
DNA, 保存于 50 μL 去离子水中, 并用分光光度计
进行浓度测定, 稀释至 50 ng μL−1。
1.3 SNP位点识别
大豆基因组测序数据来自 Phytozome (http://
www.phytozome.net/soybean.php, Glyma1.0), EST测
序数据来自 NCBI (http://www.ncbi.nlm.nih.gov/)。利
用Blast将大豆 EST序列定位到大豆基因组上, 确定
EST序列所在的表达基因序列。利用 EMBOSS程序
包[17]的程序 Diffseq 分析 EST 和基因组序列之间的
差异, 筛选其中出现 3 次以上的差异位点, 作为候选
SNP位点。利用 EMBOSS中的程序 Restrict分析经
测序确认的 SNP 位点酶切信息, 选择 4 种内切酶
(Hind III、Pst I、Sca I和 Vsp I)的参数, 筛选突变引
起酶切位点改变的候选 SNP 位点作做为候选 CAPS
标记位点。利用软件 Primer3[18]在候选 CAPS标记位
点两侧设计 PCR 引物, 引物设计的标准是 Tm值为
58 , ℃ 引物长度为 20~26 bp。
1.4 SNP位点的功能分析
从 TAIR (http://www.arabidopsis.org/, TAIR7)下
载拟南芥的基因组数据和注释信息, 提取大豆 SNP
所在的基因序列, 用 Blastp 比对拟南芥蛋白质序列,
提取相似性最高的序列注释信息, 作为 SNP 靶向基
因的功能注释, 对 SNP位点的注释信息进行分类。
1.5 PCR扩增和测序验证
以 9个大豆品种的基因组和混合基因组DNA为
模板, 25 μL体系含 2.5 mmol L−1 MgCl2、1 U Taq酶、
800 μmol L−1 dNTP、0.2 μmol L−1引物、模板 DNA 50
ng。采用降落 PCR (touchdown PCR, TD-PCR)进行扩
增, 程序为 94℃预变性 7 min, 94℃变性 20 s, 60℃退
火 20 s, 每个循环降 0.5 , 72℃ ℃延伸 30 s, 30个循环,
94℃变性 20 s, 45℃退火 20 s, 72℃延伸 30 s, 10个循
环, 72℃延伸 7 min。对 PCR产物采用 2%琼脂糖电
576 作 物 学 报 第 36卷


泳, 将条带单一的 PCR 产物送交南京金思特公司测
序, 对挖掘的 SNP位点进行验证。
1.6 酶切位点识别和酶切分析
酶切分析(CAPS 分析)参照 TaKaRa 的内切酶操
作指南, 用限制性核酸内切酶酶切 PCR 产物, 酶切
体系包括 10 U μL−1限制酶 0.3 μL、1 μL buffer、5.7 μL
ddH2O、3 μL PCR产物, 酶切过夜, 采用 2%琼脂糖
电泳酶切产物。
2 结果与分析
2.1 EST-SNP突变位点的挖掘
将来源于大豆品种(科丰1号和Nourin 2)的62 939
条 EST 序列联配到大豆基因组上, 发现 15 971 条
EST 序列与品种 Williams 82 的测序序列存在差异,
编写 Perl 脚本将这些突变进行归类分析, 发现 537
个 EST-SNP (图 1), 突变发生的类型主要是转换突变,
达到 73.0% (392/537), 颠换突变只占一小部分, 约
27.0% (145/537)。
2.2 SNP靶向基因的功能分析
提取 SNP 靶向基因的蛋白质序列, 比对拟南芥
基因组蛋白质序列, 利用同源的拟南芥蛋白质功能
对大豆 EST-SNP靶向基因进行注释(图 2)。537个 EST-
SNP 定位在 333 个基因上, 这些基因主要参与亚细
胞定位过程(261/1109, 23.53%)、蛋白质的结合和催
化活性 (152/1109, 13.71%)和代谢过程 (124/1109,
11.18%)。另外, 这些 EST-SNP靶向基因还参与一些
特异的细胞过程, 如蛋白质合成、蛋白质折叠修饰、
对外界刺激的反应、信号转导、细胞修复和对病毒
的防御等过程, 表明这些 EST-SNP 基因广泛地与大
豆的各种代谢反应过程, 影响着大豆各种农艺性状
的形成。
2.3 EST-SNP的验证以及作为 CAPS标记的开发
由于受到特殊设备或检测试剂的限制, SNP 检
测较为困难。利用 EMBOSS 的 Restrict 程序分析挖
掘得到的 EST-SNP 突变位点的内切酶识别信息, 筛
选得到酶切位点改变的候选 EST-SNP位点 48个, 即
为候选CAPS标记位点。设计引物扩增这些EST-SNP
位点, 其中 44对引物具有单一条带的扩增产物。以
混合 DNA和 9个大豆品种的 DNA为模板进行扩增,
发现 36对引物的混合 DNA扩增产物在 EST-SNP位



图 1 EST-SNP位点的发掘
Fig. 1 Identification of EST-SNP sites



图 2 EST-SNP靶向基因的功能分析
Fig. 2 Functional analysis of the genes containing EST-SNP sites
第 4期 束永俊等: 大豆 EST-SNP的挖掘、鉴定及其 CAPS标记的开发 577


点出现紊乱, 且在不同品种间出现碱基差异(图 3)。
对测序验证EST-SNP位点的 PCR产物进行相应的酶
切, 酶切产物电泳具有多态性即为 CAPS标记(图 4),
获得的 26个 CAPS标记的引物以及相应的酶切信息
见表 1。
3 讨论
3.1 EST-SNP标记的挖掘
EST 测序是研究功能基因的重要方法, 公共数
据库中已经积累了大量的 EST序列。在海量的 EST
序列中, 很多来源于不同的个体或品种, 他们在组
装成基因时往往会出现不一致的碱基 , 即为
EST-SNP 突变位点, 这些位点可以通过生物信息学
方法检测到[5]。自 Picoult-Newberg等提出从 EST数
据中挖掘 SNP位点的方法以来, 从模式物种人类[19]、
小鼠和大鼠[20]等, 到家畜的牛[6]和猪[21]等都有所应
用。近些年来, 在植物方面从模式生物拟南芥[22], 到
主要粮食作物水稻[3]、玉米[7]、小麦[8-9]和大麦[10-11],
及一些小物种植物, 如番茄[23]、松树[24]和甘蔗[25]等,
该方法也得到了普遍应用。
虽然 EST-SNP开发方法具有高效率、低成本的
优点, 但是, 也有如下缺点: (1) EST 测序的质量普
遍不高, 在进行 EST-SNP 挖掘时会经常得到一些假
阳性的 SNP, 使挖掘 SNP 的正确率不高。本研究在
利用大豆 EST数据挖掘 SNP时, 添加了大豆基因组
测序数据, 由于基因组序列是高覆盖率的测序结果,
序列的质量较高, 将 EST 序列和基因组序列联配挖
掘 SNP, 大大提高了挖掘 SNP 的正确率, 达到了
81.82%。(2) EST测序中存在大量的直系同源基因序
列, 会干扰 EST序列的正确联配, 导致 EST-SNP挖
掘会出现较高的假阳性。本研究先进行严格的 Blast
比对, 筛选出正确的匹配模式, 降低直系同源基因
序列的干扰, 然后再进行 EST 序列的联配, 最后对
联配结果进行计数 , 去除一些频率低的突变位点 ,



图 3 EST-SNP位点的测序验证
Fig. 3 Validation of the EST-SNP site by Sanger sequencing
A:杂合子基因型 T/G的测序结果; B:纯合子基因型 T的测序结果; C:纯合子基因型 G的测序结果。
A: sequencing result of heterozygote T/G; B: sequencing result of homozygote T; C: sequencing result of homozygote G.



图 4 标记 ESNP02在 9个大豆品种中的多态性分析
Fig. 4 Polymorphism analysis of markers ESNP02 in nine soybean varieties
1~9:基因组 DNA的 PCR产物; 10~18:PCR产物的酶切产物, 引物以及内切酶信息见表 1; M:DNA marker DL2000。
1–9: PCR amplicons; 10–18: digested products of PCR amplicons; the primers and enzymes information are as given in Table 1;
M: DNA molecular marker DL2000.
578 作 物 学 报 第 36卷


表 1 CAPS标记引物及内切酶信息
Table 1 Summery information of CAPS primers and relative restrict enzymes
引物编号
Primer ID
上游引物
Forward primer
下游引物
Reverse primer
内切酶
Restrict enzyme
ESNP01 GTACCTTGGAGATTGGAATGGA TCCAGGTAAGCCTCAGGTAAAA Hind III
ESNP02 CCAACAATCTCTGTTAGACAGGC CTTCTTTGGGACTGTTGATCCT Sac I
ESNP03 GACATTTACAAAGACCGAAGCC TGTCTGGAGTATATGAATGCCG Sac I
ESNP04 CGTGCTTTCTTTCCTAGCAACT TGTGGTGTAGGGAACTTGATTG Sac I
ESNP05 CACTTTTCCAACAAGCCTAACC GACACGAGCTGGATAATGGTTT Vsp I
ESNP06 GATCATCCCCAGCACTAAAAAC AGTCAGCAATTTCTTCAGGAGG Vsp I
ESNP07 CAAGAATTTCCAGCAAGGGA GCATAGCTTCTGGTGTGACAAT Vsp I
ESNP08 CACATCACTACCAGGAAGTCCC CCTGCAGATGCACTACAAGTCT Vsp I
ESNP09 TGTAGTGCATCTGCAGGGTAAG AGTCAGCAAGCCAAGTAACACA Hind III
ESNP10 TGGATAGCCTCAGTTGCTGATA TAGGACCAGGTCACTGGGATAC Pst I
ESNP11 CGTGCATAGACTGTTGGAGAAA ACTTATGTGCTGTTTGCCCCT Vsp I
ESNP12 ACTTGGGCCTGTTAGGAAAAAC CAAAGAACCAAGAGAATCGTCC Vsp I
ESNP13 CTACAACATTCCAAGTGGGTCA GCACACAACTCCACGTAAACTC Vsp I
ESNP14 GTTTTGGTGGTCTAAGGAGGAA AGCTCCTCACAGAACCAACTTA Vsp I
ESNP15 CGTAAAACACATCCTTGGTTCC TACAGAGTGAATCCCATTGTGC Vsp I
ESNP16 GGCTTCCGTTCTTCTTTACCTT TCTACGTCAGGGGTTCAATTCT Vsp I
ESNP17 AAATGTGAGCAGTGATCCAGAG GCCACTCAATTTGTTGCTTG Hind III
ESNP18 GAACAAAGGTTGTCCTTGCACT CAGCAAAATGGCCTCTAACTCT Vsp I
ESNP19 GATGGGGTTGAGGTAAGTTTTG GTCTGAGAAGCAAATTTCGG Vsp I
ESNP20 TGCAGTGGAGAGACTGAGGATA AATTCTCAAGAGCTGCCAAGAG Vsp I
ESNP21 GTGAGGAGGGATTGACTTTCAG CTAGTTTGCACTTCACAGCAGC Vsp I
ESNP22 AGAGCCACCCTTTATGTCATGT ATGAGGGTGTTCTTATCGTTGG Vsp I
ESNP23 ATGGGGGAGAAATGAGTAATCC AACTGCCACTACAGGTAGCACA Hind III
ESNP24 TAAAAGGAAGCTGAAGGTGGAG GAAACACCGTTAAGAAGGTCCA Vsp I
ESNP25 AATGCAGTTGGATAGTGTGTGC TGTCAGCTCAGTATTCAGTGGG Pst I
ESNP26 CACACTTTCAACCTTGTCAGGA AGAGACACACATCCAGCAGAAA Pst I

大大减少了由于 EST 序列错配带来的假阳性 SNP,
提高了挖掘 EST-SNP的正确率和开发效率。
在大豆中, Chio等[26]于 2007年对 6个大豆品种
(Minsoy, Noir 1, Archer, Peking, Evans和 Essex)测序
获得了 5 551个 SNP, 但到目前为止大豆中尚未有从
公共数据中挖掘发现 SNP的报道。本研究通过联配
EST 序列和基因组测序序列建立了一种高效、可行
的基因靶向的 SNP 标记挖掘方法。利用该方法, 挖
掘了 537个 EST-SNP, 其中大多数是转换突变, 这与
Chio等[26]和 Zhu等[27]对大豆的研究结果一致。由于
大量的 C突变成 T, 改变基因组序列甲基化, 影响功
能基因的表达。
3.2 CAPS标记的转化
SNP检测一直是 SNP标记应用于植物遗传育种
研究中的限制因素, 如何开发简便、高效、快速的
SNP 标记检测方法是首要解决的问题。在所有的
SNP位点检测方法中, CAPS标记方法可以通过简单
PCR、限制性内切酶酶切和琼脂糖电泳即可完成, 因
此, 通过将 SNP 为标记转换为 CAPS 标记可大大促
进 SNP 标记在植物遗传育种, 特别是大豆遗传育种
中的应用。SNP发生在内酶切识别位点时, SNP位点
就可以通过转化为 CAPS 标记进行检测。在本研究
中, 通过对 36 个引物的 PCR 产物酶切, 发现 26 对
引物具有酶切多态性, 即 CAPS 标记的转化成功率
约为 72.22%, 这略高于 Kota 等[11]在大麦中的转化成
功率, 成功地将大豆中的 SNP转化成为 CAPS标记。
4 结论
建立了从公共数据库的大豆 EST等数据中开发
SNP的体系, 并成功挖掘出 537个 EST-SNP标记。
第 4期 束永俊等: 大豆 EST-SNP的挖掘、鉴定及其 CAPS标记的开发 579


获得 36 个真实的 SNP 位点, 正确率达到 81.82%。
获得 26个方便、实用的 CAPS标记。建立的高效率、
低成本的 SNP标记开发和检测体系将极大地促进大
豆和其他植物的遗传育种研究。
References
[1] Ganal M W, Altmann T, Roder M S. SNP identification in crop
plants. Curr Opin Plant Biol, 2009, 12: 211–217
[2] Wiltshire T, Pletcher M T, Batalov S, Barnes S W, Tarantino L M,
Cooke M P, Wu H, Smylie K, Santrosyan A, Copeland N G,
Jenkins N A, Kalush F, Mural R J, Glynne R J, Kay S A, Adams
M D, Fletcher C F. Genome-wide single-nucleotide polymor-
phism analysis defines haplotype patterns in mouse. Proc Natl
Acad Sci USA, 2003, 100: 3380–3385
[3] Feltus F A, Wan J, Schulze S R, Estill J C, Jiang N, Paterson A H.
An SNP resource for rice genetics and breeding based on
subspecies indica and japonica genome alignments. Genome Res,
2004, 14: 1812–1819
[4] Jander G, Norris S R, Rounsley S D, Bush D F, Levin I M, Last R
L. Arabidopsis map-based cloning in the post-genome era. Plant
Physiol, 2002, 129: 440–450
[5] Picoult-Newberg L, Ideker T E, Pohl M G, Taylor S L, Donaldson
M A, Nickerson D A, Boyce-Jacino M. Mining SNPs from EST
databases. Genome Res, 1999, 9: 167–174
[6] Snelling W M, Casas E, Stone R T, Keele J W, Harhay G P,
Bennett G L, Smith T P. Linkage mapping bovine EST-based SNP.
BMC Genomics, 2005, 6: 74
[7] Batley J, Barker G, O’Sullivan H, Edwards K J, Edwards D.
Mining for single nucleotide polymorphisms and insertions/
deletions in maize expressed sequence tag data. Plant Physiol,
2003, 132: 84–91
[8] Somers D J, Kirkpatrick R, Moniwa M, Walsh A. Mining
single-nucleotide polymorphisms from hexaploid wheat ESTs.
Genome, 2003, 46: 431–437
[9] Mao X-G(毛新国), Tang J-F(汤继凤), Zhou R-H(周荣华), Jing
R-L(景蕊莲), Jia J-Z(贾继增). Wheat cSNP mining based on
full-length cDNA sequences. Acta Agron Sin (作物学报), 2006,
32(12): 1836–1840 (in Chinese with English abstract)
[10] Kota R, Rudd S, Facius A, Kolesov G, Thiel T, Zhang H, Stein N,
Mayer K, Graner A. Snipping polymorphisms from large EST
collections in barley (Hordeum vulgare L.). Mol Genet Genomics,
2003, 270: 24–33
[11] Kota R, Varshney R, Prasad M, Zhang H, Stein N, Graner A.
EST-derived single nucleotide polymorphism markers for
assembling genetic and physical maps of the barley genome.
Funct Integr Genomics, 2008, 8: 223–233
[12] Komori T, Nitta N. Utilization of the CAPS/dCAPS method to
convert rice SNPs into PCR-based markers. Breed Sci, 2005, 55:
93–98
[13] Cregan P B, Jarvik T, Bush A L, Shoemaker R C, Lark K G,
Kahler A L, Kaya N, VanToai T T, Lohnes D G, Chung J, Specht J
E. An integrated genetic linkage map of the soybean genome.
Crop Sci, 1999, 39: 1464–1490
[14] Song Q J, Marek L F, Shoemaker R C, Lark K G, Concibido V C,
Delannay X, Specht J E, Cregan P B. A new integrated genetic
linkage map of the soybean. Theor Appl Genet, 2004, 109:
122–128
[15] Tian A G, Wang J, Cui P, Han Y J, Xu H, Cong L J, Huang X G,
Wang X L, Jiao Y Z, Wang B J, Wang Y J, Zhang J S, Chen S Y.
Characterization of soybean genomic features by analysis of its
expressed sequence tags. Theor Appl Genet, 2004, 108: 903–913
[16] Yang Z-Y(杨振宇), Ma X-P(马晓萍), Yamanaka N(山中直树).
Polymorphism of phosphoenolpyruvate carboxylase gene in soy-
bean cultivars from northeastern China and Japan. Acta Agron Sin
(作物学报), 2005, 31(9): 1233–1235 (in Chinese with English
abstract)
[17] Rice P, Longden I, Bleasby A. EMBOSS: the european molecular
biology open software suite. Trends Genet, 2000, 16: 276–277
[18] Rozen S, Skaletsky H. Primer3 on the WWW for general users
and for biologist programmers. Methods Mol Biol, 2000, 132:
365–386
[19] Garg K, Green P, Nickerson D A. Identification of candidate
coding region single nucleotide polymorphisms in 165 human
genes using assembled expressed sequence tags. Genome Res,
1999, 9: 1087–1092
[20] Guryev V, Berezikov E, Malik R, Plasterk R H, Cuppen E. Single
nucleotide polymorphisms associated with rat expressed
sequences. Genome Res, 2004, 14: 1438–1443
[21] Kerstens H H, Kollers S, Kommadath A, Del Rosario M, Dibbits
B, Kinders S M, Crooijmans R P, Groenen M A. Mining for
single nucleotide polymorphisms in pig genome sequence data.
BMC Genomics, 2009, 10: 4
[22] Torjek O, Berger D, Meyer R C, Mussig C, Schmid K J, Rosleff
Sorensen T, Weisshaar B, Mitchell-Olds T, Altmann T.
Establishment of a high-efficiency SNP-based framework marker
set for Arabidopsis. Plant J, 2003, 36: 122–140
[23] Yamamoto N, Tsugane T, Watanabe M, Yano K, Maeda F,
Kuwata C, Torki M, Ban Y, Nishimura S, Shibata D. Expressed
sequence tags from the laboratory-grown miniature tomato
(Lycopersicon esculentum) cultivar Micro-Tom and mining for
single nucleotide polymorphisms and insertions/deletions in
tomato cultivars. Gene, 2005, 356: 127–134
[24] Dantec L L, Chagné D, Pot D, Cantin O, Garnier-Géré P, Bedon F,
Frigerio J M, Chaumeil P, Léger P, Garcia V, Laigret F, de
Daruvar A, Plomion C. Automated SNP detection in expressed
sequence tags: Statistical considerations and application to
maritime pine sequences. Plant Mol Biol, 2004, 54: 461–470
[25] Cordeiro G M, Eliott F, McIntyre C L, Casu R E, Henry R J.
Characterisation of single nucleotide polymorphisms in
sugarcane ESTs. Theor Appl Genet, 2006, 113: 331–343
[26] Choi I Y, Hyten D L, Matukumalli L K, Song Q, Chaky J M,
Quigley C V, Chase K, Lark K G, Reiter R S, Yoon M S. A
soybean transcript map: Gene distribution, haplotype and
single-nucleotide polymorphism analysis. Genetics, 2007, 176:
685–696
[27] Zhu Y L, Song Q J, Hyten D L, Van Tassell C P, Matukumalli L K,
Grimm D R, Hyatt S M, Fickus E W, Young N D, Cregan P B.
Single-nucleotide polymorphisms in soybean. Genetics, 2003,
163: 1123–1134