全 文 :园艺学报,2016,43 (3):485–495.
Acta Horticulturae Sinica
doi:10.16420/j.issn.0513-353x.2015-0898;http://www. ahs. ac. cn 485
收稿日期:2015–12–31;修回日期:2016–02–26
基金项目:国家自然科学基金项目(31171962);公益行业(农业)科研专项经费项目(201303115);‘十二五’国家科技支撑计划项目
(2012BAD02B04);中国农业科学院科技创新工程项目(CAAS-ASTIP-IVFCAAS);农业部园艺作物生物学与种质创新重点实验室项目
* 通信作者 Author for correspondence(E-mail:lijunming@caas.cn)
中国加工番茄资源遗传多样性分析
刘希艳,郑 峥,邓学斌,冯晶晶,白金瑞,宋 燕,刘 磊,李君明*
(中国农业科学院蔬菜花卉研究所,北京 100081)
摘 要:基于构建的加工番茄核心种质,从 3 026 份自交系中选择了代表 50 年育种历程的 615 份,
分别利用 16 个表型性状和 81 个(13 对 SSR、24 对 InDel、44 个 SNP)不同类型的多态性分子标记,对
其遗传多样性进行了分析。结果表明,无论是基于表型还是基因型数据,供试自交系聚类结果基本一致,
均分为两大群。其中表型聚类包括 7 个亚群,基因型聚类包括 6 个亚群。综合分析表型和基因型聚类结
果,发现大多数早期(2010 年以前)育成的自交系聚为一类,近年(2010 年以后)育成的自交系不同程
度地分布在两类中,说明近年育成的自交系遗传多样性更为丰富。在不同类型标记中,SNP 在亚群中呈
现更好的多态性,等位基因数、基因多样性、多态性信息量均明显高于 SSR 和 InDel。
关键词:加工番茄;分子标记;多态性;遗传变异
中图分类号:S 641.2 文献标志码:A 文章编号:0513-353X(2016)03-0485-11
Analysis the Genetic Diversity of Processing Tomato in China
LIU Xi-yan,ZHENG Zheng,DENG Xue-bin,FENG Jing-jing,BAI Jin-rui,SONG Yan,LIU Lei,
and LI Jun-ming*
(Institute of Vegetables and Flowers,Chinese Academy of Agricultural Sciences,Beijing 100081,China)
Abstract:Based on the information of the established core collection,genetic diversity of 615 typical
accessions representing 50 years of breeding program selected from a collection of 3 026 processing
tomato inbred lines was analyzed and compared by using 16 phenotypes and 81 polymorphic markers(13
SSR,24 InDel and 44 SNP). The results indicate that all inbred lines were divided into two groups by
either phenotypes or genotypes,and show the consistent results by each other. Furthermore these two
groups could be classified into 7 and 6 sub-groups respectively. When compared to the categories
respectively obtained from both phenotypes and genotypes,we found that most of the early released inbred
lines were clustered in groupⅠwhile the developed modern lines were involved randomly in both groupⅠ
andⅡ. It hints that the newly inbred lines showed much more diverse than the old population. In addition,
SNP markers show more polymorphic than SSR and InDel markers as indicated by allele number,gene
diversity and polymorphism information content.
Key words:processing tomato;molecular marker;polymorphism;genetic variation
Liu Xi-yan,Zheng Zheng,Deng Xue-bin,Feng Jing-jing,Bai Jin-rui,Song Yan,Liu Lei,Li Jun-ming.
Analysis the genetic diversity of processing tomato in China.
486 Acta Horticulturae Sinica,2016,43 (3):485–495.
经过几十年的人工选择,目前加工番茄已逐步演化为一类明显区别于鲜食番茄的特异性品种类
群(Park et al.,2004;Sim et al.,2009),如果实可溶性固形物和番茄红素含量高、易脱皮等(Stevens,
1986)。同时,加工番茄需集约化采收(Merk et al.,2012),还要求具备自封顶、耐贮运、成熟一致
(邓学斌 等,2015)等特点。20 世纪 60 年代中期适合机械化采收的加工番茄品种首次育成
(Rasmussen,1968)。近 10 年来,快速发展的现代生物技术对于加工番茄的遗传改良产生了较大影
响。就全球最大的加工番茄生产基地美国加州而言,过去 24 年间每 hm2 产量提高了 56.2%,这主要
归功于优良新品种的利用。然而,栽培种番茄遗传背景狭窄(Sim et al.,2009),加上长期人为对加
工番茄特异性的高压选择,无疑使该亚群的遗传背景更为狭窄(邓学斌 等,2015),阻碍了其育种
进程。因此,分析过去几十年加工番茄遗传改良所产生的群体多样性,对于加工番茄育种意义重大。
遗传多样性是种内基因的遗传变异,多样化的遗传资源是品种改良、杂种优势利用的基础(Park
et al.,2004)。过去对于作物多样性的评价主要依赖于表型(phenotype),易受基因显性效应和环境
影响(Paterson et al.,1991)。近十几年,基因组多态性分子标记的快速发展,为作物遗传多样性分
析提供了有效工具(Kwon et al.,2009),并广泛应用于遗传资源分析(Prasad et al.,2000;Sim et al.,
2009)。就标记类型而言,二代 SSR(Simple Sequence Repeat)标记凭借其共显性、多态性好的优势,
已广泛应用于遗传多样性评价和品种鉴定(Kwon et al.,2009),如水稻(Huang et al.,2012a;Wang
et al.,2012)、小麦(Brenchley et al.,2012)、玉米(Ganal et al.,2011)、番茄(Sim et al.,2012)
等作物。但 SSR 标记的进一步挖掘与利用一直受限于栽培种番茄狭窄的遗传背景。随着二代测序技
术(NGS)的快速发展,大量特异性强,稳定性好,位点丰富且易实现高通量操作的 InDel 和 SNP
标记被挖掘(Tomato Genome Consortium,2012),使番茄基因组遗传信息的揭示与利用更为方便和
快捷(Sim et al.,2009;Víquez-Zamora et al.,2013;Lin et al.,2014)。前人利用全基因组挖掘的
7 720 个 SNP,将 426 份番茄遗传资源分为加工番茄、大果鲜食番茄、大果老品种、栽培樱桃番茄、
地方品种、野生樱桃番茄和醋栗番茄等 7 个类型,而且加工番茄、鲜食番茄和大果老品种在第 2、4、
5、6 和 11 染色体上存在明显差异,特别是第 4 染色体对于区别栽培种亚群尤为重要(Sim et al.,
2012);樱桃番茄在第 4、5 和 12 染色体上也区别于大果番茄(Víquez-Zamora et al.,2013);樱桃
番茄、加工番茄及鲜食番茄较地方品种分别有 30、34 和 37 个位点发生了正向选择(Corrado et al.,
2013)。但截至目前为止,对于加工番茄亚群的分析报道较少(Villand et al.,1998;Sim et al.,2009;
Merk et al.,2012),特别是揭示加工番茄历史演化进程的研究更为鲜见。另外,全基因组关联分析
(Genome Wide Association Analysis,GWAS)已成为深入挖掘现有遗传资源潜在优异性状的有效策
略(Huang et al.,2012b),通过比较和分析特定群体表型和基因型的遗传多样性,不仅可以了解其
遗传改良历程,而且为开展 GWAS 研究奠定良好的基础。
本研究基于本课题组 50 多年来收集或选育的 3 026 份加工番茄自交系,在构建核心种质的基础
上(邓学斌 等,2015),选取其中 615 份代表性自交系,结合表型性状(phenotype)和 SSR、InDel、
SNP 3 种典型分子标记,对其遗传多样性进行了分析比较,目的是了解 50 年来加工番茄的育种历程,
为进一步开展加工番茄亚群 GWAS 相关研究提供技术支撑。
1 材料与方法
1.1 试验材料
试验材料由中国农业科学院蔬菜花卉研究所提供,共计 615 份自交系。该些自交系是基于邓学
刘希艳,郑 峥,邓学斌,冯晶晶,白金瑞,宋 燕,刘 磊,李君明.
中国加工番茄资源遗传多样性分析.
园艺学报,2016,43 (3):485–495. 487
斌等(2015)构建中国加工番茄核心种质(308 份)时,根据聚类结果从 3 026 份加工番茄自交系
中随机选取的典型自交系,包括国内早期使用的 87-5、8784、92154、红 100、石红 9 号、新番 4 号
等品种的亲本材料及后代自交系,国外的皮托(PetoSeeds)、太阳(SunSeeds)、坎贝尔(Campbell)、
联合遗传(United Genetics)、奥赛提(Orsetti)、圣尼斯(Seminis)、亨氏(Heinz)等公司早期育成
的 Peto11B、BOS3155、Sun6117、APT410、H8892、Hypeel849 等品种的分离后代自交系,孟山都
(Monsanto)、拜耳(Bayer)、亨氏、利马格兰(Limagrain)、联合遗传、Woodbridge、BHN 等公司
近几年最新育成的 AB319、Sun6366、H8504、HM1892 等品种分离后代自交系。全部材料均为有限
生长类型,现代自交系明显区别于老自交系的特点是无节,叶片较小,植株较大;果实可溶性固形
物含量较高,硬度好,耐晒,肉色较好。
1.2 试验方法
1.2.1 田间栽培和表型性状调查
2013 年 3 月播种于顺义试验站育苗温室,每自交系播种 8 株于 50 孔穴盘,育苗基质为草炭和
蛭石(2︰1)及有机肥料。昼温 25 ~ 28 ℃,夜温 15 ~ 18 ℃,每隔两周,浇施 0.5%的磷酸二氢钾
溶液。待幼苗长到 5 ~ 6 片真叶时,选取 5 株生长一致的幼苗定植于大田。田间沟心距 1.5 m,株距
0.25 m,垄高 0.25 m,采用单行栽植,按大田生产管理。表型性状调查包括株型、株幅、开展度、
分枝、节间、叶量、长势、叶片、叶色、覆盖、坐果、果皮、果节、硬度、干汁和固形物共计 16
个性状,具体参照邓学斌等(2015)的方法。其中质量性状分别记为 1 和 0;数量性状采用分级进
行统计(邓学斌 等,2015)。
对采集的数据结果,利用 MAGA 6.0 邻接法(neighbour-joining method,NJ)进行聚类(Saitou
& Nei,1987;Lü et al.,2012)。
1.2.2 基因型多样性分析
生长期间单株取 0.1 ~ 0.3 g 番茄嫩叶,用 CTAB 法提取基因组 DNA(Fulton et al.,1995),终
浓度稀释至 100 ng · μL-1,置–20 ℃冰箱保存备用。
根据 SGN(http://solgenomics. net/)及前人研究结果,选取覆盖基因组不同位点的 162 个标记,
即 49 对 SSR(He et al.,2003;Ruiz et al.,2005)、48 对 InDel(苏晓梅,2014)和 65 个 SNP 标记
(邓学斌 等,2015),首先利用 24 份表型(株形、果形、可溶性固形物含量)差异较大自交系进行
引物筛选,最终选择扩增条带清晰、稳定性高、多态性好的引物用于 615 份自交系的分型。引物均
由上海生物工程技术服务有限公司合成。SNP 分型采用 Sequenom 公司的 MassARRAY 技术平台
(Gabriel & Ziaugra,2004),由毅新兴业(北京)科技有限公司完成。
PCR 反应总体积为 10 μL。反应程序为 94 ℃预变性 3 min,然后 94 ℃变性 30 s,55 ℃复性 30 s,
72 ℃延伸 40 s,共 33 个循环,最后 72 ℃延伸 8 min,冷却至 16 ℃保存(Alvarez et al.,2001)。
PCR 扩增产物在 8%的聚丙烯酰胺凝胶上电泳,银染方法显影(Mehta et al.,1984)。
对清晰的 DNA 条带数进行统计。先确定每个标记的等位基因数,然后有带计为 1,无带计为 0,
数据缺失计为 9。利用PowerMarker V3.25软件分析多态性信息量(Polymorphism Information Content,
PIC)(Prasad et al.,2000)。利用 GGT2.0 软件(van Berloo,2008)分析遗传距离,采用邻接法(NJ)
进行聚类。
Liu Xi-yan,Zheng Zheng,Deng Xue-bin,Feng Jing-jing,Bai Jin-rui,Song Yan,Liu Lei,Li Jun-ming.
Analysis the genetic diversity of processing tomato in China.
488 Acta Horticulturae Sinica,2016,43 (3):485–495.
2 结果与分析
2.1 基于表型性状的遗传多样性分析
通过对 16 个表型性状聚类分析发现,在遗传距离为 0.31 时,供试自交系分为 2 大群(Ⅰ和Ⅱ)。
其中第Ⅰ大群共计 349 份自交系,包括 2010 年前育成的自交系 155 份(占入选的 2010 年前育成自
交系总数的 72.43%)和 2010 年后育成的自交系 194 份(占入选的 2010 年后育成自交系总数的
48.38%),代表性材料是早期新疆主栽常规种 87-5、2006 年引入的亚洲蔬菜研究发展中心(AVRDC)
育成的 PT4675B、PT4679B、PT4719B、CLN2123A、UC204,2010 年北卡罗纳州立大学(NC,USA)
育成的 NC1 CELBR、NC EBR-8、NCEBR-7(Gardner & Panthee,2010),遗传距离为 0.29 时,该
大群分为 4 个亚群,分别包括 117、58、26 和 148 份自交系。第Ⅱ大群共计 266 份自交系,包括 2010
年前育成的自交系 59 份(占入选的 2010 年前育成自交系总数的 27.57%)和 2010 年后育成的自交
系 207 份(占入选的 2010 年后育成自交系总数的 51.62%),代表性材料有美国北卡罗纳州立大学
(NC,USA)育成的 NC25P、NC2 CELBR 等,在遗传距离为 0.29 时,该群分为 3 个亚群,分别包
括 192、20、54 份自交系(图 1)。总体来看,自交系间遗传距离变幅为 0.06 ~ 0.93,平均为 0.608。
图 1 615 份加工番茄自交系基于表型性状的聚类
每一分支代表 1 个自交系,共计 615 个。 、 、 为代表性自交系。标尺为遗传距离。共分为类群Ⅰ和Ⅱ,亚群用 1 ~ 4 标出。
Fig. 1 Dendrogram of 615 accessions based on phenotype using NJ clustering method
Each of the branches is one inbred line,there are 615 inbred lines in total. , , are the representative inbred lines,scale length is the genetic
distance. It is divided intoⅠandⅡgroups,sub-groups are labeled by 1–4.
2.2 基于基因型的遗传多样性分析
2.2.1 多态性标记引物信息及其在番茄染色体上的分布
通过筛选 162 个不同类型的分子标记,最终确定条带清晰、稳定性高、多态性丰富的 13 对 SSR
标记、24 对 InDel 标记和 44 个 SNP 标记共计 81 个标记用于群体分型。引物信息及其在染色体上的
位置详见表 1 和图 2。平均每条染色体上 6.75 个标记,变幅 2 ~ 10 个,大部分标记均匀分布于染色
刘希艳,郑 峥,邓学斌,冯晶晶,白金瑞,宋 燕,刘 磊,李君明.
中国加工番茄资源遗传多样性分析.
园艺学报,2016,43 (3):485–495. 489
体上,其中 2,6,9 号染色体上均覆盖了 9 个标记且分布较均匀;4 号染色体上仅有 2 个多态性 SNP
标记,说明 4 号染色体上加工番茄遗传多样性较小。8 号染色体上筛选到的多态性标记较少且集中
于染色体末端。
图 2 多态性标记在染色体上的分布
Fig. 2 The distribution of polymorphic markers on chromosomes
表 1 81 对多态性标记信息
Table 1 Information of 81 polymorphic markers
标记
Locus
染色体
Chr
正向引物
Forward primer
反向引物
Reverse primer
SSR 1 1 AATTCACCTTTCTTCCGTCG TGCAAAGAACAAAGACCGTG
SSR 2 1 ACAACATGGGAAGCACTTGA ATTAAATTGGGCCATGGTGA
SSR 3 1 CCATCTATTATCTTCTCTCCAACAC GGTCCCAACTCGGTACACAC
SSR 4 1 CCCTTTGCAAGTTCTTCTTCA TTCATGAGCCAACATAGGAGG
SSR 7 2 CCGTGACCCTCTTTACAAGC TTGCTTTCTTCTTCGCCATT
SSR 8 2 TGCAACAACTGGATAGGTCG TGGATGAAACGGATGTTGAA
SSR 13 3 TTCTTCCCTTCCATCAGTTCT TTTGCTGCTATACTGCTGACA
SSR 14 3 TCTGCATCTGGTGAAGCAAG CTGGATTGCCTGGTTGATTT
SSR 25 5 CACCCTTTATTCAGATTCCTCT ATTGAGGGTATGCAACAGCC
SSR 31 6 TCCTCAAGAAATGAAGCTCTGA CCTTGGAGATAACAACCACAA
SSR 33 6 ATTCCCAGCACAACCAGACT GTTGGTGGATGAAATTTGTG
SSR 49 9 TTTAGGGTGTCTGTGGGTCC GGAGTGCGCAGAGGATAGAG
SSR 61 11 GGCAAATGTCAAAGGATTGG AGGGTCATGTTCTTGATTGTCA
InDel-2 1 TTCTTGAGAAGTGGAAGGTT CGATCAATATGAGCAATACC
InDel-36 1 TAAATGACCCATACCAGGAG CCTGATTCTTCTCATTTCCA
InDel-41 1 GAGCGATCCCTTCTTTTTAT GTCTAACAGTGATCGCATGA
InDel-50 2 CTTCCGTACCTTAGCATGAG GGGGAAGGAGATAGTATTGG
InDel-65 2 AAGTGTCCACATTTTTCACC GAAAAGCGTGAGTTGTAAGAG
InDel-72 3 AAGATAGACGATCAGAGGCA GCAAATCACAATGTCTGCTA
InDel-78 3 GATGAAATCTGAAACCAGGA TCATCTCCCTCCTTATTCAA
InDel-93 3 ATTGATGAAGCAGAGGAGAA TACCCTACTCGCATGATTTT
Liu Xi-yan,Zheng Zheng,Deng Xue-bin,Feng Jing-jing,Bai Jin-rui,Song Yan,Liu Lei,Li Jun-ming.
Analysis the genetic diversity of processing tomato in China.
490 Acta Horticulturae Sinica,2016,43 (3):485–495.
续表 1
标记
Locus
染色体
Chr
正向引物
Forward primer
反向引物
Reverse primer
InDel-133 5 ATATCGTGCTCCTTTGTGAC GGTTCGCTTGATTAGAAATG
InDel-143 5 TTACTGAACCGATAAGGGTG TTTGGGTGTTTGTGTGTATG
InDel-145 6 TACTGAATTTTAGGGATGGG TACCCAGTAGGCATCATAGG
InDel-148 6 GTTGTAGCATTTGATTGGGT CCATCAACAAACCTAGTTCC
InDel-176 7 AAGTGGGATGAGAATCATTG ACTATGGTGTCTGGACCTTG
InDel-186 8 TGAGTCATGCTATACCCATT TAGAAAATTAGGCAGCTCCA
InDel-195 8 CTACTGAGAAAGCAGAACGC GCCCTACAAGCAACATAAAC
InDel-198 9 GCAATATAGCCAACATAGCC GCACCCGTTAGACATTTTT
InDel-206 9 CCTTGAATTTGAATCTCGC GGACACATGGTCACAATCTT
InDel-211 9 ACTTTGAGCCCACGTAATC AGGCCTAGTATGGTATGGAT
InDel-213 9 GGTGTCATAAACCACCTGAT GACAAGCATTTAGGCTTCAT
InDel-234 10 TGGGGAATACCCGTATACTA TTTTTGAAGATCTAGTGGGG
InDel-246 11 ACCTCCACATCATGGTTCT CAACCTGTTTTTGGCACTAC
InDel-262 11 CTAGCATGTGGATTCAGGAT TGGATACAGTTCGAGGAGTT
InDel-307 11 AGCGAGACGTACCAAAAATA TGAGACTTACGCCTCAATTT
InDel-349 12 GATTCTTGAGTTGGTAAGCA GTGTCCCAAAAGAAATTGAG
SNP2 1 ACGTTGGATGAACCTTTCAAGTCACCTTAG ACGTTGGATGCATACTTAGCTCTTGCGGTC
SNP4 1 ACGTTGGATGGTGGAAGTTGTAGTAGACCG ACGTTGGATGTTTTGCACCGACTTACCAGC
SNP5 1 ACGTTGGATGGGAAATCCGATAATCCATACC ACGTTGGATGCTTGCCAGCGAAAATAAGGG
SNP6 2 ACGTTGGATGGGAACTCGAACAATGTTGCG ACGTTGGATGGTCGTCGGACGTGCCAGC
SNP7 2 ACGTTGGATGAACAACACCACTTGGAGAGG ACGTTGGATGTGTATCCAAGTTCGAGTGCC
SNP8 2 ACGTTGGATGGCGTGTTGATGCAAAATGAG ACGTTGGATGCAACTCTAAGTCATAGGTTGG
SNP9 2 ACGTTGGATGCGAATCCCATCGTAACTCTC ACGTTGGATGAGGCTTGCGAGAGTTATGAC
SNP10 2 ACGTTGGATGGATTAAGTGAAGAAAGTATG ACGTTGGATGTACGCCCCCTTCATACATAG
SNP12 3 ACGTTGGATGAATAAGTATGGTGTAGAGGC ACGTTGGATGAACCATTGGCAACAACACCC
SNP15 3 ACGTTGGATGCGTTGGTGCCAATAATTGTC ACGTTGGATGTATAAACCTCTCAGAGGTGC
SNP17 4 ACGTTGGATGGCCCATCCATGAAGTAGAAC ACGTTGGATGCCCTTACATTTCAGATGCCC
SNP19 4 ACGTTGGATGCCGTAGTCAGTCACTCATAC ACGTTGGATGTTATGATCCCTCTCGACCTC
SNP21 5 ACGTTGGATGGGCTTTTTAAAACAAAAGCAC ACGTTGGATGTTCATAACTCAACTAACT
SNP23 5 ACGTTGGATGGATAGTTCTTCTCATGCACC ACGTTGGATGGCATCTATAGTTGTTCGAGG
SNP25 5 ACGTTGGATGTTTCCACTTCATGGATAGGC ACGTTGGATGGATAGCCTTGACCTGTCAGC
SNP26 6 ACGTTGGATGAGTATTCCCCTTGTAACGGC ACGTTGGATGAGGACGCTTCTCCATACTAC
SNP27 6 ACGTTGGATGGTAAATATTCTAAGTTCAC ACGTTGGATGGTTGCGTTGTATTTGTAGTTC
SNP28 6 ACGTTGGATGCTCCTAGAAACATTCTTCGC ACGTTGGATGCGAAGGTCTTTGAGGTTATG
SNP29 6 ACGTTGGATGTATGTATACACACACATAT ACGTTGGATGAGCAGACATTTCAAGGCTCC
SNP30 6 ACGTTGGATGTATGGAATTGGGTCACCAGG ACGTTGGATGTGATCTCCAGTTCCACTGTC
SNP31 7 ACGTTGGATGTATGTTGACGCTTTCCACGG ACGTTGGATGAGGGAAGTACTTGAAGAGTG
SNP32 7 ACGTTGGATGAAGATTCTGGTGGCAATGGG ACGTTGGATGCACCAAGCATGTGCAACATC
SNP33 7 ACGTTGGATGACAGCCTAATCCCATGAGAG ACGTTGGATGATCGATAGGCTAGCTATGAG
SNP34 7 ACGTTGGATGGCAGAGATTAGAGAGAGTCC ACGTTGGATGTGGGTCTATTCTTCTCCCTC
SNP35 7 ACGTTGGATGACTTCACACGAGACCCAAAC ACGTTGGATGGACACCGATAAGTTTCTTGG
SNP36 7 ACGTTGGATGCACTGCTCTTCCAATTCCAG ACGTTGGATGATCTTCAAGCTAAGAGCAAG
SNP41 8 ACGTTGGATGGCCCTATTGCATATCCAGTC ACGTTGGATGTACACCTGATCACAACACAC
SNP42 8 ACGTTGGATGGTATACCGATGAAGTTGAAG ACGTTGGATGCGTCTTGTTCCAGTAGACAC
SNP43 9 ACGTTGGATGAGACTCATCATACTTCCTAC ACGTTGGATGACAAGCAAACTTGTGAAGGG
SNP44 9 ACGTTGGATGACTCAGCTTTGCTTCAGTCC ACGTTGGATGAAGGCTGGGATCTGCAATTC
SNP46 9 ACGTTGGATGTCATGAGTAGCAACTCCTTG ACGTTGGATGACTTGTTCTGCTACATTGAC
SNP47 9 ACGTTGGATGCTCTGTCAAGTCAAGTACTG ACGTTGGATGCAGTGAAAAGTCGCTGTCTG
SNP48 10 ACGTTGGATGCATCATGAACATCTTGTCGC ACGTTGGATGTTTACCCTACCAATGAGGTG
SNP50 10 ACGTTGGATGTTTCCGCATCAGCACCTTAG ACGTTGGATGTCCAATGAGGCATCCATACG
SNP51 10 ACGTTGGATGCTCAAGAGTCAAGCATACGC ACGTTGGATGGACCGGTCAACATTTCTCTG
SNP52 10 ACGTTGGATGTGTTCTTCTCAAAAGTGTGC ACGTTGGATGACAAGCCCTTGCAGAGGAAA
SNP53 10 ACGTTGGATGAGGTTGGGTTCGAATTGGAG ACGTTGGATGCCTTCGTCACTTAACATGAG
SNP55 11 ACGTTGGATGTGATCAAAGGAATGGGAGAG ACGTTGGATGCCCTCAAGTAAAGTCAACATC
SNP57 11 ACGTTGGATGAACAAGGCAGATGTCCAAGC ACGTTGGATGTGCAAGTCTAGATCTCAGGC
SNP58 11 ACGTTGGATGAATGACTGGGAGAAGCTTGG ACGTTGGATGTGCAGTGCATCTATCGCGTG
SNP60 12 ACGTTGGATGCAAATGTAATCCGACAAGTGG ACGTTGGATGTCTCTATCTCTACCTCCACG
SNP61 12 ACGTTGGATGCCACGTCTTGTATCATGGTC ACGTTGGATGCCACCACCTAAACCTCATAG
SNP63 12 ACGTTGGATGAAAGCAATCAAGGGCCAAGC ACGTTGGATGCATATCCTTCATCTACTGGG
SNP65 12 ACGTTGGATGTTGGGCATGGCAATGCAAT ACGTTGGATGTCCAAAGGACAATGATGGC
刘希艳,郑 峥,邓学斌,冯晶晶,白金瑞,宋 燕,刘 磊,李君明.
中国加工番茄资源遗传多样性分析.
园艺学报,2016,43 (3):485–495. 491
2.2.2 3种类型标记多态性分析
本研究所用的 48 对 InDel 标记是苏晓梅(2014)从均匀分布于番茄 12 条染色体上的 376 对 InDel
标记中筛选而出,多态性比例不足 13%;随机挑选的 49 对 SSR 标记中,有 13 对表现丰富的多态性,
多态性比例为 26.5%;65 个 SNP 标记中,44 个表现较好的多态性,多态性比例为 67.7%。利用上述
入选的多态性标记对 615 个加工番茄自交系进行分析,发现 InDel 标记的 PCR 扩增效果优于 SSR 标
记,主条带清晰,非特异性扩增条带较少;SSR 标记等位基因数和非特异扩增较多;SNP 分型位点
有 ATGC 四种碱基及其组合形式。
13 对 SSR 引物共检测到 33 个等位变异,变幅为 2 ~ 5 个,平均每个标记 2.54 个;主效等位基
因频率为 0.5439 ~ 0.9967,平均频率为 0.8786;基因的多样性指数为 0.0065 ~ 0.5770,平均为 0.1870;
PIC 值为 0.0065 ~ 0.4988,平均为 0.1617。24 对多态性 InDel 引物扩增清晰,条带可用性除 InDel-36
外均能达到 95%及以上,主效等位基因频率在 0.5579 ~ 0.9286 之间;基因的多样性指数为 0.1327 ~
0.4933,平均为 0.3642;PIC 值为 0.1239 ~ 0.3716,平均为 0.2933。利用 65 个 SNP 位点对所试自交
系进行 SNP 分型,44 个呈现多态性,平均每条染色体上约 3.7 个,其中 SNP27、SNP52、SNP63 多
态信息含量不足 0.1,分别为 0.0804,0.0391,0.0036,属稀有位点。44 对引物共检测到 172 个等位
变异,变幅为 3 ~ 4 个,平均每个标记 3.91 个,主效等位基因频率为 0.3099 ~ 0.9982,平均频率为
0.6184;基因的多样性指数为 0.0036 ~ 0.7352,平均为 0.4701;PIC 值为 0.0036 ~ 0.6855,平均为 0.3921
(表 2)。综合上述结果可以看出,SNP 标记无论在扩增等位基因数、PIC 值还是在多态性比例方面
均高于 SSR 和 InDel,在遗传资源分析方面均表现出明显优势。
表 2 不同类型引物扩增条带统计表
Table 2 Numbers of bands amplified by different markers
标记类型
Marker
主效等位基因频率
Major allele frquency
基因型
Genotype
等位基因数
Allele
可用性
Availability
基因多样性
Gene diversity
杂合度
Heterozygosity
多态信息含量
PIC
SSR 0.5439 ~ 0.9967
(0.8786)
2 ~ 7
(3.23)
2 ~ 5
(2.54)
0.8333 ~ 1.0000
(0.9458)
0.0065 ~ 0.5770
(0.187)
0 ~ 0.4695
(0.0876)
0.0065 ~ 0.4988
(0.1617)
InDel 0.5579 ~ 0.9286
(0.7428)
3
(3)
2
(2)
0.8358 ~ 0.9919
(0.9709)
0.1327 ~ 0.4933
(0.3642)
0.0099 ~ 0.2903
(0.058)
0.1239 ~ 0.3716
(0.2933)
SNP 0.3099 ~ 0.9982
(0.6184)
2 ~ 3
(2.91)
3 ~ 4
(3.91)
0.6911 ~ 0.9187
(0.8719)
0.0036~0.7352
(0.4701)
0.0018 ~ 0.7341
(0.1241)
0.0036 ~ 0.6855
(0.3921)
注:括号内为均值。
Note:Within the bracket is the mean value.
2.2.3 不同类型标记的聚类分析
利用入选的 13 对 SSR 标记、24 对 InDel 标记和 44 个 SNP 标记对 615 份供试自交系进行聚类
分析,发现 SSR、InDel 和 SNP 标记分别在遗传距离为 0.12、0.19 和 0.15 时均能清晰地将其分为 2
大群(表 3 和图 3,SSR + InDel + SNP)。此外,SSR 标记在遗传距离为 0.10 时,第Ⅱ类又分为 3
个亚群;InDel 标记在遗传距离为 0.17 时,第Ⅱ类分为 2 个亚群,遗传距离为 0.14 时,第Ⅰ群分为
2 个亚群;SNP 在遗传距离为 0.11 时,第Ⅰ群分为 3 个亚群,第Ⅱ群分成 3 个亚群。
利用 3 种不同类型标记共计 81 个多态性位点对全部自交系聚类(图 3,SSR + InDel + SNP),
遗传距离为 0.16 时,分为 2 大群(Ⅰ、Ⅱ)。第Ⅰ群共计 461 份自交系,包括 2010 年前育成的 149
份(69.63%),2010 年后育成的 312 份(77.81%),代表自交系有 87-5、PT4675B、PT4679B、PT4719B、
UC204、NC1 CELBR、NC EBR-8、NC25P、NC2 CELBR 等;第Ⅱ群共计 154 份自交系,包括 2010
年前育成的 65 份(30.37%),2010 年后前育成的 89 份(22.19%),代表自交系有 CLN2123A、NCEBR-7
Liu Xi-yan,Zheng Zheng,Deng Xue-bin,Feng Jing-jing,Bai Jin-rui,Song Yan,Liu Lei,Li Jun-ming.
Analysis the genetic diversity of processing tomato in China.
492 Acta Horticulturae Sinica,2016,43 (3):485–495.
等。此外,第Ⅰ群(遗传距离为 0.14)分为 4 个亚群,分别包含 206、140、88、27 份自交系,第
Ⅱ群(遗传距离为 0.15)分为 2 个亚群,分别包含自交系 21 和 133 份,共计 6 个亚群。近年育成
的自交系较均匀地分布于 2 大类群中,表明这些自交系遗传多样性丰富。
表 3 基于 3 种不同类型标记的聚类结果
Table 3 Clustering results based on three different types of markers
自交系比例/% Ration of inbred lines标记类型
Type of
marker
个数
Number
分类
Category
自交系数
Number of
inbred line
已知代表性自交系
Known representative inbred line 2010 年前
Before 2010
2010 年后
After 2010
SSR 13 Ⅰ 487 87-5、PT4675B、PT4679B、PT4719B、CLN2123A、UC204、
NC1 CELBR、NC EBR-8、NCEBR-7、NC25P、NC2 CELBR
78.50(168) 79.55(319)
Ⅱ 128 21.50(46) 20.45(82)
InDel 24 Ⅰ 389 PT4675B、PT4679B、PT4719B、CLN2123A、UC204、NC1
CELBR、NC EBR-8、NC25P、NC2 CELBR
55.61(119) 67.33(270)
Ⅱ 226 87-5、CLN2123A、NCEBR-7 44.39(95) 32.67(131)
SNP 44 Ⅰ 430 87-5、PT4679B、PT4719B、CLN2123A、UC204、NC1
CELBR、NC EBR-8、NCEBR-7、NC25P、NC2 CELBR
72.90(156) 68.33(274)
Ⅱ 185 PT4675B 27.10(58) 31.67(127)
注:括号内为自交系数。
Note:Within the bracket is the number of inbred lines.
图 3 加工番茄 615 份自交系基于不同标记的聚类比较与分析
每一分支代表 1 个自交系,共计 615 个。 、 、 、 为相关代表性自交系,标尺为遗传距离。分为Ⅰ和Ⅱ两大类群,亚群用 1 ~ 4 标出。
Fig. 3 Comparison and analysis the polymorphism of 615 accessions based on markers
Each of the branches is one inbred line,there are 615 inbred lines in total. , , , are the representative inbred lines,scale length is the
genetic distance. It is divided intoⅠand Ⅱgroups,sub-groups are labeled by 1–4.
刘希艳,郑 峥,邓学斌,冯晶晶,白金瑞,宋 燕,刘 磊,李君明.
中国加工番茄资源遗传多样性分析.
园艺学报,2016,43 (3):485–495. 493
3 讨论
作物种质资源的遗传多样性分析,有利于鉴别特异种质,提高遗传育种效率(Harlan,1976;
Rick,1984)。研究业已明确加工番茄和鲜食番茄存在明显差异(Sim et al.,2009;Corrado et al.,
2013),但对于加工番茄这个特定的亚群遗传多样性仍知之甚少。本文中对加工番茄代表 50 年育种
历程和来自不同国家和地区的 615 个典型自交系分别利用表型和基因型数据进行了遗传多样性分
析,均分为 2 大类群,51.4%(316 份)自交系聚类一致,说明表型与基因型相吻合。其中一个群体
主要由早期育成的自交系组成,而另外一个群体则主要包括近几年育成的自交系,不仅说明加工番
茄亚群的产生更大程度归因于育种和市场需求而非地域差异(Sim et al.,2011;García-Martínez et al.,
2013),而且也可以看出基于分级的表型鉴定结果也具有较准确的代表性。此外还发现,虽然仅利用
81 个标记,但基于基因型的聚类较表型更为准确,如已知系谱的 NC1 CELBR 和 NC2 CELBR 是来
自 03220 的姊妹系(Gardner & Panthee,2010),基因型将二者聚在第 I 类群且紧密相邻,遗传距离
极小;而表型聚类却将二者分在 2 个类群,遗传距离较大。对于本研究表型数据分析存在的误差,
一方面可能是人为调查结果存在差异造成,另外一方面是众多性状受数量性状位点(QTL)控制,
本研究全部自交系仅种植 1 次重复和 1 年调查结果,受季节和环境影响较大所致。多年多点表型调
查将会进一步提高表型聚类的准确性,也会为未来开展加工番茄全基因组关联分析奠定良好的基础。
利用代表基因组不同类型信息的 3 种标记分析 615 份加工番茄,证明 SNP 标记较 SSR 标记和
InDel 标记多态性更丰富(Sim et al.,2012),SSR 的多态性水平较 InDel 高,这与前人在鲜食番茄
群体中研究结果一致(申璐 等,2011),可能是由于遗传基础相对狭窄群体所致。因为已有研究表
明,14% ~ 22%的基因含有 InDel 标记,而含有 SSR 的基因只占总基因数的 4.6%(Sim et al.,2009;
Wang et al.,2010)。本研究中利用入选的多态性丰富的 SSR、InDel、SNP 对典型的加工番茄进行了
分析,发现虽然 SSR 标记数最少,但也可将全部自交系分为 2 大群,与 InDel 和 SNP 的分类结果一
致,且 SSR 和 SNP 聚类一致性更好,2 大类群中占总数 64.23%的自交系分类相同。已有报道 14 对
SSR标记即可将典型的意大利地方品种San Marzano与其它品种明显区分开(Caramante et al.,2009),
23 对 SSR 可将 3 342 份黄瓜资源的区域明显划分(Lü et al.,2012),说明 SSR 在作物亚种中很丰富。
但与 InDel 特别是 SNP 相比,本研究中 13 对 SSR 却未能将各亚群中不同自交系明显区别开,许多
自交系聚在同一分支,可能是 SSR 标记数目较少产生的结果。另外,还发现 SSR 和 SNP 标记对 2010
年前的自交系分类结果相似(分别是 78.50%和 21.50%,72.90%和 27.10%,详见表 3),而 InDel 和
SNP 对 2010 年后的自交系分类结果类似(67.33%和 32.67%, 68.33%和 31.67%),说明加工番茄现
代遗传改良很有可能主要是插入/缺失、单碱基突变等位点的积累,如大量使用单碱基突变的果实颜
色 ogc 基因等。同时还发现,筛选出的多态性标记在不同染色体上分布不均匀,第 4 和 8 条染色体
上多态性标记较少,与 Kobayashi 等(2013)的结果吻合。栽培种 Micro-Tom 和 Heinz1706 的第 2、
5 和 11 条染色体上的 SNP 和 InDel 标记密度较高,而第 6、8 和 10 条染色体上较低(Kobayashi et al.,
2013)。导致上述结果的重要原因之一是市场对鲜食和加工番茄抗性要求不同,使其野生种渗入片段
导入及其抗源基因携带不同(Sim et al.,2012;Blanca et al.,2015)。随着新一代测序(NGS)及各
种组学技术的发展(Tomato Genome Consortium,2012;Lin et al.,2014),特别是 SNP 高通量、低
成本、快速分型平台的建立,如 KASP(Kompetitive Allele-Specific PCR)等技术将会为作物种内亚
群深入分析提供更为有利的工具。
Liu Xi-yan,Zheng Zheng,Deng Xue-bin,Feng Jing-jing,Bai Jin-rui,Song Yan,Liu Lei,Li Jun-ming.
Analysis the genetic diversity of processing tomato in China.
494 Acta Horticulturae Sinica,2016,43 (3):485–495.
References
Alvarez A E,Van de Wiel C C M,Smulders M J M,Vosman B. 2001. Use of microsatellites to evaluate genetic diversity and species relationships in
the genus Lycopersicon. Theoretical and Applied Genetics,103 (8):1283–1292.
Blanca J,Montero-Pau J,Sauvage C,Bauchet G,Illa E,Díez M J,Francis D,Causse M,Knaap E,Cañizares J. 2015. Genomic variation in
tomato from wild ancestors to contemporary breeding accessions. BMC Genomics,16 (1):257.
Brenchley R,Spannagl M,Pfeifer M,Barker G L,D’Amore R,Allen A M,McKenzie N,Kramer M,Kerhornou A,Bolser D,Kay S,Waite
D,Trick M,Bancroft T,Gu Y,Huo N,Luo M,Sehgal S,Gill B,Kianian S,Anderson O,Kersey P,Dvorak J,McCombie W R,
Hall N. 2012. Analysis of the bread wheat genome using whole-genome shotgun sequencing. Nature,491 (7426):705–710.
Caramante M,Rao R,Monti L M,Corrado G. 2009. Discrimination of‘San Marzano’accessions:a comparison of minisatellite,CAPS and SSR
markers in relation to morphological traits. Scientia Horticulturae,120 (4):560–564.
Corrado G,Piffanelli P,Caramante M,Coppola M,Rao R. 2013. SNP genotyping reveals genetic diversity between cultivated landraces and
contemporary varieties of tomato. BMC Genomics,14 (1):835.
Fulton T M,Chunwongse J,Tanksley S D. 1995. Microprep protocol for extraction of DNA from tomato and other herbaceous plants. Plant
Molecular Biology Reporter,13 (3):207–209.
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming. 2015. Development of a core
collection of processing tomato germplasms and analysis of genetic background. Acta Horticulturae Sinica,42 (7):1299–1312. (in Chinese)
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明. 2015. 加工番茄核心种质构建及其遗传背景分析. 园
艺学报,42 (7),1299–1312.
Gabriel S,Ziaugra L. 2004. SNP genotyping using Sequenom MassARRAY 7K platform. Current protocols in human genetics,Chapter 2:Unit 2.12
Ganal M W,Durstewitz G,Polley A,Bérard A,Buckler E S,Charcosset A,Clarke J D,Graner E M,Hansen M,Joets J,Le Paslier M C,
McMullen M D,Montalent P,Rose M,Schön C-C,Sun Q,Walter H,Martin O C,Falque M. 2011. A large maize(Zea mays L.)SNP genotyping
array:Development and germplasm genotyping and genetic mapping to compare with the B73 reference genome. PLoS One,6 (12):e28334.
García-Martínez S,Corrado G,Ruiz J J,Rao R. 2013. Diversity and structure of a sample of traditional Italian and Spanish tomato accessions.
Genetic Resources and Crop Evolution,60 (2):789–798.
Gardner R G,Panthee D R. 2010. NC 1 CELBR and NC 2 CELBR:Early blight and late blight-resistant fresh market tomato breeding lines.
HortScience,45 (6):975–976.
Harlan J. 1976. Genetic resources in wild relatives of crops. Crop Science,16 (3):329–333.
He C,Poysa V,Yu K. 2003. Development and characterization of simple sequence repeat(SSR)markers and their use in determining relationships
among Lycopersicon esculentum cultivars. Theoretical and Applied Genetics,106 (2):363–373.
Huang X,Kurata N,Wei X,Wang Z X,Wang A,Zhao Q,Guo Y. 2012a. A map of rice genome variation reveals the origin of cultivated rice. Nature,
490 (7421):497–501.
Huang X,Zhao Y,Wei X,Li C,Wang A,Zhao,Q,Fan D. 2012b. Genome-wide association study of flowering time and grain yield traits in a
worldwide collection of rice germplasm. Nature Genetics,44 (1):2–39.
Kobayashi M,Nagasaki H,Garcia V,Just D,Bres C,Mauxion J P,Toyoda A. 2013. Genome-wide analysis of intraspecific DNA polymorphism
in ‘Micro-Tom’,a model cultivar of tomato(Solanum lycopersicum). Plant and Cell Physiology,55 (2):445–454.
Kwon Y S,Park S G,Yi S I. 2009. Assessment of genetic variation among commercial tomato(Solanum lycopersicum L.)varieties using SSR
markers and morphological characteristics. Genes & Genomics,31 (1):1–10.
Lin T,Zhu G,Zhang J,Xu X,Yu Q,Zheng Z,Zhang Z,Lun Y,Li S,Wang X,Huang Z,Li J,Zhang C,Wang T,Zhang Y,Wang A,
Zhang Y,Lin K,Li C,Xiong G,Xue Y,Mazzucato A,Causse M,Fei Z,Giovannoni J J,Chetelat R T,Zamir D,Städle T,Li J,
Ye Z,Du Y,Huang S. 2014. Genomic analyses provide insights into the history of tomato breeding. Nature Genetics,46 (11):1220–1226
Lü J,Qi J,Shi Q,Shen D,Zhang S,Shao G,Li H,Sun Z,Weng Y,Shang Y,Gu X,Li X,Zhu X,Zhang J,van Treuren R,van Dooijeweert
W,Zhang Z,Huang S. 2012. Genetic diversity and population structure of cucumber(Cucumis sativus L.). PLoS One,7 (10):e46919.
Mehta P D,Mehta S P,Patrick B A. 1984. Silver staining of unconcentrated cerebrospinal fluid in agarose gel(Panagel)electrophoresis. Clinical
刘希艳,郑 峥,邓学斌,冯晶晶,白金瑞,宋 燕,刘 磊,李君明.
中国加工番茄资源遗传多样性分析.
园艺学报,2016,43 (3):485–495. 495
Chemistry,30 (5):735-736.
Merk H L,Yarnes S C,Van Deynze A,Tong N,Menda N,Mueller L A,Mutschler M A,Loewen S A,Myers J R,Francis D M,Soc J A. 2012.
Trait diversity and potential for selection indices based on variation among regionally adapted processing tomato germplasm. Journal of the
American Society for Horticultural Science,137 (6):427–437.
Park Y H,West M A L,St. Clair D A. 2004. Evaluation of AFLPs for germplasm fingerprinting and assessment of genetic diversity in cultivars of
tomato(Lycopersicon esculentum L.). Genome,47 (3):510–518.
Paterson A H,Damon S,Hewitt J D,Zamir D,Rabinowitch H D,Lincoln S E,Lander E S,Tanksley S D. 1991. Mendelian factors underlying
quantitative traits in tomato:Comparison across species,generations,and environments. Genetics,127 (1):181–197.
Prasad M,Varshney R K,Roy J K,Balyan H S,Gupta P K. 2000. The use of microsatellites for detecting DNA polymorphism,genotype
identification and genetic diversity in wheat. Theoretical and Applied Genetics,100 (3–4):584–592.
Rasmussen W D. 1968. Advances in American agriculture:the mechanical tomato harvester as a case study. Technology and Culture,4 (9):531–
543.
Rick C M. 1984. Germplasm resources in the wild tomato species. Acta Hortic,190:39–48.
Ruiz J J,García-Martínez S,Picó B,Gao M,Quiros C F. 2005. Genetic variability and relationship of closely related Spanish traditional cultivars
of tomato as detected by SRAP and SSR markers. Journal of the American Society for Horticultural Science,130 (1):88–94.
Saitou N,Nei M. 1987. The neighbor-joining method:a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution,4 (4):
406–425.
Shen Lu,Shen Huo-lin,Chai Min,Wang Yin-lei,Yang Wen-cai. 2011. Genomic DNA polymorphisms in tomato varieties revealed by InDel and SSR
markers. Journal of China Agricultural University,16 (2):34–42. (in Chinese)
申 璐,沈火林,柴 敏,王银磊,杨文才. 2011. 采用 InDel 和 SSR 标记分析番茄品种基因组 DNA 多态性. 中国农业大学学报,16 (2):
34–42.
Sim S C,Robbins M D,Chilcott C,Zhu T,Francis D M. 2009. Oligonucleotide array discovery of polymorphisms in cultivated tomato(Solanum
lycopersicum L.)reveals patterns of SNP variation associated with breeding. BMC Genomics,10 (1):466.
Sim S C,Robbins M D,Van Deynze A,Michel A P,Francis D M. 2011. Population structure and genetic differentiation associated with breeding
history and selection in tomato(Solanum lycopersicum L.). Heredity,106 (6):927–935.
Sim S C,Van Deynze A,Stoffel K,Douches D S,Zarka D,Ganal M W,Chetelat R T,Hutton S F,Scott J W,Gardner R G,Panthee D R,
Mutschler M,Myers J R,Francis D M. 2012. High-density SNP genotyping of tomato(Solanum lycopersicum L.)reveals patterns of genetic
variation due to breeding. PLoS One,7 (9):e45520.
Stevens M A. 1986. Inheritance of tomato fruit quality components. Plant Breeding Reviews,4:273–311.
Su Xiao-mei. 2014. The development and application of tomato foreground and background markers[M. D. Dissertation]. Beijing:Chinese Academy
of Agricultural Sciences. (in Chinese)
苏晓梅. 2014. 番茄前景标记和背景标记的开发与应用研究[硕士论文]. 北京:中国农业科学院.
Tomato Genome Consortium. 2012. The tomato genome sequence provides insights into fleshy fruit evolution. Nature,485 (7400):635–641
van Berloo R. 2008. GGT 2.0:Versatile software for visualization and analysis of genetic data. Journal of Heredity,99 (2):232–236.
Villand J,Skroch P W,Lai T,Hanson P,Kuo C G,Nienhuis J. 1998. Genetic variation among tomato accessions from primary and secondary centers
of diversity. Crop Science,38 (5):1339–1347.
Víquez-Zamora M,Vosman B,Geest H V D,Bovy A,Visser R G,Finkers R,Van Heusden A W. 2013. Tomato breeding in the genomics era:
Insights from a SNP array. BMC Genomics,14 (1):354.
Wang Y,Chen J,Francis D M,Shen H,Wu T,Yang W. 2010. Discovery of intron polymorphisms in cultivated tomato using both tomato and
Arabidopsis genomic information. Theoretical and Applied Genetics,121 (7):1199–1207.
Wang Z,Wang A,Zhao Q,Zhao Y,Liu K,Lu H,Li W,Guo Y,Lu Y,Zhou C,Fan D,Weng Q,Zhu C,Huang T,Zhang L,Wang Y,
Feng L,Furuumi H,Kubo T,Miyabayashi T,Yuan Xi,Xu Q,Dong G,Zhan Q,Li C,Fujiyama A,Toyoda A,Lu T,Feng Q,Qian
Q,Li J,Han B. 2012. A map of rice genome variation reveals the origin of cultivated rice. Nature,490 (7421):497–501.