全 文 :园艺学报,2015,42 (7):1299–1312.
Acta Horticulturae Sinica
doi:10.16420/j.issn.0513-353x.2015-0134;http://www. ahs. ac. cn 1299
收稿日期:2015–03–18;修回日期:2015–05–21
基金项目:国家自然科学基金项目(31171962);公益行业(农业)科研专项经费项目(201303115);‘十二五’国家科技支撑计划项目
(2012BAD02B04);中国农业科学院科技创新工程项目(CAAS-ASTIP-IVFCAAS);农业部园艺作物生物学与种质创新重点实验室项目
* 共同第一作者
** 通信作者 Author for correspondence(E-mail:lijunming@caas.cn;zhengzheng@caas.cn)
加工番茄核心种质构建及其遗传背景分析
邓学斌,刘 磊*,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥**,
李君明**
(中国农业科学院蔬菜花卉研究所,北京 100081)
摘 要:基于 50 年来收集的 3 026 份加工番茄不同类型种质资源,分别利用 20 个表型性状和均匀覆
盖 12 条染色体的 46 个 SNP 标记,采用 5 种不同方法(Mstrat、Random、REMC、SBS 和 SFS)构建了
10 种初始核心种质。通过对其代表性评价与分析,最终确定了加工番茄最佳核心种质。Mstrat 是构建加
工番茄亚群核心种质的最佳方法,采用 10%抽样比例所构建的 302 份最佳核心种质 GCC1 对原始种质的
遗传结构和多样性均具有较好的代表性。通过对原始种质群体结构和主成分分析,加工番茄种质资源可
分为 2 个较大的群体,遗传背景分别是基于代表性材料普通栽培番茄 E6203 和 M82,所构建的 GCC1 核
心种质均匀分布在原始种质资源群体。
关键词:加工番茄;SNP 标记;核心种质;遗传背景
中图分类号:S 641.2 文献标志码:A 文章编号:0513-353X(2015)07-1299-14
Development of a Core Collection of Processing Tomato Germplasms and
Analysis of Genetic Background
DENG Xue-bin,LIU Lei*,YAN Zhe,LI Tao,LIU Xi-yan,FENG Jing-jing,CHI Hai-juan,ZHENG
Zheng**,and LI Jun-ming**
(Institute of Vegetables and Flowers of Chinese Academy of Agricultural Sciences,Beijing 100081,China)
Abstract:Based on 3 026 accessions of processing tomato germplasms collected in the last 50 years,
10 kinds of primary core collections were established by using 20 phenotypic traits and 46 SNP markers
evenly distributed over 12 chromosomes combining with 5 different strategies(Mstrat,Random,REMC,
SBS and SFS). Finally a core collection of processing tomato was determined after the evaluation and
analysis of their representativeness. M strategy is a valid method to develop a core collection for the
subgroup of processing tomato. The collected processing tomato germplasms could be divided into two
clusters and their genetic backgrounds are based on cultivated tomato accession E6203 and M82 as the
representative accessions of processing tomato,respectively. The established core collection GCC1 evenly
distributed in the population of the initial processing tomato germplasms.
Key words:processing tomato;SNP marker;core collection;genetic background
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1300 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
核心种质(core collection)的概念于 1984 年提出(Frankel,1984),1995 年,Brown 对其进行
了明确定义。核心种质是从已收集的资源群体中选择出数量有限(整个群体的 5% ~ 20%)且能代表
整个所收集的资源遗传多样性的一系列材料。构建核心种质,不仅能够减轻种质资源保存和更新的
负担(张永兵 等,2013),对具有代表性的种质及其性状优先评价(Gepts,2006),还可以为育种
提供更详细和有用的材料,提高优良品种选育效率(李辛雷 等,2014)。过去几十年,先后有 50
多种作物构建了核心种质(Hintum,2000),其在资源保存和遗传改良中发挥着重要作用。
虽然随着各种新技术的不断涌现和改进,核心种质构建的方法得以创新和发展(Oliveira et al.,
2013),但构建核心种质始终围绕两个基本点,一是最佳抽样比例,二是最有效抽样方法。由于作物
遗传进化存在一定差异,所以不同作物核心种质构建的具体方法也不尽相同(Hamon et al.,1998)。
就抽样比例而言,通常可根据不同目的、材料及遗传背景来确定,其中通过数据模拟模型对不同抽
样比例下所捕获的等位基因数量进行预测已成为预测最佳抽样比例的一种有效手段(Gouesnard et
al.,2001)。目前采用 Mstrat 预测最佳抽样比例,已在水稻(Zhang et al.,2011)、苹果(Gross et al.,
2013)、咖啡(Leroy et al.,2014)等作物中广泛应用。Oliveira 等(2013)对不同抽样比例下(5%、
10%、15%和 20%)构建的核心种质多样性分析,发现基于不同抽样比例构建的核心种质多样性参
数差异很小。综合前人研究结果,核心种质通常保持在原始保存材料 10%左右较好(Ortiz et al.,1998;
Zhang et al.,2000;Upadhyaya et al.,2003;Mahalakshmi et al.,2007)。此外最有效的抽样方法,
目前应用较为普遍的有 M 法抽样(Maximization Strategy)、随机抽样(Random Strategy)、RMEC
(Replica Exchange Monte Carlo)、SBS(Sequential Backward Selection)和 SFS(Sequential Forward
Selection)等。不同抽样方法各有优势,其中 M 方法能够最大限度的保留等位基因(Gross et al.,
2013;Leroy et al.,2014),随机抽样则有利于保存群体结构的遗传多样性(Hu et al.,2000),RMEC
则能根据多重遗传多样性快速构建核心种质(de Beukelaer et al.,2012),SBS 和 SFS(Liu & Yu,
2005)则能有效保留稀有位点。无论采用哪种方法,只有充分考虑材料之间的遗传距离和多样性差
异,才能构建出最佳核心种质(Hamon et al.,1998;de Beukelaer et al.,2012)。另外,若材料的地
理分布或来源已明确,抽样前可先依据其来源进行分层,会获得更为理想的效果(Igartua et al.,
1998)。
番茄(Solanum lycopersicum)的驯化栽培最初可能发生在中美洲地区,16 世纪由西班牙探险家
带入欧洲(Bauchet & Causse,2012),从野生种进化到现有普通栽培种大约经历了 500 年(Jenkins,
1948),而人类对其遗传改良只有几十年的历史,并且在过去相当长一个阶段,主要是将野生种番茄
抗病基因转育到栽培种中(Lin et al.,2014)。自 20 世纪 40 年代起,根据市场需求才逐渐分化为加
工番茄与鲜食番茄两个亚群,其明显差异性主要表现在植株生长习性和果实特性,至 20 世纪 60 年
代育成第 1 个适合机械采收的加工番茄品种(Sim et al.,2012;Corrado et al.,2013)。由于当时有
限的驯化资源和长期有益性状的不断高压选择,栽培种番茄的遗传背景越来越狭窄(Nesbitt &
Tanksley,2002)。为了适应机械采收,加工番茄育种资源必须具有有限生长类型、无节、植株紧凑、
成熟期一致等特性(Barrios-Masias & Jackson,2014),无疑使其遗传多样性又受到极大限制(Sim et
al.,2009)。传统的 RFLP、CAPS、SSR、ISSR 等标记,在普通栽培种间呈现十分有限的多态性(Park
et al.,2004;Mazzucato et al.,2010)。遗传标记多样性的匮乏也导致番茄核心种质构建工作较为滞
后。最近 Rao 等(2012)对收集的 322 份野生醋栗番茄(S. pimpinellifolium),利用 SSR 标记构建
了核心种质。而作为育种基础的栽培种核心种质,主要由相关公司完成,公开报道较少。近年来,
随着番茄基因组测序和大量不同类型番茄资源转录组测序及全基因组重测序的完成,基于全基因组
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明.
加工番茄核心种质构建及其遗传背景分析.
园艺学报,2015,42 (7):1299–1312. 1301
序列开发了大量的高多态性 SNP 标记,为番茄栽培种种内遗传多样性的分析提供了可能(Hamilton
et al.,2012;Sim et al.,2012;Shirasawa et al.,2013;Lin et al.,2014)。基于 SNP 标记,根据最小
等位基因频率(Minor Allele Frequency,MAF)在基因组的分布,可将栽培种番茄分为鲜食、加工
和古老品种 3 个群,特别是在染色体 2、4、5、6 和 11 上存在明显差异(Sim et al.,2012)。本研究
中基于 50 多年来收集的 3 026 份加工番茄亚群遗传资源,分别利用表型和基因型数据,采用不同方
法,构建了加工番茄的核心种质,旨在为番茄及类似作物核心种质的构建提供方法,为番茄遗传改
良奠定一定基础。
1 材料与方法
1.1 试验材料
试验材料由中国农业科学院蔬菜花卉研究所加工番茄课题组提供,共计 3 026 份,全部为加工
番茄单株多代自交材料,2013 年 3 月播种于顺义试验站育苗温室。育苗基质为草炭和蛭石(2∶1)
及有机肥料。每品系播种 8 株,每穴盘播种 5 个品系。昼温 25 ~ 28 ℃,夜温 15 ~ 18 ℃。每 7 d 浇
水 1 次,每 14 d 浇施 1 次 0.5%的磷酸二氢钾溶液。待幼苗长到 5 ~ 6 片真叶时选取 5 株大小均匀的
幼苗,4 月 25 日定植于大田。田间沟心距 1.5 m,株距 25 cm,垄高 25 cm,采用单行栽植,按大田
生产管理。生长期间单株采取少许嫩叶,采用 CTAB 法(Fulton et al.,1995)提取基因组 DNA。
1.2 性状调查
参照 Schroeder(2012)、Tanksley 和 Nelson(1996)的方法调查 20 个性状(表 1)。除旧金色花
色(Ogc)在开花期调查外,其余 19 个性状均在果实红熟期调查。数量性状依据分级来评判,其中
株形是指植株在田间匍匐或直立的生长状态及其均匀程度;覆盖是指植株叶片覆盖果实的程度;硬
度是指用手挤压的难易程度;病指是田间整株综合病害发病的病情指数。质量性状用数字 1 和 2(或
表 1 加工番茄表型性状分级
Table 1 Items and standards of phenotypic characteristics identification for processing tomato
分级 Grade 性状
Trait 5 4 3 2 1 0
旧金色 Ogc 是 Present 否 Absent
株形 Plant type 极好 Excellent 好 Well 中 Medium 差 Bad 极差 Poor
株幅 Plant width 大 Large 中大 Big 中 Medium 中小 Small 小 Minor
开展 Plant form 大 Large 中大 Big 中 Medium 中小 Small 小 Minor
分枝 Branching 多 Large 中多 Big 中 Medium 中少 Small 少 Minor
节间 Internode 长 Long 中长 Longer 中 Medium 中短 Shorter 短 Short
叶量 Leaf mass 多 Large 中多 Big 中 Medium 中少 Small 少 Minor
长势 Growth vigor 强 Vigorous 中强 Tronger 中 Medium 中弱 Weaker 弱 Weak
叶片大小 Leaf size 大 Large 中大 Big 中 Medium 中小 Small 小 Minor
叶色 Leaf Color 深绿 Dark 灰绿 Grey 绿 Green 浅绿 Light 黄绿 Yellow
覆盖 Canopy 好 Excellent 中好 Well 中 Medium 中差 Bad 差 Poor
坐果 Fruit set 多 Large 中多 Big 中 Medium 中少 Small 少 Minor
果形 Fruit shape 长柱 Long 梨形 Pear 卵圆 Oval 方圆 Round 扁圆 Oblate
成熟果皮色 Epidermis color 深红 Dark 红 Red 桔红 Orange 粉 Pink 黄 Yellow
硬度 Hardness 3++++ 3+++ 3++ 3+ 3
病指 Incidence index 80% ~ 100% 60% ~ 80% 40% ~ 60% 20% ~ 40% 1% ~ 20% 0
干汁 All flesh 是 Present 否 Absent
果节 Abscission layer 有节 Joint 假节 Jointless2 无节 Jointless1
可溶性固形物/% SSC
单果质量/g Fruit weight > 150 100 ~ 150 80 ~ 100 60 ~ 80 40 ~ 60 < 40
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1302 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
1、2 和 3)表示,Ogc 根据花色判断;果节根据果柄是否存在离层判断;干汁根据成熟果实是否具
有果胶判断;固形物含量(SSC)是每份材料取 10 ~ 20 个完全红熟的果实,制作成匀浆,在室温
20 ~ 23℃条件下,采用手持折光仪(日本 ATAGO 3452 便携式折糖仪)测定。
1.3 SNP 标记的分型
根据 Lin 等(2014)开发的大量 SNP 标记,基于 7 份加工番茄材料,选取均匀分布于 12 条染
色体上的 65 个 SNP 位点用于遗传多样性分析。SNP 分型采用 Sequenom 公司的 MassARRAY 技术
平台(Gabriel et al.,2009),由毅新兴业(北京)科技有限公司完成。
1.4 数据分析
利用 PowerMarker V2.5(Liu & Yu,2005)软件分别计算期望杂合度 He(Weir,1996)、观测杂
合度 Ho(Weir,1996)和生物信息含量 PIC(Botstein et al.,1980)参数;利用 Mstrat V4.0 软件预
测核心种质最佳样本,设置参数为 20 次重复(Replicates),每重复 20 次迭代次数(Maximum
iterations),每次递增样本(Step)数为 10(Lü et al.,2012)。根据预测结果,参照 Thachuk 等(2009)
方法,利用 CoreHunter 软件,分别采用 Mstrat、Random、REMC、SBS 和 SFS 等 5 种方法,对基于
基因型和表型数据进行 10%的抽样比例,抽样参数 Rogers 修正遗传距离(Mean Modified Rogers
Distance,MR)和香农多样性指数(Shannon’s Diversity Index,I)均设置为 0.5,分别构建初始核
心种质,然后分别从表型和基因型两个方面对其进行评价。其中表型代表性评价参考 Hu 等(2000)
的标准,构建的核心种质须同时符合两个条件:(1)均值同原始种质资源群体存在显著差异(α = 0.05)
的性状占全部性状的百分数小于或等于 20%;(2)核心种质和原始种质资源群体的极差符合率不低
于 80%。核心种质与原始种质表型性状的 F 检验(α = 0.05)和 t 检验(α = 0.05)均采用 SPSS19.0 软
件(Green & Salkind,2010);基因型代表性评价利用 Coreanalyser 软件,计算不同抽样方法下核心
种质的 MR、CE(Mean Cavalli-Sforza and Edwards Distance)、I、杂合位点多样性指数(Heterozygous
Loci Diversity Index,HE)以及等位基因覆盖度(Coverage Measure,CV)。利用 GGT2 软件(van Berloo,
2008),根据 SNP 基因型数据计算任意两份材料间的遗传距离。利用 Structure V2.3(Weir &
Cockerham,1984)预测和分析群体结构,群体数(K)设定为 1 ~ 18,将 MCMC(Markov Chain Monte
Carlo)开始时的不作数迭代(Length of Burn-in Period)和不作数迭代后的 MCMC 迭代均设为 100 000
次,重复运行 3 次。通过不同重复间的自然常数值[lnP(D)]计算 Pr(X|K)指数,以获得不同 K 值
所对应的 ΔK 值,并通过 ΔK 值的第 1 个峰值所对应的 K 值确定最佳组群数(Evanno et al.,2005;
Lü et al.,2012)。利用 GCTA 软件(Yang et al.,2011)进行主成分分析(Principal Component Analysis,
PCA)。分析过程中,表型数据缺失记为“9”,SNP 基因型缺失记为“NA”。
2 结果与分析
2.1 基于表型的多样性分析
通过对 3 026 份加工番茄遗传资源的 17 个数量和 3 个质量性状调查发现,除果皮色差异较小外,
其它各项指标均呈现丰富的变异。可溶性固形物含量(%)、病情指数等重要农艺性状均明显受数量
性状位点控制,呈现明显的正态分布(图 1)。不同材料果实的 SSC 最低 2.0%,最高 6.5%,绝大多
数材料为 4%左右;不同材料病指从不发病到几乎完全发病(0 ~ 5 级)。
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明.
加工番茄核心种质构建及其遗传背景分析.
园艺学报,2015,42 (7):1299–1312. 1303
表 2 表型遗传多样性分析
Table 2 Genetic diversity analysis of phenotypic traits
表型性状
Trait
分级数
Grade
香农多样性
指数 I
生物信息含量
PIC
株形 Plant type 5 1.3915 0.6704
株幅 Plant width 5 1.1041 0.5556
开展 Plant form 5 1.4719 0.7058
分枝 Branching 5 1.3448 0.6462
节间 Internode 5 1.2970 0.6309
叶量 Leaf mass 5 1.2598 0.6151
长势 Growth vigor 5 1.2059 0.6057
叶片大小 Leaf size 5 1.2524 0.6069
叶色 Leaf color 5 1.3167 0.6356
覆盖 Canopy 5 1.3672 0.6649
坐果 Fruit set 5 1.4203 0.6809
果形 Fruit shape 5 1.5401 0.7376
成熟果皮色
Epidermis color
5 0.1877 0.0716
硬度 Hardness 5 1.1783 0.5756
病指 Incidence index 6 1.5127 0.7150
固形物 SSC – 3.0537 0.9357
单果质量 Fruit weight 6 0.9889 0.4725
平均值 Mean – 1.3466 0.6192
图 1 部分重要农艺性状表型变异
Fig. 1 The phenotypic variance of some agronomic characters
基于上述表型性状,采用可评价群体多样
性高低的香农多样性指数(I)和生物信息含量
(PIC),对 3 026 份资源的遗传多样性进行了
评价(表 2)。各性状间 I 和 PIC 存在较大差异,
其中 I变幅从0.19到3.05,群体 I均值为1.3466;
PIC 变幅从 0.07 到 0.94,群体均值为 0.6192。
说明收集的加工番茄亚群内表型遗传多样性丰
富。同时还发现,不同性状间也存在较大差异,
如果实 SSC 的 I 和 PIC 值最高,分别为 3.05
和 0.94,这与田间表型结果相吻合;而成熟果
皮色最低,I 和 PIC 值分别仅为 0.19 和 0.07,
也与田间表型结果相吻合,加工番茄亚群个体
成熟果皮一般为红色或深红色。上述结论说明,
利用 I 和 PIC 可以准确分析加工番茄亚群的群
体遗传多样性及不同性状间所存在的差异。
2.2 基于 SNP 标记的遗传多样性分析
通过对均匀覆盖基因组的 65 个 SNP 分型,58 个(89.2%)位点得到成功分型,其中 46 个(79.3%)
呈现多态性,平均每条染色体上约 3.8 个。利用 46 个多态性位点,对全部 3 026 份材料分型,平均
检出率为 92.95%,其中 SL2.40ch02-15236133(80.50%)、SL2.40ch06-19974591(67.51%)和
SL2.40ch09-44371812(76.83%)等 3 个位点的检出率低于 85%。基于 SNP 分型的遗传多样性分析
结果表明(表 3),在 46 个多态性位点中,包含 41 个常见 SNP(MAF:0.1061 ~ 0.4825)和 5 个稀
有 SNP(SL2.40ch08-25578222、SL2.40ch04-10548824、SL2.40ch10-54578343、SL2.40ch12-37943350
和 SL2.40ch06-19974591)(MAF < 0.01)。稀有 SNP 位点对于遗传多样性的贡献较低,期望杂合度
(He)平均为 0.00678(0.0017 ~ 0.0194)、观测杂合度(Ho)平均为 0.0032(0.0003 ~ 0.0048)、生
物信息含量(PIC)平均为 0.0067(0.0017 ~ 0.0192);而常见 SNP 位点的遗传多样性达到较高水平,
期望杂合度(He)平均为 0.4352(0.1897 ~ 0.4994)、观测杂合度(Ho)平均为 0.1453(0.0113 ~ 0.6957)、
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1304 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
生物信息含量(PIC)平均为 0.3381(0.1717 ~ 0.3747)。
表 3 46 个多态性 SNP 位点的遗传多样性分析
Table 3 Genetic diversity analysis of 46 polymorphic SNP loci
SNP 位点
SNP locus
最小等位基因频率
MAF
期望杂合度
He
观测杂合度
Ho
生物信息含量
PIC
SL2.40ch01-33639728 0.3008 0.4206 0.0372 0.3322
SL2.40ch01-63847972 0.2831 0.4059 0.0294 0.3235
SL2.40ch01-86877729 0.4076 0.4829 0.0441 0.3663
SL2.40ch02-4509739 0.4704 0.4982 0.0321 0.3741
SL2.40ch02-15236133 0.1431 0.2452 0.2845 0.2151
SL2.40ch02-20098248 0.2068 0.3280 0.3797 0.2742
SL2.40ch02-33425235 0.4701 0.4982 0.0365 0.3741
SL2.40ch02-42034536 0.2596 0.3844 0.0375 0.3105
SL2.40ch03-8706284 0.4751 0.4988 0.0598 0.3744
SL2.40ch03-44127667 0.2250 0.3488 0.3770 0.2880
SL2.40ch04-10548824* 0.0019 0.0039 0.0039 0.0038
SL2.40ch04-22343907 0.2504 0.3754 0.4644 0.3049
SL2.40ch04-49255445 0.3638 0.4629 0.0452 0.3558
SL2.40ch05-9823245 0.2808 0.4039 0.0450 0.3223
SL2.40ch05-26056307 0.3479 0.4537 0.6957 0.3508
SL2.40ch05-49979901 0.2445 0.3694 0.0218 0.3012
SL2.40ch06-4107108 0.3458 0.4524 0.0325 0.3501
SL2.40ch06-15074385 0.3529 0.4567 0.6745 0.3524
SL2.40ch06-19974591* 0.0098 0.0194 0.0029 0.0192
SL2.40ch06-25282168 0.3126 0.4297 0.0548 0.3374
SL2.40ch06-45238831 0.1061 0.1897 0.0113 0.1717
SL2.40ch07-11024868 0.4787 0.4991 0.0510 0.3745
SL2.40ch07-19230462 0.3626 0.4622 0.0358 0.3554
SL2.40ch07-32241875 0.3531 0.4569 0.0484 0.3525
SL2.40ch07-38799735 0.3204 0.4355 0.0407 0.3406
SL2.40ch07-54935635 0.4482 0.4946 0.0473 0.3723
SL2.40ch07-57289590 0.3981 0.4792 0.0443 0.3644
SL2.40ch08-25578222* 0.0008 0.0017 0.0003 0.0017
SL2.40ch08-55122516 0.4442 0.4938 0.0368 0.3719
SL2.40ch08-60673054 0.3938 0.4774 0.0379 0.3635
SL2.40ch09-6428848 0.4159 0.4858 0.5302 0.3678
SL2.40ch09-24856081 0.3059 0.4247 0.0465 0.3345
SL2.40ch09-44371812 0.3198 0.4350 0.6120 0.3404
SL2.40ch09-66402596 0.2844 0.4071 0.0673 0.3242
SL2.40ch10-14429676 0.4021 0.4808 0.0345 0.3652
SL2.40ch10-30972593 0.3628 0.4624 0.0443 0.3555
SL2.40ch10-38604877 0.2130 0.3353 0.0267 0.2791
SL2.40ch10-54578343* 0.0020 0.0041 0.0041 0.0041
SL2.40ch10-63833268 0.4684 0.4980 0.0378 0.3740
SL2.40ch11-27311049 0.4015 0.4806 0.0402 0.3651
SL2.40ch11-39267091 0.3812 0.4718 0.0282 0.3605
SL2.40ch11-51957966 0.4825 0.4994 0.0495 0.3747
SL2.40ch12-1338779 0.4261 0.4891 0.0542 0.3695
SL2.40ch12-16959146 0.2653 0.3899 0.0197 0.3139
SL2.40ch12-37943350* 0.0024 0.0048 0.0048 0.0047
SL2.40ch12-61637774 0.3950 0.4779 0.6612 0.3637
注:* 稀有 SNP。
Note:* Rare SNP.
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明.
加工番茄核心种质构建及其遗传背景分析.
园艺学报,2015,42 (7):1299–1312. 1305
2.3 初始核心种质的构建
2.3.1 核心种质最佳样本量预测
为了获得核心种质的最佳样本量,分别利用 M(Mstrat method)和 R(Random)两种方法,对
核心种质最佳样本量进行了预测(图 2)。基于表型数据,当采用 M 法,样本数未达到 40 时,得分
已趋平;而采用 R 法,样本数达到 300 时得分才趋平(图 2,A)。而基于基因型数据,采用 M 法,
在样本数未达到 100 时,得分已趋平;而采用 R 法,样本数达到 300 时得分才趋平(图 2,B)。上
述结果表明,无论是基于表型还是基因型数据,随着样本数量的增加,对应分值(即材料所覆盖的
等位基因数量指数)逐渐增大,达到一定临界值后趋平,而且 M 法趋平所需样本数量较少,说明 M
法捕捉等位基因的效率明显高于 R 法。综合 2 类不同数据及 2 种抽样方法结果,为了尽可能保留等
位基因,以及考虑标记位点偏少,基因组信息量少等因素,最终选取 10%的抽样比例(302 份材料)
用于构建加工番茄的核心种质资源。
图 2 用 R 和 M 两种抽样方法预测核心种质样本量
A:基于表型数据预测;B:基于基因型数据预测。
Fig. 2 Prediction of the optimal CC sample size by Random and Mstrat methods
A:Prediction by phenotypic data;B:Prediction by genotypic data.
2.3.2 初始核心种质构建
分别基于表型和基因型数据,采用 5 种不同方法(Mstrat、Random、REMC、SBS 和 SFS)首
先构建了初始核心种质。基于表型数据的初始核心种质(PCC,based on Phenotype Core Collection)
为 PCC1(Mstrat)、PCC2(Random)、PCC3(REMC)、PCC4(SBS)和 PCC5(SFS),基于基因
型数据的初始核心种质(GCC,based on Genotype Core Collection)为 GCC1(Mstrat)、GCC2(Random)、
GCC3(REMC)、GCC4(SBS)和 GCC5(SFS)。每种初始核心种质均包含 302 份材料。
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1306 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
2.4 初始核心种质的评价与核心种质的确定
2.4.1 表型代表性评价
依据 Hu 等(2000)标准,对初始核心种质的表型代表性进行评价。结果(表 4)表明,基于表
型数据获得的 5 种初始核心种质中,除 PCC2 外其余的表型均值差异百分率(MD%)均大于 20%,
说明其对原始种质的群体结构代表性较差。基于基因型构建的 5 种核心种质中,GCC1 和 GCC2 与
原始种质均不存在显著差异,而 GCC3、GCC4 和 GCC5 均有 30%(6 个)的表型性状与原始种质间
存在显著差异(α = 0.05)。同时,通过方差齐性检验所得结果与表型均值差异百分率检验结果一致,
即 PCC2、GCC1 和 GCC2 的方差差异百分率(VD%)均为 0,而其余 7 种初始核心种质均超过 20%。
另外,对达到表型评价标准的 3 种初始核心种质进行极差符合率比较发现,PCC2、GCC1 和 GCC2
的极差符合率(CR%)分别为 97.7%、99.0%和 96.3%,均达到 80%以上,GCC1 的极差符合率最高;
它们的变异系数变化率(CV%)分别为 96.8%、106.1%和 98.6%,GCC1 的变异系数变化率也最大。
通过对 10 种初始构建的核心种质的表型代表性评价,说明 GCC1 各性状分布较均匀,在去除遗传
冗余的同时保留了更多的变异,保存了原始资源群体较丰富的遗传多样性。
表 4 核心种质与原始种质间性状差异百分率
Table 4 Percentage of the trait differences between the core collections and the initial collection
核心种质 Core collection VD% MD% CR% CV%
PCC1 45 30 99.3 125.4
PCC2 0 0 97.7 96.8
PCC3 65 60 100 142
PCC4 70 70 100 143.6
PCC5 70 70 100 143.5
GCC1 0 0 99 106.1
GCC2 0 0 96.3 98.6
GCC3 30 30 97.6 108
GCC4 30 30 99.4 107.2
GCC5 30 30 99.4 107.4
注:VD%:核心种质与原始种质方差齐性检验存在显著差异的表型性状的百分数;MD%:核心种质与原始种质均值差异检验存在显著
差异的表型性状的百分数;CR%:极差符合率;CV%:变异率。
Note:VD%:Percentage of significant difference(α = 0.05)between core collection and the initial collection for variance of traits;MD%:
Percentage of significant difference(α = 0.05)between core collection and the initial collection for means of traits;CR%:Coincidence rate;CV%:
Variable rate.
2.4.2 基因型代表性评价
在分子水平,对 10 种初始核心种质的基因型代表性评价结果(表 5)表明,无论利用表型还是
基因型数据构建的初始核心种质,等位基因覆盖度(CV)均可达 0.98 以上。同时,除采用 Random
方法获得的 PCC2 和 GCC2 的遗传距离(MR 和 CE)和遗传多样性指数(I 和 HE)与原始种质保持
不变外,其余 8 种初始核心种质均较原始种质有所提升,其中以 GCC3、GCC4 和 GCC5 的提升幅
度最大(MR:8.8%,CE:8.3%;I:1.2%,HE:11.1%),GCC1 次之(MR:6.0%,CE:5.6%;I:
0.8%,HE:6.9%)。还可看出,采用 Mstrat、REMC、SBS 和 SFS 方法,基于基因型构建的 4 种初
始核心种质的遗传距离和遗传多样性不仅均较原始种质有所提升(MR:6.0% ~ 8.8%,CE:5.6% ~
8.3%;I:0.8% ~ 1.2%,HE:6.9% ~ 11.1%),而且也较基于表型性状所构建的 4 种初始核心种质有
明显提升(MR:4.4% ~ 7.1%,CE:4.2% ~ 6.8%;I:0.6% ~ 1.0%,HE:5.6% ~ 9.6%)。即使是 PCC2
和 GCC2,虽然与原始种质的 MR、CE、I 和 HE 均保持不变,但 GCC2 的等位基因覆盖度仍高于 PCC2。
综上所述,基于基因型数据构建的核心种质的基因型代表性均优于基于表型数据构建的核心种质。
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明.
加工番茄核心种质构建及其遗传背景分析.
园艺学报,2015,42 (7):1299–1312. 1307
表 5 核心种质与原始种质分子水平代表性分析
Table 5 Representative evaluation by molecule markers between core collections and initial collection
核心种质 Core collection MR CE I HE CV
原始种质 Initial collection 0.58 0.59 4.39 0.39 1.00
PCC1 0.59 0.60 4.4 0.39 0.99
PCC2 0.58 0.59 4.39 0.39 0.98
PCC3 0.59 0.60 4.40 0.40 0.99
PCC4 0.60 0.60 4.40 0.40 0.99
PCC5 0.60 0.60 4.40 0.40 0.99
GCC1 0.62 0.62 4.42 0.42 1.00
GCC2 0.58 0.59 4.39 0.39 0.99
GCC3 0.63 0.63 4.43 0.43 1.00
GCC4 0.63 0.64 4.44 0.43 1.00
GCC5 0.63 0.64 4.44 0.43 1.00
注:MR:Rogers 修正遗传距离;CE:Cavalli-Sforza 和 EdwardsCE 平均遗传距离;I :香农多样性指数;HE:杂合位点多样性指数;
CV:等位基因覆盖度。
Note:MR:Mean Modified Rogers Distance;CE:Mean Cavalli-Sforza and Edwards Distance;I :Shannons Diversity Index;HE:Heterozygous
Loci Diversity Index;CV:Coverage Measure.
2.4.3 核心种质的确定
对初始核心种质通过表型和基因型评价(表 4、表 5)表明,虽然 7 种初始核心种质(GCC3、
GCC4、GCC5、PCC1、PCC3、PCC4 和 PCC5)均能在基因型水平上去除遗传重复,增大遗传距离
和提高遗传多样性指数,但其表型代表性未能达到标准,故均不能作为加工番茄的核心种质。而
PCC2、GCC1 和 GCC2 均符合表型评价标准,对原始种质具有较好的代表性;而且,采用 Mstrat
方法构建的核心种质 GCC1,在表型评价和分子标记评价中均优于 PCC2 和 GCC2,对原有种质的遗
传变异及结构更具代表性,故最终选用 GCC1 作为最终核心种质。
2.5 不同方法的比较分析
对利用 5 种不同方法构建的初始核心种质对原始种质表型的代表性进行比较(表 4)发现,采
用 Mstrat 方法获得的 GCC1 可代表原始种质的表型变异,而 PCC1 的极差符合率虽可达核心种质表
型评价标准(≥ 80%),但其均值差异百分率未达标(≤ 20%);采用 Random 方法获得的 PCC2
和 GCC2,二者均值差异百分率均为 0 且极差符合率均可达 80%以上,与原始种质的群体结构吻合;
但采用 REMC、SBS 和 SFS 方法时,虽然初始核心种质的极差符合率均可满足标准,但其均值差异
百分率不符合标准,即所构建的核心种质的表型代表性较差。因此,仅从 5 种方法构建的初始种质
对原始种质的表型代表性来看,方法 Random > Mstrat > REMC、SBS、SFS。而从初始核心种质对
原始种质基因型的代表性来看(表 5),采用 Mstrat 方法获得的 GCC1 和 PCC1,其遗传距离和遗传
多样性指数均较原始种质有明显提高(MR:3.8%,CE:3.5%;I:0.5%,HE:4.1%);采用 Random
方法时,PCC2 和 GCC2 的遗传距离和遗传多样性指数均基本维持在原始种质的水平;采用 REMC、
SBS 和 SFS 构建的核心种质较原始种质的提高幅度最大(MR:5.5%,CE:5.0%;I:0.7%,HE:
6.4%)。上述结果说明,仅从 5 种方法构建的初始核心种质对基因型的代表性来看,在增大遗传距
离和提高遗传多样性水平方面表现为 REMC、SBS、SFS > Mstrat > Random。
2.6 原始种质的遗传背景及核心种质在原始种质中的分布
为了明确加工番茄的遗传背景,利用 46 个多态性 SNP 标记对 3 026 份加工番茄的原始种质进
行了群体结构分析。代表群体结构的 ΔK 分析结果(图 3,A)表明,随着 K 值的逐渐变大,仅在
K = 2 时出现唯一峰值,当 K 取其它值时,对应的 ΔK 值均接近于 0,所以 K 的最理想取值为 2,即
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1308 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
原始种质可以分为两大群体(图 3,B),但两大群体间界限不明显。第一大群体(红色)共计 1 874
份材料,包括广泛应用于开展 AB-QTL 分析的 E6203、中国农业科学院蔬菜花卉研究所早期育成的
红杂系列亲本、美国北卡罗纳州立大学育成的 NC25P、NC1CELBR、NC2CELBR、NCEBR-7、
NCENR-8 以及来自美国太阳和亨氏等公司的后代分离材料;第二大群体(绿色)共计 1 152 份材料,
包括广泛应用于不同类型研究的 UC82 和 M82,新疆的主栽品种 87-5,来自亚洲蔬菜研究与发展中
心(AVRDC)的 PT6475B、PT4679B、PT4719A、PT4719B、PT4716A、PT4664A、CLN2123A、
CLN2026D、CLN3125L、CLN3125O、CLN3078A、CLN3078C 和 CLN3078G 以及美国太阳和亨氏
等公司的后代材料。
另外,基于 SNP 数据,利用 PCA 对核心种质的代表性也进行了分析(图 4),结果表明核心种
质 GCC1 基本均匀分布在原始种质资源材料中,可有效覆盖全部资源材料,说明所构建的核心种质
具有较好的代表性。
图 3 原始种质的 Structure 分析
A:K = 2 时获得唯一峰值,即原始种质可分为两个群体;B:红色代表群体 1,绿色代表群体 2。
Fig. 3 Structure analysis of the initial collection
A:The only peak appears when K = 2,indicated the initial collection can be divided into two clusters;B:The red is 1 and the green is 2.
图 4 核心种质 GCC1 在 PCA 分析中的确认
Fig. 4 The identification of GCC1 in PCA analysis
3 讨论
3.1 加工番茄亚群的遗传多样性
本研究中所用的 3 026 份加工番茄材料来自世界不同地区,既包括广为人知的代表性加工番茄
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明.
加工番茄核心种质构建及其遗传背景分析.
园艺学报,2015,42 (7):1299–1312. 1309
老材料,如 Marglobe(1957 年育成)、UC82(1977 年育成)、M82(1994 年育成)、87-5(1995 年
育成)(姜涛和张革,1996)、E6203(2000 年育成)等,也包括从国内外育种公司,如过去的皮托、
太阳、坎贝尔及孟山都、亨氏、纽耐姆、利马格兰等公司育成的 Hypeel849、AB2、H9780、Sun6366、
HM7883 等现代品种分离获得的后代资源。从 20 个田间调查的表型性状来看,全部资源材料均为有
限生长类型,较老品种均有果节,株形、叶形等变异较为丰富(I:1.3466;PIC:0.6192),而且随
着时间的推移,果实硬度、可溶性固形物含量及产量等均发生了明显变化。这与过去 50 年间,美国
加州加工番茄的产量增加了 1 倍,但并非单个遗传因子贡献所致(Barrios-Masias & Jackson,2014)
相一致。由于材料较多,虽然本文中仅用每条染色体约 3.8 个 SNP 对其遗传多样性进行了分子水平
的分析,但发现群体观测杂合度(Ho:0.1453)显著低于期望杂合度(He:0.4352),说明材料杂合
度很低,准确反映了全部资源均为连续多年自交的后代材料这一遗传背景。同时,常见 SNP 位点也
表现出较高的遗传多样性(He:0.4352,Ho:0.1453,PIC:0.3381),明显高于 Sim 等(2012)对
141 份加工番茄亚群分析的多样性(He:0.16,PIC:0.13)。另外,还发现亚群的表型遗传多样性指
数(PIC:0.6192)要显著高于其基因型多样性指数(PIC:0.3381),即产生前人所发现的现象,作
为自花授粉的番茄作物,表型遗传多样性明显高于基因型遗传多样性(Causse et al.,2013),这与
Zhang 等(2012)构建芝麻核心种质所得结论也一致。其原因一方面可能是由于研究中分子标记不
足,另一方面也可能是在长期的品种收集过程中,因缺乏对其遗传背景的了解,过多注重其表型多
样性所致。
3.2 核心种质的构建
通过数据模拟模型对 3 026 份原始种质最佳样本量预测,无论基于表型性状还是基因型数据,
可以明显发现采用 M 方法预测的最佳样本量要显著小于 R 方法(M 法:< 100;R 法:~ 300),进
一步证明前人所得结论,即 M 方法捕获等位基因的效率优于 R 方法(Lü et al.,2012)。而且当采取
M 法时,利用表型数据预测的最佳样本量(< 40)要明显低于基因型(~ 100)。这与上述所得结论,
加工番茄表型遗传指数显著高于其基因型遗传指数相一致,M 法捕获较少的样本即可具有广泛的表
型代表性。而对于随机选择的 R 方法,两种数据均要求较大的样本量,才能具有较好的代表性。无
论采用 M 或者 R 方法,最大样本量均为 300,即本研究样本量的 10%左右,这与前人研究其他作物
所得结论(Ortiz et al.,1998;Zhang et al.,2000;Upadhyaya et al.,2003;Mahalakshmi et al.,2007;
Gross et al.,2013;Leroy et al.,2014)一致。Corrado 等(2013)对意大利的 75 个地方番茄品种和
25 个现代栽培种,利用 152 个 SNP 分析发现,最佳抽样比例为 15% ~ 25%。这一结果从另一个方
面说明初始样本较少时,需要一定的抽样比例才能覆盖群体的多样性。另外,地方品种的遗传多样
性水平(He:0.19,PIC:0.14)较加工番茄亚群(He:0.16,PIC:0.13)高也可能是其中原因之一
(Sim et al.,2012)。本研究中原始群体较大,但表型性状仅为一年调查结果,多个性状受 QTL 控
制,而且用于遗传背景分析的 SNP 位点也较少,为了尽可能保留等位基因,特别是稀有等位基因,
最终采用 10%的样本(Zhang et al.,2011)。
进一步对采用 5 种不同方法和 2 种不同类型数据获得的 10%样本量的初始核心群体代表性评价
发现,除 Random 方法外,基于表型构建的核心种质(PCC)的表型变异代表性(CR%和 CV%)较
好,说明充分体现了表型的遗传多样性;而基于基因型构建的核心种质(GCC)的群体结构代表性
(VD%和 MD%)较好,说明准确反映了基因组水平存在的差异。还可以看出,虽然本研究覆盖基
因组的 SNP 位点较少,但基于基因型构建的核心种质的代表性均不同程度优于根据表型性状构建的
核心种质,说明基于基因型数据进行核心种质构建更为准确有效(Leroy et al.,2014)。这主要是因
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1310 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
为作物多数表型性状由 QTL 调控,不仅受环境影响,且当存在多个等位基因的位点时仅依据分级不
能准确反映不同的位点,而基因型则可以准确反映每个等位基因位点,这也进一步又说明了利用基
因型数据构建的核心种质具有更好地代表性。
3.3 不同方法的比较分析
本试验中利用 5 种不同方法构建初始核心种质,所得结论基本与前人研究结果相同,即 5 种方
法各有其优势和劣势,应根据核心种质构建目标的不同,选用适合的方法(Odong et al.,2013)。其
中 Random 方法构建的核心种质虽然均能有效保留原始种质的遗传结构(Hu et al.,2000),但其表
型和基因型的等位基因代表性却表现较差;REMC、SBS 和 SFS 方法,虽然在核心种质构建中可 100%
覆盖等位基因(Liu & Yu,2005;de Beukelaer et al.,2012),但其群体结构代表性却较差。采用 Mstrat
方法构建遗传背景狭窄的加工番茄亚群的核心种质 GCC1,兼顾了群体结构和等位基因覆盖的程度
(Gross et al.,2013)。利用该方法,在水稻、咖啡等作物上也获得了理想效果(Zhang et al.,201l;
Leroy et al.,2014)。
3.4 加工番茄的遗传背景
Sim 等(2011)利用 300 个 SSR、InDel 和 SNP 标记,将 28 份加工番茄分为 2 ~ 4 个群体,后
又利用 7 310 个 SNP,将 141 份加工番茄材料分为 2 个群(Sim et al.,2012)。本研究利用 46 个多
态性 SNP 标记,将 3 026 份材料也分为 2 个大群。其中一个群体的代表性材料包括 E6203、Marglobe
以及来自 AVRDC 等公共资源库的材料,另外一个群体包括代表性的 M82、UC82、新疆 87-5 以及
来自 NC-USA 等公共资源库的材料。同时,Sim 等(2012)也将 E6203 和 M82 分别分在 2 个不同
的群体,本研究群体分类结果与之一致。另外,从来自 AVRDC 的 CLN3125L、CLN3125O、CLN3078A、
CLN3078C、CLN3078G 等系谱也可以看出,这些材料来源相同并被划分到同一群体。上述结果说
明,虽然本研究每条染色体平均只覆盖 3.8 个 SNP,但已将 3 026 份加工番茄亚群体较为准确地区
分为不同类群。另外,还可以看出,来自国外不同育种公司的后代资源材料,较为均匀地分布在 2
个大群,说明这些育种公司资源较为丰富。目前,番茄基因组测序业已完成,而且相关研究积累了
大量 EST、内含子序列、核苷酸芯片、转录组测序等数据,结合目前开展的大量资源重测序工作,
将会挖掘出海量 SNP,也将为番茄遗传资源的多样性及育种提供更好的技术支撑。
References
Barrios-Masias F H,Jackson L E. 2014. California processing tomatoes:Morphological,physiological and phenological traits associated with crop
improvement during the last 80 years. European Journal of Agronomy,53:45–55.
Bauchet G,Causse M. 2012. Genetic diversity in tomato(Solanum lycopersicum)and its wild relatives. INTECH Open Access Publisher.
Botstein D,White R L,Skolnick M,Davis R W. 1980. Construction of a genetic linkage map in man using restriction fragment length
polymorphisms. American Journal of Human Genetics,32 (3):314.
Causse M,Desplat N,Pascual L,Le Paslier M C,Sauvage C,Bauchet G,Bérard A,Bounon R,Tchoumakov M,Brunel D,Bouchet J P. 2013.
Whole genome resequencing in tomato reveals variation associated with introgression and breeding events. BMC Genomics,14 (1):791.
Corrado G,Piffanelli P,Caramante M,Coppola M,Rao R. 2013. SNP genotyping reveals genetic diversity between cultivated landraces and
contemporary varieties of tomato. BMC Genomics,14 (1):835.
de Beukelaer H,Smýkal P,Davenport G F,Fack V. 2012. Core hunter II:Fast core subset selection based on multiple genetic diversity measures
using Mixed Replica search. BMC Bioinformatics,13 (1):312.
Evanno G,Regnaut S,Goudet J. 2005. Detecting the number of clusters of individuals using the software STRUCTURE:A simulation study.
邓学斌,刘 磊,闫 喆,李 涛,刘希艳,冯晶晶,池海娟,郑 峥,李君明.
加工番茄核心种质构建及其遗传背景分析.
园艺学报,2015,42 (7):1299–1312. 1311
Molecular Ecology,14 (8):2611–2620.
Frankel O H. 1984. Genetic perspectives of germplasm conservation // Arber W,Llimensee K,Peacock W,Starlinger P. Genetic Manipulation:
Impact on Man and Society. Cambridge,UK:Cambridge University Press:161–170.
Fulton T M,Chunwongse J,Tanksley S D. 1995. Microprep protocol for extraction of DNA from tomato and other herbaceous plants. Plant
Molecular Biology Reporter,13 (3):207–209.
Gabriel S,Ziaugra L,Tabbaa D. 2009. SNP genotyping using the sequenom MassARRAY iPLEX platform. Current Protocols in Human Genetics,
60:2.12.1–2.12.18.
Gepts P. 2006. Plant genetic resources conservation and utilization:The accomplishments and future of a societal insurance policy. Crop Sci,46:
2278–2292.
Gouesnard B,Bataillon T M,Decoux G,Rozale C,Schoen D J,David J L. 2001. MSTRAT:An algorithm for building germ plasm core collections
by maximizing allelic or phenotypic richness. Journal of Heredity,92 (1):93–94.
Green S B,Salkind N J. 2010. Using SPSS for Windows and Macintosh:Analyzing and understanding data. Prentice Hall Press.
Gross B L,Volk G M,Richards C M,Reeves P A,Henk A D,Forsline P L,McFadden A S,Fazio G,Chao C T. 2013. Diversity captured in the
USDA-ARS national plant germplasm system apple core collection. Journal of the American Society for Horticultural Science,138 (5):375–
381.
Hamilton J P,Sim S C,Stoffel K,Deynze V,Buell,Francis D. 2012. Single nucleotide polymorphism discovery in cultivated tomato via sequencing
by synthesis. The Plant Genome,5 (1):17–29.
Hamon S,Dussert S,Deub M,Hamon P. 1998. Effects of quantitative and qualitative principal component score strategies. Genet Sel Evol,30 (Suppl.
1):237–258.
Hu J,Zhu J,Xu H M. 2000. Methods of constructing core collections by stepwise clustering with three sampling strategies based on the genotypic
values of crops. Theoretical and Applied Genetics,101 (1–2):264–268.
Igartua E,Gracia M P,Lasa J M,Medina B,Molina-Cano J L,Montoya J L,Romagosa I. 1998. The Spanish barley core collection. Genetic
Resources and Crop Evolution,45 (5):475–481.
Jenkins J A. 1948.The origin of the cultivated tomato. Economic Botany,2 (4):379–392.
Jiang Tao,Zhang Ge. 1996. New accession of processing tomato“Liger 87-5”. Vegetable,(5):15. (in Chinese)
姜 涛,张 革. 1996. 加工番茄新品种“里格尔 87-5”. 蔬菜,(5):15.
Leroy T,de Bellis F,Legnate H,Musoli P,Kalonji A,Loor Solórzano R G,Cubry P. 2014. Developing core collections to optimize the management
and the exploitation of diversity of the coffee Coffea canephora. Genetica,142 (3):185–199.
Li Xin-lei,Li Ji-yuan,Fan Zheng-qi. 2014. Advances in core collection of plant germplasm resources. Journal of Food Safety & Quality,5 (11):
3733–3738. (in Chinese)
李辛雷,李纪元,范正琪. 2014. 植物遗传资源核心种质研究进展. 植物资源学报,5 (11):3733–3738.
Lin T,Zhu G,Zhang J,Xu X,Yu Q,Zheng Z,Zhang Z,Lun Y,Li S,Wang X,Huang Z,Li J,Zhang C,Wang T,Zhang Y,Wang A,
Zhang Y,Lin K,Li C,Xiong G,Xue Y,Mazzucato A,Causse M,Fei Z,Giovannoni J J,Chetelat R T,Zamir D,Städler T,Li J,
Ye Z,Du Y,Huang S. 2014. Genomic analyses provide insights into the history of tomato breeding. Nature Genetics,46 (11):1220–1226.
Liu H,Yu L. 2005. Toward integrating feature selection algorithms for classification and clustering. IEEE Transactions on Knowledge & Data
Engineering,17 (4):491–502.
Liu K,Muse S V. 2005. PowerMarker:An integrated analysis environment for genetic marker analysis. Bioinformatics,21 (9):2128–2129.
Lü J,Qi J,Shi Q,Shen D,Zhang S,Shao G,Li H,Sun Z,Weng Y,Shang Y,Gu X,Li X,Zhu X,Zhang J,van Treuren R,van Dooijeweert
W,Zhang Z,Huang S. 2012. Genetic diversity and population structure of cucumber(Cucumis sativus L.). PloS ONE,7 (10):e46919.
Mahalakshmi V,Ng Q,Atalobhor J,Ogunsola D,Lawson M,Ortiz R. 2007. Development of a West African yam Dioscorea spp. core collection.
Genetic Resources and Crop Evolution,54 (8):1817–1825.
Mazzucato A,Ficcadenti N,Caioni M,Mosconi P,Piccinini E,Sanampudi V R R,Sestili S,Ferrari V. 2010. Genetic diversity and distinctiveness
in tomato(Solanum lycopersicum L.)landraces:The Italian case study of‘A pera Abruzzese’. Scientia Horticulturae,125 (1):55–62.
Deng Xue-bin,Liu Lei,Yan Zhe,Li Tao,Liu Xi-yan,Feng Jing-jing,Chi Hai-juan,Zheng Zheng,Li Jun-ming.
Development of a core collection of processing tomato germplasms and analysis of genetic background.
1312 Acta Horticulturae Sinica,2015,42 (7):1299–1312.
Nesbitt T C,Tanksley S D. 2002. Comparative sequencing in the genus Lycopersicon:Implications for the evolution of fruit size in the domestication
of cultivated tomatoes . Genetics,162 (1):365–379.
Odong T L,Jansen J,van Eeuwijk F A,van Hintum T J. 2013. Quality of core collections for effective utilisation of genetic resources review,
discussion and interpretation. Theoretical and Applied Genetics,126 (2):289–305.
Oliveira E J,Ferreira C F,Santos V S,Oliveira G A. 2013. Development of a cassava core collection based on single nucleotide polymorphism
markers. Genetics and Molecular Research,13 (3):6472–6485.
Ortiz R,Ruiz-Tapia E N,Mujica-Sanchez A. 1998. Sampling strategy for a core collection of Peruvian quinoa germplasm. Theoretical and Applied
Genetics,96 (3–4):475–483.
Park Y H,West M A L,St Clair D A. 2004. Evaluation of AFLPs for germplasm fingerprinting and assessment of genetic diversity in cultivars of
tomato(Lycopersicon esculentum L.). Genome,47 (3):510–518.
Rao E S,Kadirvel P,Symonds R C,Geethanjali S,Ebert A W. 2012. Using SSR markers to map genetic diversity and population structure of
Solanum pimpinellifolium for development of a core collection. Plant Genetic Resources,10 (1):38–48.
Schroeder S. 2012. New tomato variety NUN 00175 TOP:U.S. Patent Application 13/684,189.
Shirasawa K,Fukuoka H,Matsunaga H,Kobayashi Y,Kobayashi I,Hirakawa H,Isobe S,Tabata S. 2013. Genome-wide association studies using
single nucleotide polymorphism markers developed by re-sequencing of the genomes of cultivated tomato. DNA Research,20 (6):593–603.
Sim S C,Robbins M D,Chilcott C,Zhu T,Francis D M. 2009. Oligonucleotide array discovery of polymorphisms in cultivated tomato(Solanum
lycopersicum L.)reveals patterns of SNP variation associated with breeding. BMC Genomics,10:466–476.
Sim S C,Robbins M D,Van Deynze A,Michel A P,Francis D M. 2011. Population structure and genetic differentiation associated with breeding
history and selection in tomato(Solanum lycopersicum L.). Heredity,106 (6):927–935.
Sim S C,Van Deynze A,Stoffel K,Douches D S,Zarka D,Ganal M W,Chetelat R T,Hutton S F,Scott J W,Gardner R G,Panthee D R,
Mutschler M,Myers J R,Francis D M. 2012. High-density SNP genotyping of tomato(Solanum lycopersicum L.)reveals patterns of genetic
variation due to breeding. PLoS One,7 (9):e45520.
Tanksley S D,Nelson J C. 1996. Advanced backcross QTL analysis:A method for the simultaneous discovery and transfer of valuable QTLs from
unadapted germplasm into elite breeding lines. Theoretical and Applied Genetics,92 (2):191–203.
Thachuk C,Crossa J,Franco J,Dreisigacker S,Warburton M,Davenport G F. 2009. Core Hunter:An algorithm for sampling genetic resources
based on multiple genetic measures. BMC Bioinformatics,10 (1):243.
Upadhyaya H D,Ortiz R,Bramel P,Sube S. 2003. Development of a groundnut core collection using taxonomical,geographical and morphological
descriptors. Genetic Resources and Crop Evolution,50 (2):139–148.
van Berloo R. 2008. GGT 2.0:Versatile software for visualization and analysis of genetic data. Journal of Heredity,99 (2):232–236.
van Hintum T J L. 2000. Core collections of plant genetic resources . Bioversity International.
Weir B S. 1996. Genetic data analysis II,Sunderland,MA:Sinauer Associates.
Weir B S,Cockerham C C. 1984. Estimating F-statistics for the analysis of population structure. Evolution,1358–1370.
Yang J,Lee S H,Goddard M E,Visscher P M. 2011. GCTA:A tool for genome-wide complex trait analysis. The American Journal of Human
Genetics,88 (1):76–82.
Zhang H,Zhang D,Wang M,Sun J,Qi Y,Li J,Wei X,Han L,Qiu Z,Tang S,Li Z. 2011. A core collection and mini core collection of Oryza
sativa L. in China. Theoretical and Applied Genetics,122 (1):49–61.
Zhang Xiurong,Zhao Yingzhong,Cheng Yong,Feng Xiangyun,Guo Qingyuan,Zhou Mingde,Hodgkin T. 2000. Establishment of sesame
germplasm core collection in China. Genetic Resources and Crop Evolution,47 (3):273–279.
Zhang Yong-bing,Yi Hong-ping,Ma Xin-li,Li Mei-hua,Wu Ming-zhu. 2013. Construction of core collection of melon landraces in Xinjiang.
Journal of Plant Genetic Resources,14 (1):53–58. (in Chinese)
张永兵,伊鸿平,马新力,李寐华,吴明珠. 2013. 新疆甜瓜地方品种资源核心种质构建. 植物遗传资源学报,14 (1):53–58.
Zhang Y,Zhang X,Che Z,Wang L,Wei W,Li D. 2012. Genetic diversity assessment of sesame core collection in China by phenotype and molecular
markers and extraction of a mini-core collection. BMC Genetics,13 (1):102.