Genome-wide Association Study of Agronomic and Yield Traits in a Worldwide Collection of Peanut (<em>Arachis hypogaea</em>) Germplasm-文献传递-植物通论文库

作者：严玫, 张新友, 韩锁义, 黄冰艳, 董文召, 刘华, 孙子淇, 张忠信, 汤丰收

摘要：通过关联分析法发掘与花生(Arachis hypogaea)产量性状显著关联、同时又在花生基因组上随机分布的SSR位点及优异等位变异, 可了解产量相关基因区域的分布特点, 有助于利用分子标记辅助选择方法选育高产花生新品种。选用64个SSR标记, 采用MLM (Q+K)方法对166份花生资源进行全基因组关联分析。结果表明, 通过聚类分析和结构划分, 供试群体受其综合性状遗传特点和来源地域的影响可被划分成7个亚群, 聚类结果与群体结构基本一致, 同时群体特点与材料来源地的生态划分符合同类聚集的规律。通过对6个产量相关性状的3年数值的关联分析, 分别发掘出SSR位点有20个、33个和26个, 2年以上重复检出的SSR位点有13个(P<0.05), 各SSR位点的表型变异解释率范围为0.011-0.348 1, 平均为0.067 3; 共检出590个等位变异, 平均每个标记位点12.29个, 表型变异解释率值最高的是与单株果数呈显著关联的位点TC1A02 (P<0.001), 含21个等位变异; 与产量构成主要因子紧密关联的位点中, 百果重的TC1A02-C470 (+41.588 5) 、TC1A02-C560 (+40.926 1)和pPGPseq2E6-B473 (+63.953 4), 单株果数的TC1A02-C500 (+7.374 4), 单株饱果数的GM1843-E157 (+4.316 6), 可用于产量性状的分子辅助育种。

Abstract:Association analysis of yield-related traits and simple sequence repeat (SSR) loci distributed randomly in the peanut genome could contribute to marker-assisted selection breeding by the detection of elite alleles and the interaction of the gene region associated with high yield traits. We performed genome-wide association analysis with the mixed linear model (Q+K) by scanning 166 peanut germplasm with selected 64 SSR markers. In all, 166 peanut germplasm could be assigned to 7 subpopulations by population structure and cluster analysis, with results from both methods similar. The morphological characteristics and geographic origin of germplasm were consistent within model-based clusters. From 2011 to 2013, the number of detected SSR markers significantly associated with 6 yield-related traits was 20, 33 and 26 respectively; 13 markers (P<0.05) were detected repeatedly over 2 years. The mean rate of phenotypic explanation of SSR loci associated with traits was 0.067 3 (range 0.011-0.348 1). In total, 590 alleles were detected, with a mean of 12.29 alleles per SSR loci. Among all the trait-related markers, TC1A02 (P<0.001) had the highest rate of phenotypic explanation and contained 21 alleles, which was associated with the trait of pod number per plant. Among the SSR loci associated with the main effective factors of yield, the elite alleles with a high positive effect that could be used in marker-assisted selection of yield improvement were TC1A02-C560 (+40.926 1), TC1A02-C470 (+41.588 5), pPGPseq2E6-B473 (+63.953 4) associated with 100-pod weight, TC1A02-C500 (+7.374 4) associated with pod number per plant and GM1843-E157 (+4.316 6) associated with full pod number per plant.

全文：植物学报 Chinese Bulletin of Botany 2015, 50 (4): 460–472, www.chinbullbotany.com
doi: 10.11983/CBB14144
——————————————————
收稿日期: 2014-08-06; 接受日期: 2015-01-27
基金项目: 国家重点基础研究发展计划(No.2011CB109304)和国家花生产业技术体系建设项目(No.CARS-14)
* 通讯作者。E-mail: haasz@sohu.com
花生重要农艺及产量性状的全基因组关联分析
严玫, 张新友*, 韩锁义, 黄冰艳, 董文召, 刘华, 孙子淇, 张忠信, 汤丰收
河南省农业科学院经济作物研究所/花生遗传改良国家地方联合工程实验室/农业部黄淮海油料作物重点实验室/
河南省油料作物遗传改良重点实验室, 郑州 450002
摘要通过关联分析法发掘与花生(Arachis hypogaea)产量性状显著关联、同时又在花生基因组上随机分布的SSR位点及
优异等位变异, 可了解产量相关基因区域的分布特点, 有助于利用分子标记辅助选择方法选育高产花生新品种。选用64个
SSR标记, 采用MLM (Q+K)方法对166份花生资源进行全基因组关联分析。结果表明, 通过聚类分析和结构划分, 供试群体
受其综合性状遗传特点和来源地域的影响可被划分成7个亚群, 聚类结果与群体结构基本一致, 同时群体特点与材料来源
地的生态划分符合同类聚集的规律。通过对6个产量相关性状的3年数值的关联分析, 分别发掘出SSR位点有20个、33个和
26个, 2年以上重复检出的SSR位点有13个(P<0.05), 各SSR位点的表型变异解释率范围为0.011–0.348 1, 平均为0.067 3;
共检出590个等位变异, 平均每个标记位点12.29个, 表型变异解释率值最高的是与单株果数呈显著关联的位点TC1A02
(P<0.001), 含21个等位变异 ; 与产量构成主要因子紧密关联的位点中 , 百果重的TC1A02-C470 (+41.588 5) 、
TC1A02-C560 (+40.926 1)和pPGPseq2E6-B473 (+63.953 4), 单株果数的TC1A02-C500 (+7.374 4), 单株饱果数的
GM1843-E157 (+4.316 6), 可用于产量性状的分子辅助育种。
关键词花生, 产量性状, SSR, 全基因组关联分析
严玫, 张新友, 韩锁义, 黄冰艳, 董文召, 刘华, 孙子淇, 张忠信, 汤丰收 (2015). 花生重要农艺及产量性状的全基因组关
联分析. 植物学报 50, 460–472.
花生(Arachis hypogaea)是世界上重要的油料作
物之一, 目前全球花生种植面积高达2.177×107 hm2,
年总产量3.8×107 t (FAO, 2011)。我国花生种植面积
占世界种植面积的20%, 花生产量占全世界总产量的
40%以上 , 2002年以来总产量一直位居世界首位 ,
2012年达到1.68×107 t (FAO, 2012)。我国是花生的
主要生产、消费国及出口国(吴学君, 2010)。研究产
量性状对稳步提高花生产量, 保障我国油料安全供给
及农民增收具有重要意义。
传统的遗传学研究认为作物产量相关性状为数
量性状, 由多个基因控制, 表现为连续变异, 数量性
状易受环境影响而表现不稳定(盖钧镒等, 2003)。花
生的主要农艺和产量性状多为数量性状, 受微效多基
因控制, 其主要的遗传学研究方法还是以经典的遗传
模型分析和QTL作图为主。随着基因组学的发展和分
子标记技术在植物遗传育种领域的广泛应用, 在提出
分子设计育种的大背景下(万建民, 2006; 王建康等,
2011), 利用覆盖全基因组的分子标记与合适的分离
群体进行连锁分析和QTL定位以及基于连锁不平衡
的关联分析方法成为解析植物数量性状遗传的两类
主要方法。
关联分析是一种基于连锁不平衡(LD)方法检测
自然群体中基因位点及其等位变异, 并将等位基因变
异与目标性状联系起来分析其基因作用效应的方法
(Mackay and Powell, 2007), 早期广泛用于人类遗传
学研究(Templeton, 1995), 直到2001年才首次用于
植物遗传研究(Thornsberry et al., 2001)。目前, 已在
拟南芥 (Arabidopsis thaliana) (Nordborg et al.,
2005; Zhao et al., 2007)、水稻(Oryza sativa) (Jin et
al., 2010)、玉米(Zea mays) (Yang et al., 2010)和苜
蓿(alfalfa) (Li et al., 2012) 等作物中得到应用。
Belamkar等(2011)首次仅利用32个SSR初步剖析了
花生栽培种的structure结构和LD水平。黄莉等(2012)
采用类似的分析策略对近150份世界范围内花生微核
·研究报告·
严玫等: 花生重要农艺及产量性状的全基因组关联分析 461

心种质进行了关联分析。与连锁分析相比, 建立在自
然群体基础上的关联分析不需要构建作图群体, 具有
定位精度高、广度大和多位点的优点 (杨小红等 ,
2007; 谭贤杰等, 2011)。在关联作图中, 先选择一些
大面积推广品种及其骨干亲本进行低分辨率的全基
因组扫描, 发现一系列重要等位变异和一些重要的基
因组区段, 之后确定候选基因区段并利用地方品种和
野生种质进行高分辨率的LD精细作图以发掘候选基
因(Nordborg et al., 2002)。这表明关联作图不但能在
分子辅助育种中为品种的分子设计组合的选配及后
代的分子标记选择提供重要的理论依据, 而且也是基
因挖掘的有效方法。
本研究以166份花生种质为供试材料, 选择64个
在花生栽培种遗传连锁群上位点分布均匀的SSR标
记用于材料的基因型鉴定, 在分析连锁不平衡、供试
群体结构及亲缘关系的基础上, 使用MLM (Q+K)关
联分析方法检测出一系列与产量性状显著关联的
SSR位点和等位变异, 将产量性状的研究建立在育
成品种家族内优异位点的基础上。
1 材料与方法
1.1 实验材料
供试材料为166份花生(Arachis hypogaea L.), 包括
中国主要花生产区15个省份的136份资源, 其中124
份为各省育成的花生优异品种及骨干亲本, 其余的
12份是传统育种中被选作骨干亲本的经典农家品种
(禹山林, 2008); 另外30份为外国微核心种质。
供试材料于2011–2013年连续3年在位于原阳县
境内的河南现代农业研究开发基地种植。田间实验为
完全随机设计, 单行区, 2次重复, 行长3 m, 行距
0.4 m, 株距15 cm, 单粒点播。田间管理采用常规栽
培管理(张新友等, 2012)。
1.2 方法
1.2.1 性状调查与统计分析
每个花生品种在收获前一周随机选取5株, 调查主茎
高、侧枝长、总分枝数、结果枝数等性状。收获、干
燥后, 调查单株结果数、单株饱果数、单株生产力、
百果重、百仁重和出仁率等性状。2011–2013年的性
状统计标准均参照国家花生品种区域试验标准进行
(严玫, 2012)。调查数据采用SPSS18.0软件进行初步
分析。

1.2.2 SSR全基因组扫描与带型统计
采用CTAB法提取叶片的DNA (Porebski et al.,
1997)。利用NanoDrop 2000 (thermo scientific)检测
DNA的质量及其相应的浓度, 最后将DNA原液稀释
至工作液浓度20 ng·μL–1用于PCR扩增。
根据多个遗传连锁群构建的花生栽培种一致性
遗传连锁图谱上SSR标记的分布情况(Zhang, 2011),
选用随机均匀分布且多态性丰富的64个SSR标记用
于花生全基因扫描。SSR扩增程序及电泳、显色等实
验流程均参照Hong等(2008)的实验方法进行。将各
SSR扩增的每条带视为一个等位变异, 参照TaKaRa
公司的Marker DL 2000, 详细记录每条带的分子量,
依据SSR重复单元的大小对条带进行人工矫正, 确
定等位变异的数目和大小, 最终形成等位变异矩阵
(文自翔等, 2008; 高运来等, 2009)。

1.2.3 SSR遗传多样性分析
利用64个SSR标记的分子数据, 依据以下公式进行
Nei’s 基因型多样性的多态信息含量 (PIC) 计算
( Anderson et al., 1993)。

其中, Pij表示第i位点上第j个等位变异的频率, 标记i
的带型数可从1–n。PIC值的范围则从1–0, 0表示无多
态性, 1表示多态性很高。
运用Powermarker 3.25软件, 进行各SSR标记
的PIC分析(Liu and Muse, 2005), 计算各SSR位点
的基因多样性。基于等位基因频率(allele frequency)
采用Nei’s 1983遗传距离的邻接法(Neighbor-joining)
进行聚类分析。聚类图用FigTree1.3绘制。

1.2.4 群体结构(Q矩阵)分析
群体结构评估采用Structure 2.3.1软件进行基于数学
模型的类群划分(Pritchard et al., 2000), 将群体中各
材料划分至对应的亚群。首先设定亚群数K值范围为
2–20, 进行5次迭代运算, 将每次运行的burin period
和MCMC burin period重复数分别设为10 000和
1 000 000, 模型设定时将亲缘关系设为混合, 等位
462 植物学报 50(4) 2015

基因频率设为相关。依据最大似然值原则(Evanno et
al., 2005), 根据运行结果得到的LnP(D)值选择适当
的亚群数K值, 以及各个材料在各亚群的遗传成分系
数(Q)所构成该群体的遗传结构矩阵。

1.2.5 产量性状-SSR标记的关联分析及等位变异分析
使用Tassel 2.1软件的MLM (mixed linear model)程
序, 采用Q+K模型对产量性状进行关联分析(Yu et
al., 2006; Bradbury et al., 2007)。按照Breseghello
和Sorrells (2006)提出的方法确定无效等位变异, 用
以判断其它等位变异的表型效应及等位变异的平均
效应。
2 结果与讨论
2.1 SSR分子标记的遗传多样性分析
在选用的64个SSR标记中有42个标记均匀分布在本
团队以郑8903×豫花4号为基础构建的一致遗传连锁
图(consensus mapping)中的16个连锁群上, 其余的
标记均匀分布在已构建的其它群体的遗传连锁群上
(表1)。通过SSR标记对166份种质材料DNA进行PCR
扩增和参数分析, 共检测到744个等位变异, 平均每
个标记有11.6个等位变异, 变化范围为3–28个。等位
变异最多的标记是TC6E01, 位于第14个连锁群上。
多态性信息量(PIC)变化范围为0.338–0.941, 平均为
0.748, PIC最大的SSR标记仍为TC6E01。SSR在供
试群体中表现出的基因多样性变化范围为0.360–
0.944 (平均0.777), 表明所选的位点能较好地覆盖整
个基因组且多态性丰富, 适用于花生全基因组的关联
分析。
2.2 群体结构数据与聚类分析
根据64个SSR扩增的供试群体基因型数据 , 采用
Bayesian模型和遗传距离聚类方法分析供试群体的
遗传结构 (Falush et al., 2003; Kraakman et al.,
2004)。通过Structure软件95次(K=2–20, 重复5次)
运行, 依据最大似然值原则, 当样本的等位变异频率
特征类型数K=7时服从Hardy-Weinberg平衡, 此时
其模型的后验概率最大[lnP(D)=–29 946] (图1), 由
此判断供试种群的最适亚群数为7。
如图2所示, 根据确定的亚群数目和群体结构,
166份花生种质被划分为7大亚群: 其中136份国内品
种被划分至I–V亚群, 30份国外品种被划分至VI和VII
两大亚群。
利用PowerMaker 3.25软件并基于Nei’s 1983无
偏遗传距离法, 计算类群间的遗传距离, 以邻接法构
建系统发育树, 对166份供试材料进行聚类分析。然
后基于色系分类将构建的系统发育树与群体结构示
意图进行比对分析。如图3所示, 国内的136份种质根
据遗传距离被划分为3部分——分别对应群体结构中
的亚群I和V、亚群II、亚群III和IV; 其中亚群I和V被聚
在同一亚类, 且与亚群II遗传距离较远, 亚群III和IV
被聚在同一亚类, 遗传距离很近; 国外的30份种质被
划分为居于系统发育树两端的两个类群, 分别对应群
体结构中的亚群VI和亚群VII, 遗传距离较远, 另有8
份种质与国内材料亲缘关系较近, 被划分在亚群IV。
所有材料基本被划分为两大类, 分别对应花生栽培种
植物学分类的疏枝亚种(ssp. fastigiata)和密枝亚种
(ssp. hypogaea) (Krapoviekas, 1969; 孙大容 ,
1998)。
2.3 亚群划分与来源地的相关性及其表型性状特点
依据花生品种在我国的分布情况可划分为东南沿海
花生区、黄河流域花生区、长江流域花生区及云贵高
原花生区。这种划分方式基本与按照生产方式和种植
面积划分的南方春秋两熟花生区、北方大花生区和长
江流域春夏花生区3个主要花生产区相对应(万书波,
2003)。由表2可知, 国内花生种质与国外花生种质划
分的亚群几乎无重叠, 166份花生种质的地理生态分

图1 不同亚群K值的后验概率lnP(D)的变异趋势

Figure 1 The trendline of posterior probabilities (lnP(D)) for
each hypothetic number of subpopulations (K)
严玫等: 花生重要农艺及产量性状的全基因组关联分析 463

表1 SSR标记的多态性
Table 1 Polymorphism information of SSR

类与Structure模型聚类呈显著相关 (χ2=166, 大于
χ20.01, 24=42.98)。
将Structure模型聚类及各亚群的表型性状特点
(表3)进行详细比对, 发现各类亚群除表型特征明显
之外, 还在一定程度上与品种的来源地相关。国内和
国外花生品种在植株形态上差异较大, 主茎高和侧
枝较长的品种集中分布在第VI和VII两大亚群, 国外
花生品种的匍匐型集中分布在亚群VII; 亚群VII中的
花生品种总分枝数和结果枝数较其它亚群更多。我国
花生品种的产量性状表现较好, 主要集中分布在第I
和II、第V大亚群, 该亚群的单株生产力、百果重和百
仁重均高于其它亚群, 出仁率也基本一致。这类亚群
的花生品种主要来源于我国北方大花生区和长江流
域春夏花生区, 为疏枝大果品种, 区别于南方花生主
产区的珍珠豆品种及外国花生品种的中果、小果品
种。

SSR locus Linkage Position Allele
No.
Gene
diversity
PIC SSR locus Linkage Position Allele
No.
Gene
diversity
PIC
ARS335 LK1 0 9 0.824 0.801 pPGPseq5D5 LK14 0 26 0.911 0.904
ARS303 LK1 2 14 0.789 0.763 TC2G05 LK14 16 10 0.858 0.842
ARS166 LK1 6.3 11 0.835 0.815 TC6E01 LK14 68.8 28 0.944 0.941
ARS535 LK1 21.7 5 0.716 0.681 TC2B09 LK14 112.1 7 0.713 0.666
ARS415 LK1 24.4 8 0.833 0.811 GM28 LK14 158.8 10 0.765 0.733
GC-94 LK1 28.8 14 0.758 0.737 ARS203 LK15 30.2 17 0.812 0.788
GC-104 LK1 44.4 15 0.868 0.853 TC1A02 LK15 52.2 21 0.764 0.734
pPGSseq19G7 LK2 0 8 0.84 0.82 PM54 LK16 0 10 0.796 0.765
PM81 LK2 10.6 6 0.36 0.338 pPGPseq3E10 LK17 0 9 0.814 0.787
ARS392 LK2 51.6 10 0.815 0.788 pPGPseq4H11 LK17 13.4 15 0.731 0.697
ARS251 LK2 60.3 12 0.862 0.848 PMc588 – 6 0.635 0.569
ARS180 LK2 73 12 0.874 0.86 pPGSseq15D3 – 10 0.724 0.688
GM553 LK3 0 12 0.847 0.829 pPGSseq18G1 – 6 0.637 0.571
pPGSseq16F1 LK3 36.3 6 0.799 0.768 pPGPseq2E6 – 19 0.812 0.792
ARS173 LK4 0 16 0.844 0.825 pPGPseq2D12B – 7 0.711 0.678
ARS298 LK4 0.891 19 0.874 0.861 PM137 – 13 0.809 0.786
GM1843 LK4 3.464 9 0.778 0.744 PM377 – 13 0.798 0.775
GM401 LK4 51.1 9 0.744 0.699 TC4G02 – 20 0.837 0.823
ARS313 LK6 25.4 5 0.448 0.4 GM529 – 9 0.744 0.704
EM-87 LK7 4.8 18 0.829 0.808 TC1G04 – 10 0.674 0.626
ARS376 LK7 25.2 13 0.839 0.82 TC2E05 – 13 0.719 0.675
pPGSseq17E3 LK7 49.9 6 0.705 0.661 TC3G05 – 11 0.697 0.646
ARS644 LK7 62.6 4 0.534 0.449 TC4G02 – 11 0.823 0.801
pPGPseq1B9 LK8 0 11 0.816 0.791 RN26G09 – 14 0.89 0.879
ARS545 LK9 33.9 15 0.867 0.852 RN34A10 – 9 0.69 0.635
ARS127 LK10 33.3 3 0.549 0.451 ARS98 – 10 0.818 0.794
ARS357 LK11 6.5 7 0.823 0.799 ARS108 – 14 0.869 0.856
PM436 LK12 41.7 9 0.822 0.8 ARS124 – 7 0.75 0.706
pPGSseq14H6 LK12 47.7 11 0.829 0.808 ARS318 – 13 0.88 0.868
pPGSseq15C12 LK13 0 17 0.855 0.841 ARS338 – 16 0.859 0.844
pPGSseq17F6 LK13 50.8 21 0.917 0.911 ARS369 – 9 0.615 0.567
ARS606 – 10 0.808 0.78
GM384 – 6 0.751 0.711
Mean 11.6 0.777 0.748
464 植物学报 50(4) 2015

图2 166份花生种质的群体结构分析

Figure 2 Population structure of 166 peanut germplasm

图3 166份花生种质基于Nei’s 1983聚类/邻接法构建的系统发育树

Figure 3 The dendrogram of the 166 peanut germplasm based on Nei’s 1983/Neighbor-joining cluster
严玫等: 花生重要农艺及产量性状的全基因组关联分析 465

表2 166份花生种质SSR标记模型聚类与来源地生态划分的相关性
Table 2 Association between model-based clusters and geographic eco-types of 166 peanut germplasm
Geographic eco-type Structure Total χ2 test
I II III IV V VI VII
Southeast of China 1 25 18 2 46
Huang River region of China 17 23 6 2 7 1 56 χ2=166**
Yangtzi River region of China 11 6 4 3 6 1 31 P<0.000 1
Yunnan and Guizhou Plateau 1 2 3
World wide origin 1 8 13 8 30 χ20.01, 24= 42.98
Total 31 29 35 33 15 13 10 166

表3 依据群体结构划分的各亚群内品种的农艺与产量性状比对(3年平均值±标准误)
Table 3 The comparison of agronomic and yield traits between 7 subgroups by means±SD of 3 years
Trait I II III IV V VI VII
1 45.21±1.92 46.93±0.83 48.82±1.25 55.92±1.97 45.58±1.59 79.51±2.81 53.80±2.89
2 53.77±1.24 55.93±1.18 58.96±1.42 66.95±2.23 54.14±2.06 95.07±3.64 70.63±3.07
3 11.37±0.50 11.55±0.60 10.31±0.32 10.33±0.36 10.74±0.66 10.38±0.88 19.02±1.40
4 8.99±0.16 8.96±0.24 7.29±0.15 7.37±0.20 8.57±0.40 6.88±0.32 11.1±0.67
5 28.64±0.79 27.91±0.61 21.20±0.92 20.80±1.01 27.3±1.41 15.74±1.12 19.45±1.85
6 23.71±0.52 22.51±0.48 20.08±0.50 21.68±0.75 24±0.83 17.89±0.89 22.56±0.86
7 16.8±0.36 15.3±0.46 14.6±0.41 16.53±0.54 16.01±0.69 12.27±0.70 13.26±0.76
8 176.58±6.05 176.93±3.93 139.16±3.47 135.32±6.46 172.81±6.34 120.17±6.99 123.78±11.54
9 75.47±2.33 76.93±1.59 54.92±1.54 53.59±2.45 69.60±2.78 39.85±2.34 55.05±3.82
10 0.51±0.01 0.51±0.01 0.48±0.01 0.49±0.01 0.51±0.01 0.49±0.01 0.46±0.02
1: 主茎高(cm); 2: 侧枝长(cm); 3: 总分枝数; 4: 结果枝数; 5: 单株生产力(g); 6: 单株结果数; 7: 单株饱果数; 8: 百果重(g); 9: 百仁
重(g); 10: 出仁率。粗体数字显示部分代表类群划分与表型性状有对应趋势。
1: Main stem height (cm); 2: Lateral branch length (cm); 3: Total number of branches; 4: Number of pod-bearing branches; 5: Pod
weight per plant (g); 6: Pods number per plant; 7: Number of well filled pods per plant; 8: 100-pod weight (g); 9: 100-seed weight
(g); 10: Shelling percentage. The bold statistics indicated that the accessions having similar phenotypic characters had a ten-
dency to be clustered into the same structure subgroup.

2.4 农艺性状的变异分析与相关性分析
10个农艺性状的变异均呈现连续变化, 且变异丰富
(表4)。对各年份产量性状的平均数分析结果显示,
2011年的各产量性状值均低于其它2个年份, 总分枝
数和结果枝数的性状值连续3年基本一致, 表现最为
稳定。分析各年变幅和变异系数可知, 2013年各个产
量性状整体上变异幅度均表现最高, 2012年和2013
年的变异系数均达到10%以上, 且各产量相关性状中
总分枝数和单株生产力的变异最大。
将3年主要农艺性状值平均后作相关性分析(表
5), 并按照与单株生产力相关系数的大小排序, 依次
为百果重 (0.786)> 百仁重 (0.755)> 单株饱果数
(0.593)>单株结果数(0.573)>结果枝数(0.410)。因5
个性状均与单株生产力极显著相关(P<0.01), 即确定
为产量构成的相关性状。
2.5 SSR标记-多年产量相关性状的关联分析及等
位变异分析
在群体遗传结构和品种亲缘关系分析的基础上, 通过
MLM (Q+K)模型对以上6个产量相关性状的2011–
2013年数值分进行全基因组关联分析, 共发掘出48
个与产量性状呈显著关联的SSR标记, 分别是20、33
和26个。各标记表型变异解释率的变异范围在0.011–
0.348 1, 平均为0.067 3, 共检出590个等位变异, 平
均每个标记12.29个。能够在2年以上重复检出与性状
显著关联SSR标记的位点有13个, 其中以百果重最
多, 大部分SSR位点的关联显著程度较低, P<0.001
466 植物学报 50(4) 2015

表4 花生种质在2011–2013年主要农艺和产量性状的变异分析
Table 4 Variation analysis of agronomic and yield traits among peanut germplasm in 2011–2013
Trait Means±SD Range CV (%)
2011 2012 2013 2011 2012 2013 2011 2012 2013
1 43.73±10.48 56.08±12.42 55.17±15.24 24.60–77.80 33.00–102.99 33.25–116.70 10.48 22.16 27.63
2 55.33±12.76 64.81±14.06 66.29±18.11 32.00–100.60 38.00–130.33 36.48–140.6 12.76 21.69 27.32
3 12.00±3.68 10.46±3.41 11.48±3.73 4.89–25.15 5.10–24.00 5.30–31.60 3.68 32.58 32.47
4 8.27±1.51 8.30±2.01 8.05±1.99 4.50–15.80 4.92–15.90 3.82–14.6 1.51 24.23 24.57
5 19.75±7.76 25.76±5.87 25.61±8.48 3.40–36.5 10.00–40.85 3.04–56.00 7.76 22.78 33.13
6 19.37±5.57 25.44±4.99 20.69±4.99 7.05–31.90 12.93–57.62 6.21–39.70 5.57 19.59 24.13
7 11.89±4.76 20.01±3.5 14.25±4.07 3.60–28.10 10.40–32.13 3.09–35.20 4.76 17.49 28.58
8 129.93±37.76 146.84±31.35 181.07±45.87 44.40–240.00 49.00–228.28 62.00–298.00 37.76 21.35 25.34
9 56.73±17.25 57.35±14.39 73.39±20.73 10..0–120.85 17.00–91.50 27.50–127.50 17.25 25.10 28.25
10 0.53±0.09 0.70±0.06 0.46±0.07 0.27–0.72 0.35–0.82 0.11–0.62 0.09 8.96 26.65
1: 主茎高(cm); 2: 侧枝长(cm); 3: 总分枝数; 4: 结果枝数; 5: 单株生产力(g); 6: 单株结果数; 7: 单株饱果数; 8: 百果重(g); 9: 百仁
重(g); 10: 出仁率
1: Main stem height (cm); 2: Lateral branch length (cm); 3: Total number of branches; 4: Number of pod-bearing branches; 5: Pod
weight per plant (g); 6: Pods number per plant; 7: Number of well filled pods per plant; 8: 100-pod weight (g); 9: 100-seed weight
(g); 10: Shelling percentage

表5 166份花生种质主要农艺性状与产量性状的相关分析
Table 5 The correlation coefficient of agronomic and yield traits in 166 peanut germplasm
Trait MH LB TB PWP NB PN NW PW SW
LB 0.953** 1
TB –0.094 –0.002 1
PWP –0.476** –0.526** –0.025 1
NB –0.324** –0.272** 0.794** 0.410** 1
PN –0.216** –0.220** 0.193* 0.573** 0.443** 1
NW –0.266** –0.309** –0.042 0.593** 0.205** 0.765** 1
PW –0.432** –0.478** –0.108 0.786** 0.267** 0.118 0.189* 1
SW –0.539** –0.569** 0.040 0.755** 0.416** 0.183* 0.165* 0.901** 1
SP –0.151 –0.129 –0.100 –0.106 –0.027 –0.185* –0.238** 0.106 0.257**
* P<0.05; P<0.01。MH: 主茎高; LB: 侧枝长; TB: 总分枝数; PWP: 单株生产力; NB: 结果枝数; PN: 单株结果数; NW: 单株饱果
数; PW: 百果重; SW: 百仁重; SP: 出仁率
* P<0.05; P<0.01. MH: Main stem height; LB: Lateral branch length; TB: Total number of branches; PWP: Pod weight per plant;
NB: Number of pod-bearing branches; PN: Pods number per plant; NW: Number of well filled pods per plant; PW: 100-pod
weight; SW: 100-seed weight; SP: Shelling percentage

的关联位点仅占19%(表6)。
MLM (K+Q)模型的分析结果显示, 与单株结果数
显著关联的TC1A02 (R2=0.348 1, P<0.001)的表型变
异解释率最大, 且TC1A02在2011年和2012年与百果
重紧密关联(P<0.001), PM54、pPGPseq2E6和TC-
4G02连续3年重复检出与百果重显著关联(P<0.05)。表
中多年重复检出与多个性状关联的标记有: PM54连续
2年以上表现出同时与单株饱果数、百果重紧密关联;
GM1843在2011年和2013年与单株结果数、单株饱果
数紧密关联; 在2012年和2013年, EM-87表现出与百
果重、百仁重紧密关联, TC1A02和GM529均表现出与
单株结果数、单株饱果数2个性状紧密关联。
通过与产量相关性状关联的SSR位点的表型效
应分析可知(表7), 每个位点均同时含有增效和减效
等位变异。与百果重关联的位点中, pPGPseq2E6的
B473 (+63.953 4)表型效应最大且所含增效占70%以
上, 其次是TC1A02的C470 (+41.588 5)和C560
(+40.926 1); PM54的减效等位变异较多, 其中A197
严玫等: 花生重要农艺及产量性状的全基因组关联分析 467

表6 采用MLM (K+Q)模型检测的连续2年以上与6个产量相关性状关联的SSR位点
Table 6 SSR associated with 6 yield related traits could be detected repeatedly over 2 years with MLM (K+Q) model
Trait SSR locus MLM-model R2 P value
2011 2012 2013 2011 2012 2013
Number of
pod-bearing branches
pPGSseq15D3 0.065 3 0.067 7 0.009 5 0.017 1
ARS376 0.060 2 0.048 9 0.016 5 0.030 1
ARS535 0.038 1 0.026 6 0.003 7 0.023 6
Pod weight per plant PM377 0.046 3 0.057 6 0.023 0.025 4
TC3G05 0.054 4 0.096 1 0.046 5 1.45×10–5
Pods number per plant GM529 0.084 3 0.033 4 0.004 1 0.044 8
TC1A02 0.348 1 0.179 5 0.014 2 1.42×10–10 1.97×10–4
GM1843 0.053 7 0.042 4 0.003 5 0.028 2
Number of well
filled pods per plant
PM54 0.051 5 0.077 6 0.011 9 0.015 2
GM529 0.063 2 0.029 8 0.011 4 0.036 9
TC1A02 0.137 6 0.222 9 0.017 7 5.11×10–5
GM1843 0.022 4 0.049 4 0.039 7 0.008 5
100-pod weight PM54 0.039 7 0.045 7 0.055 3 0.037 0.018 6 5.73×10–4
pPGPseq2E6 0.058 3 0.060 9 0.045 1 0.010 7 3.75×10–4 0.007 2
TC4G02 0.091 2 0.100 4 0.060 9 0.001 3 0.007 1 0.02
EM-87 0.112 1 0.061 4 1.80×10–5 0.002
TC1A02 0.065 8 0.060 3 0.039 2 0.022 9
100-seed weight

pPGSseq14H6 0.033 7 0.025 3 0.013 8 0.006 2 0.016 8
EM-87 0.047 2 0.052 4 0.027 2 0.005 1
ARS392 0.037 4 0.036 8 0.022 7 8.60×10–4 0.002 7 0.023 9
ARS535 0.014 0.011 0.022 6 0.035 4

(–68.583 1)的表型效应最小。与单株结果数关联的位
点中GM529的B233 (–12.888 9)表型效应最小, 其平
均等位效应中减效效应较大 (AAE=–6.694 9);
TC1A02的等位变异位点的增效与减效效应差异明
显 , 如表型效应最大的C500 (+7.374 4)和C475
(–8.132 9)。与单株饱果数关联的位点中GM529的
B233 (–6.400 4)表型效应最小且平均等位效应中减
效效应较大 (AAE=–5.755 9), GM1843 的 E157
(+4.316 6)表型效应较大且平均等位效应中增效效应
较大(AAE=2.467 6)。
2.6 讨论
2.6.1 群体结构及聚类分析与地理生态划分比对
分析
166份花生种质的地理生态分类与模型聚类划分结果
呈显著相关(P<0.001)。研究结果表明, 供试材料根据
Structure模型可划分成7大亚群, 国外材料与国内材
料基本不重叠, 主要集中分布在亚群VI和亚群VII; 黄
河流域的北方大花生区和长江流域的春夏花生区的
品种主要集中分布在亚群I、亚群II和亚群V; 南方春秋
两熟花生区的品种集中分布在亚群III和亚群IV。该现
象恰好体现出本实验中供试花生群体主要由花生育
成品种组成, 因长期受人工选择的影响, 使其在遗传
分化上表现出与来源地生态区相关。
本研究同时表明地理生态分类与聚类结果相对
应, 根据Nei’s 1983/Neighbor-joining构建的系统发
育树状图, 南方春秋两熟花生区的品种集中分布的亚
群III和亚群IV, 在聚类图中位于同一大类群; 北方大
花生区和长江流域的春夏花生区品种集中分布的亚
群I、亚群II和亚群V, 在聚类图中则分别表现为位于红
色和绿色区域内遗传距离较近的2个类群, 亚群I与亚
群V在聚类图中又位于同一大类群。聚类分析结果总
体上表现出来源地地理位置邻近的花生品种具有表
型特征相同、遗传关系密切和符合同类聚集规律的特
点, 在其它研究中也曾得到类似结果(Wang et al.,
2009; Ren et al., 2014)。

468 植物学报 50(4) 2015

表7 产量性状关联位点的主要等位基因表型效应
Table 7 Phenotypic effect of main alleles at SSR loci significantly associated with yield related traits
100-pod weight (g) Pods number per plant Full pods number per plant
SSR locus Alleles AI SSR locus Alleles AI SSR locus Alleles AI
PM54 A113 –22.870 6 GM529 B160 –0.598 PM54 A113 1.529 2
A181 34.132 4 B219 0.266 2 A181 0.287 7
A185 –9.174 7 B233 –12.889 A185 –0.888 4
A194 –10.121 9 B254 –6.598 A194 0.708 7
A114 –32.339 4 B175 1.505 A114 –2.899 9
A197 –68.583 1 TC1A02 C475 –8.133 A197 1.774 0
A200 –35.389 9 C500 7.374 5 A200 –3.374 6
A205 –66.972 6 C591 –6.488 4 A205 –1.658 2
pPGPseq2E6 B473 63.953 4 C470 –0.347 5 GM529 B160 0.663 6
B416 0.798 2 C485 –1.650 3 B219 0.737 1
B504 6.721 1 C242 1.548 1 B233 –6.400 4
B540 –57.571 8 C565 –1.225 B254 –5.111 4
B608 –11.112 1 C575 2.235 7 B175 0.298 0
B400 6.932 4 C580 0.586 2 TC1A02 C475 –4.915 9
B433 –0.231 1 C245 –2.753 9 C500 1.399 0
B450 19.717 0 C565 1.230 3 C591 –0.730 2
B385 –6.731 0 C246 –0.511 6 C470 –0.229 1
B465 7.411 0 C560 –0.853 8 C485 –1.425 9
B516 33.917 8 C250 0.504 5 C500 0.330 6
B460 15.365 3 C260 –4.067 7 C242 –1.334 4
B270 48.274 5 C262 2.209
TC1A02 C475 –15.280 2 C447 –1.908 5 C575 2.100 0
C500 7.374 5 GM1843 E111 –3.135 8 C580 –1.821 0
C591 –29.501 6 E117 –0.238 5 C245 –3.147 3
C470 41.588 5 E157 –2.066 7 C565 2.648 1
C485 –13.043 2 E119 2.327 5 C246 –0.807 5
C500 –51.089 E121 3.294 1 C560 –2.600 1
C242 38.863 2 E132 –2.161 2 C250 –2.266 5
C575 17.545 3 C260 –3.740 9
C580 20.984 1 C262 –1.317 6
C245 –39.861 6 C447 –1.123 5
C565 –28.856 2 GM1843 E111 –2.869 5
C246 –37.283 E117 –0.629 2
C560 40.926 2 E157 4.316 6
C250 –62.524 5 E119 0.728 9
C260 –32.857 4 E121 2.357 2
C262 –18.781 8 E132 –0.283 7
C447 –21.705 4 AAE (positive/negative)
AAE (positive/negative) AAE (positive/negative) PM54 1.074 9 –2.205 2
PM54 34.132 4 –35.064 6 GM529 0.885 6 –6.695 GM529 0.566 2 –5.755 9
pPGPseq2E6 22.565 6 –18.911 5 TC1A02 2.241 2 –2.713 5 TC1A02 1.619 4 –1.958 5
TC1A02 27.880 3 –31.889 4 GM1843 2.810 8 –1.900 6 GM1843 2.467 6 –1.260 8

2.6.2 关联作图与QTL作图的双向验证
SSR标记具有诸多优点: (1) 数量丰富, 覆盖整个基
因组, 揭示的多态性高; (2) 具有多等位基因的特性,
提供的信息量大; (3) 以孟德尔方式遗传, 呈共显性;
严玫等: 花生重要农艺及产量性状的全基因组关联分析 469

(4) 与RFLP、RAPD和AFLP等分子标记相比, 具有
方法简便和重复性好等优点(李孟军等, 2008)。本实
验选用SSR标记, 不但能够稳定呈现不同花生品种
的遗传信息, 而且有效克服了花生栽培种遗传多样性
狭窄的问题, 使用一定数量的SSR就能够对供试群
体进行高饱和度的遗传多样性分析。
关联分析的基础是群体中等位基因的连锁不平
衡(LD)(Gupta et al., 2005)。重组会降低基因座间的
连锁不平衡性, 而选择和瓶颈效应能使群体产生群体
结构, 致使非连锁基因座间产生并增加连锁不平衡
性, 降低关联分析的精确性。花生是严格的自花授粉
作物, 重组率较低, 连锁不平衡性高于异花授粉作
物, 同时育成品种在自然进化和形成过程中经历了瓶
颈效应和强烈的人工选择, 这说明本研究的供试材料
整体上LD较高。
以上这些因素使用于全基因组的低分辨率LD作
图所需的标记较少, 相应关联分析结果的精确性也较
低, 导致其关联作图效果不如 QTL 作图。花生基因
组约为2.8×109 bp, 大小与人类基因组相似, 在全基
因组水平上的研究十分有限。在实际作图时, 应该把
LD作图与QTL作图法结合起来, 取长补短, 可更好地
实现对目标性状的精细作图。
已有研究证明, 花生产量相关性状的遗传特点较
为复杂, 但集中表现为主基因遗传且以加性效应为
主, 主基因遗传率高于多基因。其中, 主茎高和单株
生产力遗传效应较差, 主要受非加性遗传效应的影响
(赖明芳等, 2007; 李兰周等, 2013)。张新友等(2010)
利用重组自交系开展的遗传分析表明, 原阳地区的花
生产量相关性状主要以主基因加多基因遗传模型为
主。单株饱果数表现为主基因加性效应, 但在一定程
度上也受环境的影响; 单株生产力的构成因素较为复
杂, 没有主基因控制; 百果重和百仁重则在不同环境
中均表现出3对主基因加多基因的遗传模式。刘华
(2011)利用重组自交系的遗传分析表明, 原阳地区的
花生产量相关性状主要为2–3对主基因+多基因遗传,
主基因普遍比多基因遗传率高, 说明控制这些性状的
基因以主基因为主, 环境对其影响相对较小。
将MLM (Q+K)模型运算所得的结果与本团队以
往基于RIL群体作图的QTL进行比对分析, 发现本研
究在2年中重复检测的关联位点TC2G05和GM1843,
与侧枝长和单株饱果数呈显著关联的同时也与以往
利用RIL群体(郑8903×豫4)获得的QTL相重叠(张新
友, 2010); 连续3年与百果重显著关联的关联位点
pPGPseq2E6, 同时也是RIL群体(白沙1016×A. mo-
nticola)中百果重的QTL(吕维娜, 2014)。理论上, 在
两种方法中均检测到的QTL应较为准确, 可应用于今
后花生品种选育及分子标记辅助育种。
3 结论
通过64对SSR引物的聚类分析和结构划分, 166份花
生种质受其综合性状遗传特点和来源地域的影响可
被划分成7个亚群, 聚类分析结果与群体结构基本一
致; 在生长习性和形态特征上各类群的性状表型趋于
一致, 群体划分与材料来源地的地理生态划分显著相
关(P<0.001)。本研究采用SSR标记的多位点基因型
数据进行关联分析, 与单株果数呈显著关联的位点
TC1A02 (P<0.001)表型变异解释率值最高的含21个
等位变异 , 其中C500 (+7.374 4)表型效应最大 ;
pPGPseq2E6连续3年重复检出与百果重显著关联,
含19个等位变异位点, 该位点中B473 (+63.953 4)表
型效应最大。本研究结果为产量性状分子辅助育种提
供了理论依据。
参考文献
盖钧镒, 章元明, 王建康 (2003). 植物数量性状遗传体系. 北
京: 科学出版社.
高运来, 姚丙晨, 刘春燕, 李文福, 蒋洪蔚, 李灿东, 张闻博,
胡国华, 陈庆山 (2009). 黑龙江省主栽大豆品种遗传多样
性的SSR分析. 植物学报 44, 556–561.
黄莉, 任小平, 张晓杰, 陈玉宁, 姜慧芳 (2012). ICRISAT花
生微核心种质农艺性状和黄曲霉抗性关联分析. 作物学报
38, 935–946.
赖明芳, 曾彦, 漆燕, 夏友霖, 崔富华 (2007). 花生主要经济
性状遗传特点分析. 中国油料作物学报 29, 148–151.
李兰周, 刘风珍, 万勇善, 张昆, 赵文祥 (2013). 花生荚果和
籽仁相关性状的主基因+多基因混合遗传模型分析. 华北农
学报 28(5), 116–123.
李孟军, 肖寒, 卢金东, 王兴军 (2008). 花生微卫星标记的研
究进展. 植物学通报 25, 373–380.
刘华 (2011). 栽培花生产量和品质相关性状遗传分析与QTL
定位研究. 硕士论文. 郑州: 河南农业大学.
吕维娜 (2014). 花生栽培种SSR遗传连锁图谱构建及重要产
470 植物学报 50(4) 2015

量性状QTL定位分析. 硕士论文. 郑州: 郑州大学.
孙大容 (1998). 花生育种学. 北京: 中国农业出版社. pp. 55.
谭贤杰, 吴子恺, 程伟东, 王天宇, 黎裕 (2011). 关联分析及
其在植物遗传学研究中的应用. 植物学报 46, 108–118.
万建民 (2006). 作物分子设计育种. 作物学报 32, 455–462.
万书波 (2003). 中国花生栽培学. 上海: 上海科学技术出版
社. pp. 78–79.
王建康, 李慧慧, 张学才, 尹长斌, 黎裕, 马有志, 李新海, 邱
丽娟, 万建民 (2011). 中国作物分子设计育种. 作物学报
37, 191–201.
文自翔 , 赵团结 , 郑永战 , 刘顺湖 , 王春娥 , 王芳 , 盖钧镒
(2008). 中国栽培和野生大豆农艺品质性状与SSR标记的
关联分析 I. 群体结构及关联标记 . 作物学报 34, 1169–
1178.
吴学君 (2010). 我国花生及花生产品出口结构与竞争力分析
——基于1997–2007年进出口贸易数据. 中国油料作物学报
32, 309–314.
严玫 (2012). 花生种质资源重要农艺和品质性状的全基因组
关联分析. 硕士论文. 郑州: 郑州大学.
杨小红, 严建兵, 郑艳萍, 余建明, 李建生 (2007). 植物数量
性状关联分析研究进展. 作物学报 33, 523–530.
禹山林 (2008). 中国花生品种及其系谱. 上海: 上海科学技术
出版社. pp. 232–701.
张新友 (2010). 栽培花生产量、品质和抗病性的遗传分析与
QTL定位研究. 博士论文. 杭州: 浙江大学.
张新友, 韩锁义, 徐静, 严玫, 刘华, 汤丰收, 董文召, 黄冰艳
(2012). 花生主要品质性状的QTLs定位分析. 中国油料作
物学报 34, 311–315.
Anderson JA, Churchill GA, Autrique JE, Tanksley SD,
Sorrells ME (1993). Optimizing parental selection for
genetic linkage maps. Genome 36, 181–186.
Belamkar V, Selvaraj MG, Ayers JL, Payton PR, Puppala
N, Burow MD (2011). A first insight into population
structure and linkage disequilibrium in the US peanut
minicore collection. Genetica 139, 411–429.
Bradbury PJ, Zhang ZW, Kroon DE, Casstevens TM,
Ramdoss Y, Buckler ES (2007). TASSEL: software for
association mapping of complex traits in diverse samples.
Bioinformatics 23, 2633–2635.
Breseghello F, Sorrells ME (2006). Association mapping of
kernel size and milling quality in wheat (Triticum aestivum
L.) cultivars. Genetics 172, 1165–1177.
Evanno G, Regnaut S, Goudet J (2005). Detecting the
number of clusters of individuals using the software
STRUCTURE: a simulation study. Mol Ecol 14, 2611–
2620.
Falush D, Stephens M, Pritehard JK (2003). Inference of
population structure using multilocus genotype data:
linked loci and correlated allele frequencies. Genetics
164, 1567–1587.
FAO (2011, 2012). Statistical database. Rome: Food and
Agriculture Organization of the United Nations.
Gupta PK, Rustgi S, Kulwal PL (2005). Linkage disequilib-
rium and association studies in higher plants: pres-
ent status and future prospects. Plant Mol Biol 57, 461–
485.
Hong YB, Liang XQ, Chen XP, Liu HY, Zhou GY, Li SX,
Wen SJ (2008). Construction of genetic linkage map
based on SSR markers in peanut (Arachis hypogaea L.).
Agric Sci China 7, 915–921.
Jin L, Lu Y, Xiao P, Sun M, Corke H, Bao JS (2010). Ge-
netic diversity and population structure of a diverse set of
rice germplasm for association mapping. Theor Appl
Genet 121, 475–487.
Kraakman ATW, Niks RE, Van den Berg PMMM, Stam P,
Van Eeuwijk FA (2004). Linkage disequilibrium mapping
of yield and yield stability in modern spring barley culti-
vars. Genetics 168, 435–446.
Krapoviekas A (1969). The origin, variability and spread of
the groundnut (Arachis hypogaea L.). In: Ucko PJ, Dim-
bleby GW, eds. The Domestication and Exploitation of
Plants and Animals. London: Duckworth. pp. 427–441.
Li XH, Acharya A, Farmer AD, Crow JA, Bharti AK,
Kramer RS, Wei YL, Han YH, Gou JQ, May GD, Mon-
teros MJ, Brummer EC (2012). Prevalence of single nu-
cleotide polymorphism among 27 diverse alfalfa geno-
types as assessed by transcriptome sequencing. BMC
Genomics 13, 568.
Liu KJ, Muse SV (2005). PowerMarker: an integrated
analysis environment for genetic marker analysis. Bioin-
formatics 21, 2128–2129.
Mackay I, Powell W (2007). Methods for linkage disequilib-
rium mapping in crops. Trends Plant Sci 12, 57– 63.
Nordborg M, Borevitz JO, Bergelson J, Berry CC, Chory
J, Hagenblad J, Kreitman M, Maloof JN, Noyes T,
Oefner PJ, Stahl EA, Weigel D (2002). The extent of
linkage disequilibrium in Arabidopsis thaliana. Nat Genet
30, 190–193.
Nordborg M, Hu TT, Ishino Y, Jhaveri J, Toomajian C,
Zheng HG, Bakker E, Calabrese P, Gladstone J, Goyal
R, Jakobsson M, Kim SK, Morozov Y, Padhuka-
严玫等: 花生重要农艺及产量性状的全基因组关联分析 471

sahasram B, Plagnol V, Rosenberg NA, Shah C, Wall
JD, Wang J, Zhao KY, Kalbfleisch T, Schulz V,
Kreitman M, Bergelson J (2005). The pattern of
polymorphism in Arabidopsis thaliana. PLoS Biol 3,
e196.
Porebski S, Bailey LG, Baum BR (1997). Modification of a
CTAB DNA extraction protocol for plants containing high
polysaccharide and polyphenol components. Plant Mol
Biol Rep 15, 8–15.
Pritchard JK, Stephens M, Donnelly P (2000). Inference of
population structure using multilocus genotype data. Ge-
netics 155, 945–959.
Ren XP, Jiang HF, Yan ZY, Chen YN, Zhou XP, Huang L,
Lei Y, Huang JQ, Yan LY, Qi Y, Wei WH, Liao BS
(2014). Genetic diversity and population structure of the
major peanut (Arachis hypogaea L.) cultivars grown in
China by SSR markers. PLoS One 9, e88091.
Templeton AR (1995). A cladistic analysis of phenotypic
associations with haplotypes inferred from restriction en-
donuclease mapping or DNA sequencing. V. Analysis of
case/control sampling designs: alzheimers disease and
the apoprotein E locus. Genetics 140, 403–409.
Thornsberry JM, Goodman MM, Doebley J, Kresovich S,
Nielsen D, Buckler ESIV (2001). Dwarf8 polymorphisms
associate with variation in flowering time. Nat Genet 28,
286–289.
Wang ML, Zhu CS, Barkley NA, Chen ZB, Erpelding JE,
Murray SC, Tuinstra MR, Tesso T, Pederson GA, Yu
JM (2009). Genetic diversity and population structure
analysis of accessions in the US historic sweet sorghum
collection. Theor Appl Genet 120, 13–23.
Yang XH, Yan JB, Shah T, Warburton ML, Li Q, Gao YF,
Chai YC, Fu ZY, Zhou Y, Xu ST, Bai GH, Meng YJ,
Zheng YP, Li JS (2010). Genetic analysis and charac-
terization of a new maize association mapping panel for
quantitative trait loci dissection. Theor Appl Genet 121,
417–431.
Yu JM, Pressoir G, Briggs WH, Bi IV, Yamasaki M, Doe-
bley JF, McMullen MD, Gaut BS, Nielsen DM, Holland
JB, Kresovich S, Buckler ES (2006). A unified mixed-
model method for association mapping that accounts for
multiple levels of relatedness. Nat Genet 38, 203–208.
Zhao KY, Aranzana MJ, Kim S, Lister L, Shindo C, Tang
C, Toomajian C, Zheng HG, Dean C, Nordborg M
(2007). An Arabidopsis example of association mapping
in structured samples. PLoS Genet 3, e4.

472 植物学报 50(4) 2015

Genome-wide Association Study of Agronomic and Yield Traits in
a Worldwide Collection of Peanut (Arachis hypogaea) Germplasm
Mei Yan, Xinyou Zhang *, Suoyi Han, Bingyan Huang, Wenzhao Dong, Hua Liu, Ziqi Sun
Zhongxin Zhang, Fengshou Tang
Industrial Crops Research Institute, Henan Academy of Agricultural Sciences/National and Local Joint Engineering Labora-
tory for Peanut Genetic Improvement/Key Laboratory of Oil Crops in Huanghuaihai Plains, Ministry of Agriculture,
China/Henan Provincial Key Laboratory for Oil Crops Improvement, Zhengzhou 450002, China
Abstract Association analysis of yield-related traits and simple sequence repeat (SSR) loci distributed randomly in the
peanut genome could contribute to marker-assisted selection breeding by the detection of elite alleles and the interaction
of the gene region associated with high yield traits. We performed genome-wide association analysis with the mixed linear
model (Q+K) by scanning 166 peanut germplasm with selected 64 SSR markers. In all, 166 peanut germplasm could be
assigned to 7 subpopulations by population structure and cluster analysis, with results from both methods similar. The
morphological characteristics and geographic origin of germplasm were consistent within model-based clusters. From
2011 to 2013, the number of detected SSR markers significantly associated with 6 yield-related traits was 20, 33 and 26
respectively; 13 markers (P<0.05) were detected repeatedly over 2 years. The mean rate of phenotypic explanation of
SSR loci associated with traits was 0.067 3 (range 0.011–0.348 1). In total, 590 alleles were detected, with a mean of
12.29 alleles per SSR loci. Among all the trait-related markers, TC1A02 (P<0.001) had the highest rate of phenotypic
explanation and contained 21 alleles, which was associated with the trait of pod number per plant. Among the SSR loci
associated with the main effective factors of yield, the elite alleles with a high positive effect that could be used in
marker-assisted selection of yield improvement were TC1A02-C560 (+40.926 1), TC1A02-C470 (+41.588 5),
pPGPseq2E6-B473 (+63.953 4) associated with 100-pod weight, TC1A02-C500 (+7.374 4) associated with pod number
per plant and GM1843-E157 (+4.316 6) associated with full pod number per plant.
Key words peanut (Arachis hypogaea), yield trait, SSR, genome-wide association study
Yan M, Zhang XY, Han SY, Huang BY, Dong WZ, Liu H, Sun ZQ, Zhang ZX, Tang FS (2015). Genome-wide associa-
tion study of agronomic and yield traits in a worldwide collection of peanut (Arachis hypogaea) germplasm. Chin Bull Bot
50, 460–472.
———————————————
* Author for correspondence. E-mail: haasz@sohu.com
(责任编辑: 白羽红)

Genome-wide Association Study of Agronomic and Yield Traits in a Worldwide Collection of Peanut (Arachis hypogaea) Germplasm

花生重要农艺及产量性状的全基因组关联分析

相关文献