免费文献传递   相关文献

Identification of QTLs for Glycinin (11S) and β-Conglycinin (7S) Fractions of Seed Storage Protein in Soybean by Association Mapping

运用关联分析定位栽培大豆蛋白11S、7S组分的相关基因位点



全 文 :作物学报 ACTA AGRONOMICA SINICA 2012, 38(5): 820−828 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家自然科学基金项目(30971818, 30771360), 国家转基因生物新品种培育重大专项(2011ZX08004-003), 河南省创新型科技
人才队伍建设工程(094100510004)和郑州市创新型科技人才队伍建设工程(096SYJH14103)资助。
* 通讯作者(Corresponding author): 卢为国, E-mail: 123bean@163.com, Tel: 0371-65733647
第一作者联系方式: E-mail: jsy163@gmail.com, Tel: 0371-65733647
Received(收稿日期): 2011-08-22; Accepted(接受日期): 2012-01-19; Published online(网络出版日期): 2012-03-05.
URL: http://www.cnki.net/kcms/detail/11.1809.S.20120305.1041.017.html
DOI: 10.3724/SP.J.1006.2012.00820
运用关联分析定位栽培大豆蛋白 11S、7S 组分的相关基因位点
简 爽 1,2 文自翔 1 李海朝 1 袁道华 1 李金英 1 张 辉 1 叶永忠 2
卢为国 1,*
1河南省农业科学院经济作物研究所 / 国家大豆改良中心郑州分中心 / 农业部黄淮海油料作物重点实验室, 河南郑州 450002; 2河南
农业大学生命科学院, 河南郑州 450002
摘 要: 大豆贮藏蛋白主要成分是 7S和 11S球蛋白, 大豆贮藏蛋白组分及其亚基组成决定了蛋白质的品质和加工特
性。本研究选用 134 对细胞核 SSR 标记, 对 166 份栽培大豆微核心种质进行基因分型, 运用一般线性回归(general
linear model, GLM)和复合线性回归(mixed linear model, MLM)方法进行标记与性状的关联分析, 定位大豆蛋白亚基
的相关基因。结果表明, 2年均检测到的且与蛋白亚基相关联的 SSR位点有 14个, 以 MLM方法检测到 5个 SSR位
点(Sat_062、Satt583、Satt291、Satt234 和 Satt595)与蛋白亚基相关联; 7S 组分各亚基变异程度较大, 是引起 11S/7S
变异的主要原因; 表型变异较大的亚基可能因为相关基因进化中发生重组较多, LD 衰减距离较小, 导致检测到较少
的相关位点。本研究结果对蛋白亚基相关性状的标记辅助选择育种有重要的利用价值。
关键词: 栽培大豆[Glycine max (L.) Merr.]; 11S亚基; 7S亚基; SSR; 关联分析
Identification of QTLs for Glycinin (11S) and β-Conglycinin (7S) Fractions of
Seed Storage Protein in Soybean by Association Mapping
JIAN Shuang1,2, WEN Zi-Xiang1, LI Hai-Chao1, YUAN Dao-Hua1, LI Jin-Ying1, ZHANG Hui1, YE
Yong-Zhong2, and LU Wei-Guo1,*
1 Institute of Industrial Crops, Henan Academy of Agricultural Sciences / National Subcenter for Soybean Improvement in Zhengzhou / Key Labora-
tory of Oil Crops in Huanghuai Valleys, Ministry of Agriculture, Zhengzhou 450002, China; 2 College of Life Sciences, Henan Agricultural Univer-
sity, Zhengzhou 450002, China
Abstract: Glycinin (11S) and β-conglycinin (7S) are major components of seed storage protein in soybean, which play important
roles in the functionality of seed protein. In the present study, association mapping was used to map the QTLs (quantitative trait
loci) for glycinin (11S) and β-conglycinin (7S) fractions. One hundred and sixty-six accessions from Chinese soybean minicore
collection were genotyped with 134 selected simple-sequence repeat (SSR) markers. The storage protein of each accession was
separated by SDS-PAGE method, and gels were scanned for individual subunits of 11S and 7S by ImageQuant TL software. The
association analysis between SSR loci and protein subunit components was performed with TASSEL GLM (general linear model)
and MLM (mixed linear model) programs. The results showed that, both in 2008 and 2010, fourteen SSR loci associated with the
protein subunit components were screened out by GLM program, and five SSR (Satt234, Satt595, Sat_062, Satt583, and Satt291)
loci by MLM program, respectively. The high variation of 7S subunits was the main reason that caused 11S/7S ratio variance.
Fewer loci were detected to be associated with the protein subunits whose phenotypic variations were higher, which might be due
to the more recombination incidents during the evolution of the related genes. Therefore, the LD decay distances of these genes
were short, some QTLs could not be detected with limited SSR markers. The results of this study are meaningful for the marker
assisted selection breeding of soybean varieties with higher protein quality.
Keywords: Cultivated soybean [Glycine max (L.) Merr.]; Glycinin (11S); β-conglycinin (7S); Simple-sequence repeat (SSR);
Association mapping
第 5期 简 爽等: 运用关联分析定位栽培大豆蛋白 11S、7S组分的相关基因位点 821


大豆是人类重要的蛋白来源, 大豆蛋白主要成
分是 7S和 11S球蛋白, 由于它们的氨基酸组成和结
构不同, 大豆蛋白的营养价值及其在加工过程中显
示出的一系列理化性质均受到 11S/7S及其各亚基的
影响。研究表明提高 11S含量降低 7S含量, 将提高
大豆的营养价值, 而且不会降低大豆蛋白的含量[1-3]。
刘珊珊等[4]研究表明大豆 7S 球蛋白亚基组成对 15
种氨基酸和 5 种脂肪酸含量都有一定的影响。程翠
林等[5]研究表明 α′、α和 β亚基含量与豆腐凝胶硬度
极显著负相关, 11S组分的 A1A2 A4亚基与豆腐凝胶
硬度显著正相关。
不同大豆资源的 11S、7S 及其各亚基的相对含
量差异较为显著[6-8]。因此, 以丰富的遗传变异为基
础, 通过遗传改良的方法来改变品种的 11S、7S 及
其各个亚基的含量, 理论上可以选育出适合不同加
工目的的品种。
近年关于大豆蛋白含量的定位的报道很多, 但
关于大豆蛋白亚基定位的研究较为少见。刘顺湖等[9]
对 11S、7S、11S/7S、11S-1~11S-4、7S-1~7S-6等性
状用复合区间作图法、多区间作图法和完备区间作
图法进行 QTL分析, 定位到一些相关位点。Panthee
等[10]对 7S、11S及其各亚基运用复合区间作图法和
多区间作图法, 检测到了与不同亚基和 11S/7S相关
的位点。以上研究都运用分离群体进行 QTL定位的研
究。由于分离群体由 2个亲本杂交衍生而来, 因此基于
家系的连锁分析(family-based linkage mapping, FBLM)
只涉及同一座位的 2 个等位基因。同时在构建分离群
体时, 由于杂交和自交次数的限制, 发生的重组次
数有限, QTL作图的精度一般在 10~20 cM之间。
关联分析是利用等位基因间的连锁不平衡
(linkage disequilibrium, LD)关系进行性状与标记间
的相关性分析, 检测自然群体中与性状相关的基因
位点。该方法曾经广泛应用于人类遗传学[11], 因其
作图定位精确、不需要专门构建作图群体、可同时考
察一个基因座位的多个等位基因的优点, 目前已广泛
应用在水稻[12]、玉米[13]等作物的研究中。Jun 等[14]对
90 份亚洲栽培大豆种质进行蛋白质含量关联分析, 发
现了一些新的QTL位点, 同时发现部分位点与传统的
基于家系的连锁定位结果一致。
本研究的目的是以栽培大豆微核心种质为材料,
运用关联分析的方法对种子蛋白的 11S、7S 组分及
亚基相对含量的相关基因标记定位。以期为分子标
记辅助育种提供技术支撑, 加快大豆蛋白分子育种
的进程。
1 材料与方法
1.1 试验材料及田间设计
由中国农业科学院作物科学研究所提供的中国
栽培大豆的微核心种质资源 236 份, 代表总体的 90%
以上表型多样性[15]。由于部分种质材料在田间试验时
无法正常成熟, 最终收获到种子 166份, 其中, 北方
一熟制春作大豆品种生态区 50份, 黄淮海二熟制春
夏作大豆品种生态区 66份, 长江中下游二熟制春夏
作大豆品种生态区 14份, 中南多熟制春夏秋作大豆
品种生态区 12份, 西南高原二熟制春夏作大豆品种
生态区 7份, 华南热带多熟制四季大豆品种生态区 6
份[16]。另外还有国外引进品种 11份。
2008 年和 2010 年在河南省农业科学院原阳试
验站进行田间试验, 随机区组设计、每个材料种植 1
行, 行长 1 m, 行距 0.4 m, 常规田间管理。收获后每
个材料取 10 g种子用于室内蛋白亚基分析。
1.2 蛋白组分含量的测定
参照王红玲等[17]的方法提取大豆籽粒蛋白。采
用 SDS-PAGE垂直凝胶电泳, 浓缩胶浓度为 5%, 分
离胶浓度为 12%。参考王显生等[18]的研究结果分析
蛋白质亚基。经 SDS-PAGE 法分析, 大豆贮藏蛋白
7S组分含 α′、α和 β亚基, 11S组分含 A3、A1A2A4
和 B 亚基。使用 ImageQuant 凝胶成像系统 (GE
healthcare, USA)扫描电泳胶片, 运用 Image Quant
TL 凝胶条带分析软件依据标准分子量蛋白 Marker
算得各个亚基的百分含量, 11S/7S比值为 11S与 7S
相对含量之比, α′、α 和 β 亚基相对含量之和为 7S
相对含量, A3、A1A2A4和 B亚基相对含量之和为 11S
相对含量。
1.3 SSR标记全基因组扫描
参考 Doyle 的 CTAB 法[19], 从四叶期或五叶期
植株嫩叶中抽提每份材料总 DNA。随机抽取 8份材
料作为筛选引物样本, 根据 Song 等[20]的大豆公共遗
传图谱, 从分布于大豆 20个连锁群近 1 000对引物
中遴选出在基因组中分布均匀、多态性高的引物 134
对(表 1)。PCR总反应体系为 10 μL, 含 20 ng DNA、
0.4 μmol L–1引物对、60 μmol L–1 dNTPs、2 mmol L–1
MgCl2、1 μL 10×PCR缓冲液及 0.5 U Taq DNA聚合
酶, 使用 Mastercycler ep gradient S PCR仪。将扩增
产物在 8%的聚丙烯酰胺凝胶上电泳, 银染显色。在
822 作 物 学 报 第 38卷

表 1 选用的 SSR 位点在连锁群上的分布
Table 1 Distribution of selected SSR loci among linkage groups
连锁群
LG
位点数
No. of loci
平均图距
Average marker interval (cM)
连锁群
LG
位点数
No. of loci
平均图距
Average marker interval (cM)
A1(Gm5) 7 11.75 F (Gm13) 8 19.29
A2 (Gm8) 6 25.96 G (Gm18) 5 23.60
B1 (Gm11) 6 18.80 H (Gm12) 5 19.52
B2 (Gm14) 5 11.62 I (Gm20) 7 12.96
C1 (Gm4) 6 24.76 J (Gm16) 6 17.03
C2 (Gm6) 10 13.84 K (Gm9) 10 11.10
D1a (Gm1) 7 17.27 L (Gm19) 6 17.46
D1b (Gm2) 5 28.79 M (Gm7) 8 18.85
D2 (Gm17) 5 14.02 N (Gm3) 7 10.78
E (Gm15) 7 5.22 O (Gm10) 8 13.56

ImageQuant凝胶成像系统(GE healthcare, USA)中扫
描分析胶片。
1.4 数据处理
1.4.1 LD 的衡量 参见文自翔等[21]的数据处理
方法。
1.4.2 群体结构分析 以文自翔等 [21]的分析方
法为基础。群体数目(K)设定为 2~10, 并假定位点都
是独立的, 134个位点参加分析, 将 MCMC (markov
chain monte carlo)开始时的不作数迭代 (length of
burn-in period)设为 10 000次, 再将不作数迭代后的
MCMC设为 100 000次, 若发现 ln Pr(X|K)的值持续
增大, 没有拐点, 则用 Δk确定 K值, Δk=m[|L(K+1)–
2L(K)+L(K−1)|]/s[L(K)][22], m 表示均值, s 表示标准
差。成对材料间 kinship值使用 TASSEL软件 kinship
计算功能获得。
1.4.3 关联分析 使用 TASSEL 软件的 GLM
(general linear model)和MLM (mixed linear model)程
序。GLM 将各个体 Q 值作为协变量, MLM 将各个
体的 Q 作为协变量, kinship 值作为随机效应, 将蛋
白亚基性状的表型数据分别对标记变异进行回归分
析, P<0.05时认为该标记与目标性状相关联。
2 结果与分析
2.1 蛋白亚基及其组分在供试材料中的变异
分析表 2发现, α、α′和 β亚基的变异程度较大,
变异系数分别为 0.336、0.431和 0.317。A3、A1A2A4
和 B亚基的变异程度较小。11S/7S变异程度最大。
2008 年参试材料的各个性状变异程度高于 2010 年
的, 7S组分的 3个亚基变异程度大于 11S的各亚基
的变异程度。

2.2 供试材料群体 SSR 位点间的连锁不平衡及
其衰减
图 1显示了 134个 SSR位点在各连锁群上的连
锁不平衡状况。在检测的 134 个 SSR 位点的 8 911
种位点组合中, 共线性的组合(同一连锁群)和非共
线性组合(不同连锁群)都有一定程度 LD存在。其中
共线成对位点为 1 779个, 占位点组合的 20.0%。由
D′的次数分布情况我们可以看出大部分 D′值在 0.5
以上(表 3), 连锁不平衡程度较高。
LD 衰减所延伸的距离决定着关联分析所需使
用的标记多寡及关联分析的精度。对共 SSR 位点 D′
值随遗传距离(kb)做回归分析后发现, D′值衰减遵循
方程 Y=b ln (x)+c, 因此当以 D′ 最大值与最小值中
点(0.617)为衰减临界时, 可计算参试样本衰减距离
为 2 060 kb。
2.3 群体结构的分析
群体结构指的是一个群体内存在亚群的情况 ,
是关联分析的前提条件。本研究采用了基于数学模
型的聚类方法分析参试种质的遗传结构, 确定参试
种质亚群数目群体结构。研究发现 ln Pr(X|K)的值持
续增大, 没有拐点, 用∆k来确定 K值。如图 3, 但当
K=5时∆k有一个峰, 因此判断样本亚群数目为 5。K
为 5 时各材料的 Q 值被用于下一步关联分析的研
究中。
2.4 大豆蛋白性状相关联的 SSR标记
通过 TASSEL 软件的 GLM 和 MLM 两种方法,
对蛋白 11S/7S及其各个亚基含量进行关联分析。运
用 GLM方法, 在 2年中均测到的有 14个 SSR位点
与 7个性状相关, 用 MLM方法检测到 5个 SSR位点
与 4个性状相关。表 4列出了各个性状在 2年中均被
第 5期 简 爽等: 运用关联分析定位栽培大豆蛋白 11S、7S组分的相关基因位点 823


表 2 供试材料间蛋白亚基变异程度
Table 2 Variation of protein subunits among accessions
品种间 Among accessions 亚基
Subunit
年份
Year 均值±SD Mean±SD (%) 变幅 Range (%)
变异系数
CV
2008 5.0±3.6 4.95×10–3–12.0 0.717
2010 12.8±4.0 0.6–21.4 0.308
α
平均 Average 8.7±2.9 0.2–16.7 0.336
2008 4.6±3.2 5.00×10–3–21.1 0.706
2010 5.9±3.1 1.22×10–2–16.2 0.516
α′
平均 Average 5.4±2.3 0.5–13.1 0.431
2008 15.0±8.0 2.2–42.5 0.541
2010 15.2±3.8 6.1–28.7 0.247
β
平均 Average 15.0±4.7 5.8–29.3 0.317
2008 7.1±2.5 1.4–22.3 0.355
2010 8.5±2.3 2.6–15.0 0.270
A3
平均 Average 7.8±1.8 3.9–15.3 0.231
2008 23.1±5.1 1.3–33.3 0.220
2010 22.3±3.4 13.3–33.0 0.153
A1A2A4
平均 Average 22.8±3.3 13.4–32.0 0.145
2008 45.5±8.1 11.6–67.8 0.180
2010 35.3±5.9 23.2–54.8 0.167
B
平均 Average 40.4±5.6 20.5–52.6 0.141
2008 3.90±3.001 0.722–25.642 0.770
2010 2.00±0.434 1.108–3.314 0.214
11S/7S
平均 Average 2.94±1.576 1.228–13.745 0.536

图 1 供试材料 SSR 位点间连锁不平衡的分布
Fig. 1 Distribution of LD among SSR loci of accessions
SSR位点以连锁群为单位, 黑色对角线上方的每一像素格使用右侧色差代码表征成对位点间 D′值大小, 对角线下方为成对位点间 LD
的支持概率。
SSR markers are organized in linkage group. Each pixel above the diagonal indicates the values of D′ of the corresponding marker pair as
shown in the color code at the upper right while each pixel below the diagonal indicates the P-value of the testing LD of the corresponding
marker pairs as shown in the color code at the lower right.
824 作 物 学 报 第 38卷

表 3 供试材料 SSR 位点全基因组连锁不平衡程度统计
Table 3 Comparison of D′ of LD for genome wide pairwise SSR loci among accessions
D′的次数分布 Frequency distribution of D′ (P<0.05) LD的成对位点数
No. of LD locus pairs 0.2–0.4 0.4–0.6 0.6–0.8 0.8–1.0
D′的平均值
Mean of D′
1779 (20.0%) 33 724 934 88 0.603



图 2 共线 SSR 位点 D′值在基因组随遗传距离衰减散点图
Fig. 2 Attenuation of D′-value between syntenic marker pairs
along with genetic distance increase

检测到的标记位点及其表型变异的解释率。
在 2008 年的材料中, 运用 GLM 方法检测到的
14个 SSR位点中, Satt583位点被检测到与 3个性状
(β、A1A2A4和 B)呈极显著相关, 解释率分别为 0.29、
0.28和 0.36。Sat_062与 A3相关也达到极显著水平,
解释率很高(0.32)。Satt234 位点被检测到与 2 个性
状(11S/7S、B)相关, 解释率分别为 0.24、0.25。运
用 MLM 方法检测到 10 个位点与 GLM 方法检测到
的位点相同 , 其中 Satt583 位点仍检测到与 β、
A1A2A4和 B相关。
在 2010 年的材料中, 运用 GLM 方法检测到的
14个 SSR位点中, Satt583也与 β、A1A2A4和 B相关,
Sat_062 仍与 A3 相关, Satt234 位点也被检测到与
11S/7S、B 相关。其中 BE801538、Satt234 位点与
11S/7S 显著相关, 解释率也极高(0.33、0.24)。运用
MLM方法检测到 4个位点(Sat_062、Satt583、Satt234
和 Satt595)与性状相关。Satt234、Satt595与 11S/7S
极显著相关, 其中 Satt234解释率达到 0.37。
综合 2 年材料和 2 种方法, 5 个位点(Satt291、
Satt583、Sat_062、Satt234和 Satt595)在 2年材料和
2种方法中均被检测到, 是较为可靠的标记位点。其
中, Satt291、Satt583、Satt234和 Satt595在 2年材料
中测得的解释率也十分接近。
3 讨论
由于 QTL与标记位点的 LD是关联分析的前提
和基础 , 所以在进行关联分析之前研究该群体的
LD情况是十分必要的。Zhu等[23]、Jun等[14]和文自
翔等[21]分别对不同的大豆材料进行了 LD 分析, 我
们发现不同材料的 LD 水平不同, 因此不同的材料
需要根据各自的 LD 水平选用不同数量的标记。本
研究运用 134对 SSR标记进行 LD分析, D′平均值为
0.603, LD衰减距离为 2 036 kb, 大豆全基因组长度
约为 3 000 cM, 134对引物可以进行粗略的全基因组
关联分析。
亚群的混合使整个群体所估计的 LD 强度增强,
可能导致基因多态性位点与性状的相关性并非由功

图 3 STRUCTURE 软件分析预测的 ln P(D)和∆k
Fig. 3 Estimated ln P(D) and ∆k over STRUCTURE analysis
A: 166份材料中 K从 1~10时的 ln P(D)值; B: 166份材料中 K从 2~9时的∆k值。
A: ln P(D) for K from 1 to 10 for 166 lines; B: ∆k for K from 2 to 9 for 166 lines.

第 5期 简 爽等: 运用关联分析定位栽培大豆蛋白 11S、7S组分的相关基因位点 825


表 4 与蛋白亚基显著相关的标记位点及其对表型变异的解释率
Table 4 Marker loci associated with protein subunits and their explained phenotypic variation
2008年 2010年 亚基
Subunit
位点
Locus
图位
Position
(cM)
解释率
R2
P值
P-value
解释率
R2
P值
P-value
α Satt347 (O)42.29 0.28/0.18 7.10x10–3/3.30×10–3 0.21 3.87×10–2
Satt411 (k)46.20 0.19/0.10 7.60×10–3/2.71×10–2 0.26 1.94×10–2 β
Satt583 (B1)84.19 0.29/0.14 1.00×10–6/1.12×10–4 0.27 2.06×10–2
A3 Sat_062 (C2)30.80 0.32/0.21 5.50×10–5/8.42×10–6 0.23/0.13 2.88×10–2/4.52×10–2
AF162283 (G)87.94 0.16 3.76×10–2 0.22 2.25×10–2
Sat_239 (N)87.35 0.31 9.90×10–3 0.37 3.63×10–2
Satt284 (L)38.16 0.13 3.35×10–2 0.17 2.27×10–2
Satt387 (N)53.25 0.14/0.08 1.67×10–2/3.26×10–2 0.17 1.29×10–2
A1A2A4
Satt583 (B1)84.19 0.28/0.15 1.18×10–4/9.23×10–4 0.31/0.15 3.85×10–2/1.01×10–2
Sat_174 (I)36.59 0.14/0.07 6.7×10–3/3.22×10–2 0.1 3.29×10–2
Satt234 (N)84.60 0.25/0.15 3.35×10–2/3.98×10–3 0.23/0.13 2.56 ×10–2/2.15 ×10–2
Satt291 (C2)45.76 0.13/0.07 1.00×10–2/3.38×10–2 0.13/0.07 5.1 0×10–2/8.80 ×10–3
Satt583 (B1)84.19 0.36/0.18 2.60×10–5/1.20×10–3 0.24 1.42×10–2
B
SOYLBC (O)95.00 0.39 3.87×10–2 0.37 2.10×10–2
BE801538 (B1)126.51 0.33 4.55 ×10–2 0.58 5.77 ×10–20
Satt234 (N)84.60 0.24/0.15 2.79×10–2/2.39 ×10–2 0.57/0.37 1.59 ×10–23/3.51 ×10–23
11S/7S
Satt595 (F)50.24 0.21/0.09 4.80×10–3/4.68×10–2 0.18/0.10 2.30×10–3/8.00×10–8
粗体为 MLM方法得出的解释率及显著性 P值; 常规体为 GLM方法得出(P<0.05)。
The numbers in boldface indicate the results by MLM; those in general case indicate the results by GLM (P<0.05).

能性等位基因引起, 从而提供假阳性结果。Li 等[24]
对 1 863 材料整体及其各个亚群均进行了 LD 分析,
也证明 LD 的大小受到群体结构的影响。Yu 等[25]
把群体结构考虑在内和忽略群体结构的模型对比 ,
发现群体结构对关联分析结果影响很大。因此, 进
行关联分析前对群体进行结构分析和调节是必要
的。本研究对多位点基因型数据采用了基于模型的
聚类来分析群体结构(structure analysis, SA), 得出
K=5, 并计算出各个体归入各亚群的概率(Q 值)。该
方法与基于遗传距离的聚类方法相比, 主要优点是
排除了亚类划分的人为因素[26]。另外, 各个体 Q 值
作为协变量纳入回归分析, 可以矫正亚群混合造成
的伪关联。
本研究采用 TASSEL软件的GLM和MLM程序
处理表型变异与 SSR 位点等位变异, 不需要单独构
建图谱进行 QTL分析, 比较简单直观, 且对 QTL的
检测能力较高, 缺陷是不能估计 QTL的具体位置及
其加性、上位性效应, 理想的方法是家系连锁定位
与关联分析相结合。
7S组分各亚基的变异系数较大, 其中以 α亚基
的变异系数最大。α 亚基未检测到在 2 年中均稳定
存在的相关联位点。Panthee等[10]的研究结果也表明,
α 亚基变异程度较大, 但仅定位到 1 个位点 Satt461
(D2)与 α亚基相关联。本研究选用的 D2连锁群的 5
个标记(Satt443、Satt447、Sat_338、Satt186和 Satt310)
与 Satt461相距最近的也有约 3 000 kb, 本研究材料
衰减距离为 2 026 kb, 所以未在该群体中检测到任
何位点也是有可能的。或许是控制 α 亚基的基因附
近在进化过程中发生了多次重组, 产生了更多的等
位变异, 在资源材料中其表型变异丰富, 表现为变
异系数较大, 但其 LD衰减距离较小, 可能需要进一
步加密标记才能检测。 α′亚基检测到一个位点
satt347(O)与其相关, 而且 α′亚基在年份间的变化较
小 , 说明遗传力较高 , 品种间的差异较大 , 说明其
通过遗传改良的潜力较大, 运用该标记做分子标记
选择有可能选育出高 α′或低 α′含量的品种。β 亚基
检测到 2个位点(Satt441、Satt583)与其相关。Satt441
与 Specht等[27]研究中定位到的与蛋白含量相关的基
因位点 Satt178相距约 250 kb。Satt583与 β、A1A2A4、
B均相关。又因 11S/7S 较小的品种中, 大部分 β 亚
基显著增加、B 亚基减少, 所以 Satt583 有可能与 β
正相关, 与 B 亚基负相关, 对选育低 11S/7S 的品种
更有价值。
11S 各亚基的变异系数较小, 但是检测出来的
826 作 物 学 报 第 38卷

QTL位点较多, 与 7S各亚基比较, 可能 11S组分的
各亚基相关基因在进化过程中发生重组次数较少 ,
基因的等位变异少、表型效应较为稳定, 即在这些
基因位点附近, LD 衰减距离较长, 较少的标记就能
检测到。A1A2A4亚基和 B亚基分别定位到 5个位点,
分别为 AF162283、Sat_239、Satt284、Satt387 和
Satt583 及 Sat_174、Satt234、Satt291、Satt583 和
SOYLBC。A3亚基检测到一个标记 Sat_062。其中与
B 亚基相关联的 Sat_174 位于 Chung 等[28]定位到的
与蛋白含量相关的基因位点 Satt496附近, 其他位点
未见报道。有研究表明 A1A2A4亚基与豆腐出品率、
豆腐硬度呈显著正相关; B 亚基与豆腐出品率呈显
著正相关[5]。我们检测到的 Satt583、Satt234、Satt291
这 3 个标记在 2 年材料均被检测到, 我们可以利用
这些标记, 进行分子标记辅助育种, 选育出适合加
工豆腐的品种。程翠林等[5]表明 A3酸性亚基与豆腐
出品率和豆腐硬度相关性均不显著, Poysa等[29]研究
则认为 A3 亚基对豆腐凝胶硬度起重要作用。因此,
A3亚基的作用还需要进一步的研究探讨。
11S/7S变异系数较大, 2年的差异较大。定位到 3
个位点 BE801538、Satt234和 Satt595, 其中 Satt234、
Satt595通过 2种方法在 2年中均被检测到。分析发
现, 11S/7S 较小的品种, 大部分是由 β 亚基显著增
加、B 亚基减少而造成。11S/7S 较大的品种, 大部
分 α、α′亚基百分含量极少。由此可见, 不同品种间
7S组分各亚基变异程度较 11S大, 7S各亚基是引起
11S/7S变异程度较大的主要原因, 因此 7S各亚基更
容易通过遗传改良的方法改变其含量。7S组分的基
因至少有 15个家族成员[30], 而 11S组分的家族成员
较少[31], 多基因性状环境变异较大, 这也可能是 7S
组分变异程度较大的一个原因。11S 含有丰富的含
硫氨基酸, 而且 11S 与 7S 显著负相关[3], 增加 11S
降低 7S 可以提高大豆蛋白的营养品质[1], 从驯化的
过程中可以看出总的趋势是增加 11S含量降低 7S含
量, 所以我们期望得到 11S 含量较高的品种。还有
研究表明 7S 组分的乳化能力和溶解度较高[32], 为
适应一些加工要求, 也需要低 11S/7S 的品种。这 3
个与 11S/7S 相关标记将对今后选育高 11S/7S 或低
11S/7S 品种有重要意义。而且 Satt234 还与 B 亚基
相关, 可能是与 11S 组分关联比较紧密, 更是一个
重要的位点。
与多种性状关联的 SSR位点分析发现: (1)同一
位点与多个性状相关联情况很普遍。如 Satt583位点
与 β、A1A2A4、B亚基有关联, Satt234位点与 11S/7S、
B 有关联。该结果表明大豆蛋白性状表型的相关是
确有其内在遗传因素的。同一个标记位点与多个性
状相关联可能是性状相关乃至多基因效性的遗传基
础。11S/7S与 2个位点(Satt234、Satt595)相关, B亚
基与 2个位点(Satt234、Satt291)相关, 表明大豆蛋白
同一亚基可能受多个基因的影响。(2)同一性状在
2008 年和 2010 年中检出的关联位点有很多不一致
(未在表中列出 ), 说明单年位点受环境影响较大 ,
本文只列出了年份间稳定的位点, 对于育种更有价
值。(3)有些位点附近可能发生了较多的重组事件,
产生更多的等位变异, 因而表型变异较大, 但是 LD
衰减距离较小, 受到标记数目的限制, 实验中检测
到的位点反而较少。也可能因为所选择的材料数目
和标记数目相对较少, 以及与所采用的线性回归相
关的方法有关。由于材料间性状差异较大, 导致决
定系数相对较小, 因此必须加大群体的标记量, 才
能获得有效结果。
4 结论
发现 5 个 QTL (Sat_062、Satt583、Satt291、
Satt234 和 Satt595)与 11S、7S 组分不同亚基相对含
量及 11S/7S 比值相关。其中 Satt583、Satt234 与多
个亚基性状相关, 可能是重要的 QTL, 有进一步分
析利用的价值; 7S 各亚基相对含量变异较大是引起
11S/7S 比值变异程度较大的主要原因, 在遗传改良
中有更重要的价值。对于表型变化较大的亚基, 利
用关联分析检测到的位点较少, 可能是因为该亚基
相关基因附近发生了较多重组, LD 衰减距离较小,
也可能与试验材料间性状差异较大有关。

致谢: 核心种质材料由中国农业科学院作物科学研
究所邱丽娟研究员提供, 谨致谢意。
References
[1] Fukushima D. Recent progress of soybean protein foods: chemis-
try, technology and nutrition. Food Rev Intl, 1991, 7: 323−351
[2] Tayama T E, Kitamura K. Genetic improvement of seed storage
protein using three variant allele sofglob-ulinubunts in soybean.
Jpn J Breed, 1989, 39: 137−147
[3] Huang L-H(黄丽华), Ma H(麻浩), Wang X-S(王显生), Cui
G-X(崔国贤). Study on 11S and 7S fractions of seed storage
proteins in soybean seeds. Chin J Oil Crop Sci (中国油料作物学
报), 2003, 25(3): 20−23 (in Chinese with English abstract)
[4] Liu S-S(刘珊珊), Tian F-D(田福东), Gao L-H(高丽辉), Wang
第 5期 简 爽等: 运用关联分析定位栽培大豆蛋白 11S、7S组分的相关基因位点 827


Z-K(王志坤), Ge Y-J(葛玉君), Diao G-Z(刁桂珠), Li W-B(李文
滨). Effect of subunit composition of 7S globulin on soybean
quality characteristics. Acta Agron Sin (作物学报), 2008, 34(5):
909−913 (in Chinese with English abstract)
[5] Cheng C-L(程翠林), Wang Z-Y(王振宇), Shi Y-G(石彦国),
Zhao H-T(赵海田). Effect of soy protein subunits composition
and ratio of 7S to 11S on the quality and productivity of tofu.
China Oils Fats (中国油脂), 2006, 31(4): 16−19 (in Chinese
with English abstract)
[6] Liu S-S(刘珊珊), Wang Z-K(王志坤), Ge Y-J(葛玉君), Diao
G-Z(刁桂珠), Tian F-D(田福东), Gao L-H(高丽辉), Li W-B(李
文滨). Correlations between relative content of individual sub-
unit of 7S globulin and quality characteristics in soybean germ-
plasm. Chin J Oil Crop Sci (中国油料作物学报), 2008, 30(3):
284−289 (in Chinese with English abstract)
[7] Ma H(麻浩), Wang X-S(王显生), Liu C(刘春), Yu T(俞阗), Hao
X-Y(郝小燕), Gao W-R(高文瑞), He X-L(何小铃). The content
variation of 7S, 11S globulins and their subunits of seed storage
protein of 706 Chinese soybean germplasm. Soybean Sci (大豆科
学), 2006, 25(1): 11−17 (in English with Chinese abstract)
[8] Wang L-X(王丽侠), Guo S-T(郭顺堂), Fu C-Z(付翠真), Guan
R-X(关荣霞), Zhang Q-S(张其属), Chang R-Z(常汝镇), Qiu
L-J(邱丽娟). The analysis of 11S/7S in soybean storage protein.
Chin Cereals Oil Assoc (中国粮油学报), 2004, 19(4): 64−66 (in
Chinese with English abstract)
[9] Liu S-H(刘顺湖), Zhou R-B(周瑞宝), Yu D-Y(喻德跃), Chen
S-Y(陈受宜), Gai J-Y(盖钧镒). QTL mapping of protein related
traits in soybean [Glycine max (L.) Merr.]. Acta Agron Sin (作物
学报), 2009, 35(12): 2139−2149 (in Chinese with English ab-
stract)
[10] Panthee D R, Kwanyuenb P, Samsa C E, Westa D R, Saxtonc A
M, Pantalonea V R. Quantitative trait loci for β-conglycinin (7S)
and glycinin (11S) fractions of soybean storage protein. J Am Oil
Chem Soc, 2004, 81: 1005−1012
[11] Ruth E M. Gene mapping by linkage and association analysis.
Mol Biotechnol, 1999, 3: 113−122
[12] Eizenga G C, Agrama H A, Lee F N, Yan W, Jia Y. Identifying
novel resistance genes in newly introduced blast resistant rice
germplasm. Crop Sci, 2006, 46: 1870−1878
[13] Flint-Garcia S A, Thuillet A, Yu J, Pressoir G, Romero S M,
Mitchell S E, Doebley J F, Kresovich S, Goodman M M, Buckler
E S. Maize association population: a high resolution platform for
QTL dissection. Plant J, 2005, 44: 1054−1064
[14] Jun T H, Van K, Kim M Y, Lee S H. Association analysis using
SSR markers to find QTL for seed protein content in soybean.
Euphytica, 2008, 162: 179−191
[15] Qiu L-J(邱丽娟), Li Y-H(李英慧), Guan R-X(关荣霞), Liu
Z-X(刘章雄), Wang L-X(王丽侠), Chang R-Z(常汝镇). Es-
tablishment, representative testing and research progress of
soybean core collection and mini core collection. Acta Agron
Sin (作物学报), 2009, 35(4): 571−579 (in Chinese with Eng-
lish abstract)
[16] Gai J-Y(盖钧镒), Wang Y-S(汪越胜). A study on the varietal
eco-regions of soybeans in China. Sci Agric Sin (中国农业科学),
2001, 34(2): 139−145 (in Chinese with English abstract)
[17] Wang H-L(王红玲), Chen S-G(陈少光), Xiang S-P(向世鹏),
Chen C(陈晨), Hao X-Y(郝小燕), Ma H(麻浩). Effects of cli-
mate factors on the relative contents of major storage protein
fractions and its subunits in soybean seeds. Chin J Oil Crop Sci
(中国油料作物学报), 2007, 29(4): 431−437 (in Chinese with
English abstract)
[18] Wang X-S(王显生), Ma H(麻浩), Xiang S-P(向世鹏), Zhang
G-Z(张国正), Cui G-X(崔国贤). The resolving effect of soybean
storage protein subunits under different separation gel concentra-
tions of SDS-PAGE. Chin J Oil Crop Sci (中国油料作物学报),
2004, 26(2): 75−80 (in Chinese with English abstract)
[19] Doyle J J, Doyle J I. Isolation of plant DNA from fresh tissue.
Focus, 1990, 12: 149−151
[20] Song Q J, Marek L F, Shoemaker R C, Lark K G, Concibido V C,
Delannay X, Specht J E, Cregan P B. A new integrated genetic
linkage map of the soybean. Theor Appl Genet, 2004, 109:
122−128
[21] Wen Z-X(文自翔), Zhao T-J(赵团结), Zheng Y-Z(郑永战), Liu
S-H(刘顺湖), Wang C-E(王春娥), Wang F(王芳), Gai J-Y(盖钧
镒). Association analysis of agronomic and quality traits with
SSR markers in Glycine max and Glycine soja in China: I. Popu-
lation structure and associated markers. Acta Agron Sin (作物学
报), 2008, 34(7): 1169−1178 (in Chinese with English abstract)
[22] Evanno G, Regnaut S, Goudet J. Detecting the number of clusters
of individuals using the software STRUCTURE: a simulation
study. Mol Ecol, 2005, 14: 2611−2620
[23] Zhu Y L, Song Q J, Hyten D L, Van Tassell C P, Matukumalli L
K, Grimm D R, Hyatt S M, Fickus E W, Young N D, Cregan P B.
Single nucleotide polymorphisms in soybean. Genetics, 2003,
828 作 物 学 报 第 38卷

163: 1123−1134
[24] Li Y H, Guan R X, Liu Z X, Ma Y S, Qiu L J. Genetic structure
and diversity of cultivated soybean (Glycine max (L.) Merr.)
landraces in China. Theor Appl Genet, 2008, 117: 857−871
[25] Yu J M, Gael P, William H B. A unified mixed-model method
for association mapping that accounts for multiple levels of re-
latedness. Nat Genet, 2006, 38: 203−207
[26] Gupta P K, Rustgi S, Kulwal P L. Linkage disequilibrium and
association studies in higher plants: present status and future
prospects. Plant Mol Biol, 2005, 57: 461−485
[27] Specht J E, Chase K, Macrander M, Graef G L, Chung J, Markwell J
P, Germann M, Orf J H, Lark K G. Soybean response to water: a QTL
analysis of drought tolerance. Crop Sci, 2001, 41: 493−509
[28] Chung J, Babka H L, Graef G L, Staswick P E, Lee D J, Cregan P
B, Shoemaker R C, Specht J E. The seed protein, oil, and yield
QTL on soybean linkage group I. Crop Sci, 2003, 43: 1053−1067
[29] Poysa V, Woodrow L, Yu K. Effect of soy protein subunit com-
position on tofu quality. Food Res Intl, 2006, 39: 309−317
[30] Harada K, Barker S, Goldberg R. Soybean β-conglycinin genes
are clustered in several DNA regions and are regulated by tran-
scriptional and posttranscriptional processes. Plant Cell, 1989, 1:
415−425
[31] Moreira M A, Hermodson M A, Larkins B A, Nielsen N C. Par-
tial characterization of the acidic and bacidic polypeptides of
glycinin. Biol Chem, 1979, 254: 9921−9926
[32] Chen H-M(陈海敏), Hua Y-F(华欲飞). Effects of various culti-
vars on functionalities of soy protein. China Western Cereals
Oils Technol (西部粮油科技), 2001, 26(3): 36−38 (in Chinese
with English abstract)



科学出版社生物分社新书推介
《油料作物育种学》现代生物农业系列丛书
卢长明 译
出版时间:2012 年 3 月
书号:978-7-03-033795-5
定价:¥98.00
本书对主要油料作物育种的发展现状和趋势进行了综述。内容包括
总论(油料作物遗传育种、食用与非食用植物油的遗传改良)和各论(大
豆、油菜、向日葵、亚麻、棉花、花生、蓖麻、油棕、可可、红花、罂
粟、油用南瓜、油用玉米、Lesquerella(一种新型工业用油料作物)。总
论阐述了油料作物进化、遗传多样性、育种的重大突破以及食用与非食
用植物油遗传改良研究进展。各论对不同油料作物的研究趋势和进展进
行了综述。本书充分反映了世界油料作物遗传育种发展的最新动态和趋
势,对我国油料作物育种具有很强的指导意义。

获取更多图书信息请您关注: http://www.lifescience.com.cn/
欢迎各界人士邮购科学出版社各类图书
联系人: 科学出版社科学销售中心 周文宇 E-mail: zhouwenyu@mail.sciencep.com
联系电话: 010-64022646 010-64017321
网上订购: http://shop.sciencepress.cn 卓越网 当当网 京东图书 学士书店
更多精彩图书请登陆网站, 欢迎致电索要书目
ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ ˆˇˆ ˇˆˇ