免费文献传递   相关文献

A Genetic Analysis Method of Major-Minor Locus Groups in diallel Cross Design

双列杂交设计的主-微位点组遗传分析方法研究



全 文 :作物学报 ACTA AGRONOMICA SINICA 2010, 36(8): 1248−1257 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn

本研究由国家重点基础研究发展计划(973计划)项目(2006CB101708, 2009CB118404, 2010CB125906), 国家高技术研究发展计划(863计划)
项目(2006AA100104), 国家科技支撑计划项目(2006BAD13B05-7), 国家自然科学基金项目(30490250, 32671266), 教育部高等学校创新引智计
划项目(B08025)和农业部公益性行业科研专项(200803060)资助。
*
通讯作者(Corresponding authors): 管荣展; 盖钧镒, Tel. 025-84395405; E-mail: sri@njau.edu.cn
第一作者联系方式: E-mail: hjbxyz@gmail.com
Received(收稿日期): 2010-01-15; Accepted(接受日期): 2010-04-17.
DOI: 10.3724/SP.J.1006.2010.01248
双列杂交设计的主-微位点组遗传分析方法研究
贺建波 管荣展* 盖钧镒*
南京农业大学大豆研究所 / 国家大豆改良中心 / 作物遗传与种质创新国家重点实验室, 江苏南京 210095
摘 要: 数量性状遗传研究通常以双亲本杂交后代为对象, 而作物育种中常涉及多个具有优良性状的亲本作为有利
基因的供体, 因此有必要研究多个材料间的遗传关系, 以便从中选择最佳亲本组合, 这对杂种品种选育尤其重要。本
研究在以往位点组分析方法的基础上, 将其扩展为主基因+多基因遗传模型框架下双列杂交设计的主-微位点组遗
传分析方法, 将微位点组从原来的剩余部分中分离出来。该方法针对双列杂交设计的主位点组和微位点组及其与环
境互作的统计遗传模型提出了主位点组检测与效应估计和微位点组效应估计的逐步选入回归法; 因模拟实验发现逐
步选入回归法的 F 测验有偏, 提出了 F 测验的调整方法。利用模拟方法评估了遗传率、主位点组个数、增效基因型
频率、主位点组间相似性和微基因效应等因素与方法功效的关系。然后通过模拟实验数据和油菜实际试验数据的分
析验证了所提方法的应用效果。本研究建立的双列杂交设计的主-微位点组遗传分析方法为杂种品种的亲本选配提供
了方法和理论依据。
关键词: 双列杂交遗传设计; 主基因加微基因遗传模型; 主位点组; 微位点组; 逐步回归
A Genetic Analysis Method of Major-Minor Locus Groups in Diallel Cross Design
HE Jian-Bo, GUAN Rong-Zhan*, and GAI Jun-Yi*
Soybean Research Institute, Nanjing Agricultural University / National Center for Soybean Improvement / National Key Laboratory for Crop Gene-
tics and Germplasm Enhancement, Nanjing 210095, China
Abstract: Studies on inheritance of quantitative traits are usually based on two-way crosses, while in plant breeding, knowledge
on inheritance of traits among a group of parental materials is needed since elite genes or QTLs are scattered in different materials.
It is especially true in breeding for hybrids. Based on our previous studies on major locus group analysis among a set of parents,
we aimed at extending the analysis to major-minor locus groups in diallel cross experiment. The statistical method was derived
from a forward stepwise regression for identifying major locus groups and estimating their genetic effects as well as the estimation
of genetic effect of collective minor locus groups. In which the procedure of adjusting F criterion was raised since biased F-test
was found in a simulation study. Then the procedure was used to evaluate the relationship between its power and some factors,
including heritability value, number of major locus groups, genotypic frequency with increment alleles, similarity among major
locus groups and effect of collective minor locus groups. A simulated diallel cross experiment was used to demonstrate the effec-
tiveness of the procedure. A diallel cross experiment on days to flowering of rapeseed was given to show the statistical steps and
its utilization. The procedure of major-minor locus group analysis in diallel crosses based on major gene plus polygene inheritance
model provides a way to analyze the genetic constitution of a group of parental materials for obtaining the best hybrid combina-
tions.
Keywords: Diallel cross design; Major gene and polygene model; Major locus group; Minor locus group; Stepwise regression
数量性状遗传研究通常以双亲本杂交后代为对
象, 而作物育种中常涉及多个具有优良性状的亲本
作为有利基因的供体, 因此有必要研究多个材料间
的遗传关系, 以便从中选择最佳亲本组合, 这对杂
种品种选育尤其重要。育种实践发现有些现象与数
量性状微效多基因假说不符, 有的测度是数量化的
第 8期 贺建波等: 双列杂交设计的主-微位点组遗传分析方法研究 1249


但已发现受主基因控制, 利用分子标记可以定位到
控制数量性状的基因。根据上述遗传现象, 盖钧镒
等[1]提出了数量性状遗传体系的泛主基因加多基因
假设。该假设认为, 控制数量性状的基因数目有多
有少, 各基因效应大小不同且受环境影响; 效应较
大的、在一般试验条件下可以检测出来的称为主基
因, 效应小的、在现有试验条件下检测不出来的称
为多基因或微基因; 主基因与多基因是相对的, 数
量性状遗传体系可能仅由主基因组成, 也可能仅由
多基因组成, 也可能由主基因和多基因共同组成。
将主基因和多基因同时组成的数量性状遗传体系称
为主基因和多基因(微基因)混合遗传体系; 将纯主
基因或纯多(微)基因遗传模式看作主基因加多基因
混合遗传体系的特例。
双列杂交设计是对一组亲本间进行各种可能交
配的遗传设计, Schmidt (1919)最早讨论了它的应用,
其目的是估计在杂种组合中产量变异的遗传成分和
估计杂交组合的实际生产能力。Sprague 和 Tatum[2]
在异花授粉作物上提出配合力的概念, 并运用双列
杂交设计进行配合力分析。此后双列杂交被广泛地
应用于作物遗传和育种研究。Griffing[3]提出了双列
杂交设计的各种类型及其相应的固定模型和随机模
型的分析方法。Griffing的固定模型分析方法曾广泛
应用于亲本的配合力分析; 而随机模型分析方法则
常用于遗传效应的分析。朱军[4]将最小范数二阶无
偏估计 (MINQUE)方法应用于双列杂交遗传分析 ,
可以估计随机遗传效应的方差并估计遗传效应。
Dudley[5]利用双列杂交设计提出了亲本基因型的解
析方法。在 Dudley的基础上, 管荣展等[6-8]提出了双
列杂交设计亲本位点组的分析方法。
在双列杂交遗传设计中, 组合的基因型是由亲
本的基因型决定的, 组合的遗传变异是由亲本的遗
传差异决定的。因此只要知道了亲本间的遗传差异,
也就知道了组合的基因型差异。差异是在有两个以
上的亲本时才可能表现出来的 , 假定无复等位性 ,
单个基因时, 两个纯合亲本(P1 和 P2)间可能的差异
最多有 4 种类型, 即 P1和 P2的基因均是增效的; P1
的基因是增效的, P2的基因是减效的; P1的基因是减
效的, P2的基因是增效的; P1和 P2的基因均是减效的
(表 1)。此处将每一种称为一个差异类型, 当亲本数
较少时, 同一种差异类型, 可能不仅是一个基因上
的差异, 而是许多相同差异类型的基因的聚合, 由
于这种聚合使遗传差异表现为某些基因效应的组合,
故将其称为位点组(locus group), 相应的差异类型称
为位点组差异类型。以“++”代表正向效应的基因
聚合, 称为++位点组基因型, “– –”代表负向效应
的基因聚合, 称为– –位点组基因型, 故可将 4 种遗
传差异类型用位点组描述出来(表 1)。同理, n个亲本
间最多可能有 2n个位点组。当亲本较多时, 位点组
内包含的相同差异类型的基因数将越来越少, 甚至
仅含个别基因, 这便构成了通过双列杂交设计解析
基因位点的基础[5-8]。
本研究在以往位点组分析的基础上, 将其扩展
到在主基因加多基因遗传模型下的双列杂交设计主-
微位点组遗传分析方法。首先给出双列杂交设计的
主位点组和微位点组及其与环境互作的遗传模型 ,
通过推导再给出主位点组检测与效应估计和微位点
组效应估计的统计方法, 然后通过方法功效的模拟
证明该方法对主位点组的检测及效应估计的有效性,
进一步通过实例分析验证该方法的应用效果。

表 1 两个亲本间一个位点组可能的 4 种遗传差异
Table 1 Four differential types of a single locus group between
two parents
差异类型序号
Serial number of differential type
P1 P2
1 ++ ++
2 ++ – –
3 – – ++
4 – – – –

1 方法推演
按统计遗传研究的惯例, 本研究方法推演的基
本遗传假定为 , 二倍体遗传 , 无复等位基因 , 无细
胞质效应, 正常的减数分裂、配子发育与结合和合
子发育过程。
1.1 位点组基因型的数学描述
将各种位点组差异类型进行有序排列(表 1), 便
可将每一个位点组用数学的方法表述出来。设 i和 k
是亲本的序号, 记 Pi为第 i 个亲本, 并记 Pk为第 k
个亲本, J是位点组差异类型的序号, f (i, J)是 i和 J
的函数, 利用该函数可以通过亲本编号和差异类型
序号计算基因型, 可表示如下:
( , ) [ 1]xf i J = −
其中, x = int[ (J – 0.5) / 2n−i ], n为亲本的总数,
int为取整函数。
设 G( i, J )为 Pi的位点组 J的基因型, 那么可推
1250 作 物 学 报 第 36卷

断为:
( , ) if ( , ) 1
( , ) if ( , ) 1
G i J f i J
G i J f i J
= + + =⎧⎨ = − − = −⎩

设 G(i, k, J)为 Pi与 Pk的杂交组合的位点组 J的
基因型, 该基因型决定于亲本序号 i和 k以及差异类
型序号 J, 那么基因型 G( i, k, J )的数学描述为:
( , , ) if ( , , ) 1
( , , ) if ( , , ) 0
( , , ) if ( , , ) 1
G i k J f i k J
G i k J f i k J
G i k J f i k J
= + + =⎧⎪ = + − =⎨⎪ = −− = −⎩

其中, f ( i, k, J ) = [ f ( i, J ) + f ( k, J ) ] / 2。
由此, 只要能知道位点组差异类型序号 J, 便可
知道亲本的位点组基因型。对于由 Pi和 Pk得到的组
合, 设 Gik为其位点组 J的基因型值, 可表述为:
if ( , , )
if ( , , )
if ( , , )
ik
ik
ik
G a G i k J
G d G i k J
G a G i k J
= = + +⎧⎪ = = + −⎨⎪ = − = − −⎩

其中, a、d分别为位点组 J的加性和显性效应。
按加性-显性遗传模型可将各个位点组的基因
型值加起来, 则对于由 Pi和 Pk得到的组合, 其基因
型值 Gik可表示为:
2( , ) ( , ) [ ( , ) ( , )]
2 4ik J JJ
f i J f k J f i J f k JG a d
⎧ ⎫+ −⎪ ⎪= +⎨ ⎬⎪ ⎪⎩ ⎭∑
1.2 主-微位点组遗传模型
数量性状的基因中既有遗传效应较大的主基因,
又有遗传效应较小的微基因, 数量性状主基因和微
基因的共同作用构成了控制数量性状的主基因加微
基因遗传体系[1]。在双列杂交位点组分析中, 位点组
可分为主位点组和微位点组。主位点组的效应和遗
传方差均比较大 , 可利用统计方法对其进行鉴别 ,
微位点组效应和遗传方差均比较小或很小, 无法利
用统计方法直接鉴别单个微位点组, 但可将其作为
一个整体检验其显著性。据此, 位点组遗传模型相
应地可拓展至主位点组加微位点组遗传模型。
设置区组(重复)的试验设计不仅可以提高试验
的精度和准确性, 还可以检验微位点组效应的显著
性。对于设有区组试验的双列杂交, 组合的表型值
可表述为组合效应、区组效应与随机误差之和, 可
利用方差分析测验组合间的差异显著性, 双列杂交
数据方差分析的固定模型为:
ikl ik l ikly C B eμ= + + +
其中, yikl为第 i个亲本和第 k个亲本的杂交组合
在第 l 个区组的表型值, μ 为总体平均数, Cik为第 i
个亲本和第 k个亲本的杂交组合的效应, Bl为第 l个
区组的效应, 组合与区组均为固定效应, eikl 为随机
误差效应且 eikl ~ N(0, σ2)。
如果组合间的差异显著, 说明存在显著的遗传
变异, 有必要继续分析遗传变异, 这时组合的效应
Cik可进一步被分解为主位点组效应 Gik和微位点组
效应 Wik 之和, 则双列杂交的主-微位点组遗传模
型为:
ikl ik ik l ikly G W B eμ= + + + +
式中符号定义同上, 主位点组、微位点组和区
组效应为固定效应, eikl为随机误差效应且 eikl ~ N(0,
σ2)。
微位点组是数量较多、效应微小的位点组的累
加, 其效应为组合的效应去掉主位点组效应后剩余
的效应, 在不同组合上有不同的微位点组效应, 因
此组合的微位点组效应 Wik为:
( )
[ ] if
[ ] [ ] 2 [ ] if
i
ik
i k ik
a i k
W
a a d i k
=⎧= ⎨ + + ≠⎩

其中, [a]、[d]分别为微位点组的加性总效应与
显性总效应。
1.3 主-微位点组与环境互作遗传模型
植物数量性状一般由基因型值、环境效应和基
因型与环境互作效应三部分组成。多环境下的试验
可提高精度, 并能研究基因与环境互作。对于多个
环境的双列杂交随机区组试验设计, 组合的表型值
可分解为组合效应、环境效应、组合与环境互作效
应、区组效应与随机误差之和, 双列杂交数据方差
分析的固定模型为:
( )( )iktl ik t ikt l t iktly C E CE B eμ= + + + + +
其中, yiktl为第 i 个亲本和第 k 个亲本的杂交组
合在第 t 个环境的第 l 个区组下的表型值, μ 为总体
平均数, Cik为第 i个亲本和第 k个亲本的杂交组合的
效应, Et为第 t个环境的效应, (CE)ikt为组合与环境的
互作效应, Bl为嵌套在第 t个环境下的第 l个区组的
效应, 组合、环境与区组均为固定效应, eiktl 为随机
误差效应且 eiktl ~ N(0, σ2)。
如果组合间的差异显著, 将组合的效应进一步
分解为主位点组效应 Gik与微位点组效应 Wik, 则主-
微位点组与环境互作遗传模型为:
( )( ) ( )iktl ik t ikt l t ik ikt iktly G E GE B W WE eμ= + + + + + + +
其中, (GE)为主位点组与环境互作效应, (WE)为
微位点组与环境互作效应, 其他符号定义同上, 主
位点组、微位点组、主微位点组与环境互作效应和
区组效应为固定效应, eikl 为随机误差效应且 eiktl ~
第 8期 贺建波等: 双列杂交设计的主-微位点组遗传分析方法研究 1251


N(0, σ2)。
1.4 位点组基因型与效应的估计
上述模型中, 将微位点组、微位点组与环境互
作及误差项以外的所有项合并后, 模型可改写为:
( )Y Xb W WE e= + + +
其中, Y为表型值, b为回归系数, 是由回归截距、主
位点组加性与显性效应、环境效应、主位点组与环
境互作效应以及区组效应组成的列向量, 设 N 为观
察值个数, m为主位点组个数, t为环境数, l为区组数,
则设计矩阵 X 是由截距、主位点组、环境、主位点
组×环境和区组效应的指示变量组成的 N× [1+2m+t+
2mt+t(l–1)]的矩阵, W为微位点组效应列向量, (WE)
为微位点组与环境互作效应矩阵, e为误差向量。
模型分析的核心是检测主位点组。由于 n 个亲
本时位点组差异类型 J 的取值范围是从 1到 2n的有
限个整数, 故可利用逐步选入回归法, 通过上述模
型筛选出所有显著的位点组, 即估计出亲本的主位
点组基因型。由于 J=1 和 J=2n时, 亲本间实际上并
无差异, 不需重复分析, 模型分析时应将这两种情
况剔除; 又 J=2与 J=2n−1时亲本间的差异结构相同,
依次类推; 所以 J应取从 2到 2n–1的整数。当试验设
有区组或者多环境时, 还可以通过方差分析检验亲
本及组合间差异的显著性, 并估计误差均方 MSe。如
果亲本及组合间的差异在给定水平下显著, 说明亲
本及组合间存在显著的遗传变异, 有必要分析亲本
间的遗传差异, 这时亲本及组合的效应将被剖分为
主位点组和微位点组效应两部分。在逐步回归中可
通过 F 测验来检验位点组的显著性, 本文模型中主
位点组变异用误差方差来检验其显著性, 若设 SSGk
是第 k 步回归中待加入主位点组的平方和, 则检验
第 k个主位点组效应显著性的 F测验统计量为:
( / 2) /
k kG G eF SS MS=
当检测到所有显著的主位点后, 还可以检验微
位点组效应的显著性, 微位点组效应的平方和 SSW
等于方差分析中组合效应的平方和 SSC 减去主位点
组效应的平方和 SSG, 即 SSW = SSC − SSG, 使用误差
方差检验其显著性, 这里不再赘述。
回归模型的回归系数 1( )b X X X Y−′ ′= , 其中符
号同上。
若微位点组效应显著, 还可以估计出其加性、
显性效应, 设 γ为微位点组加性、显性效应所组成的
列向量,
1( ) ( )G GD D D Y X bγ −′ ′= −
其中, Y 为组合平均数, bG为主位点组加性、显性效
应所组成的列向量, XG 为主位点组效应指示变量组
成的 N×2m的矩阵, D为微位点组效应指示变量组成
的 n(n+1)/2行 n(n+1)/2列的设计矩阵, n为亲本个数。
1.5 主位点组假发现率估计和 F测验的改进
为研究假设测验方法在本文方法中的效率, 对
逐步选入回归法中 F 统计量进行了分析。本研究模
拟了 10个亲本、误差方差为 1的无主位点组效应的
完全双列杂交数据, 使用逐步选择算法分析, 并记
录检测一个最显著主位点组的 F测验的 F值。此时
由于实际上并无主位点组, 所以 F 值服从 F 分布,
共进行 10 000 次重复模拟。模拟数据显示 F 值的
95%分位点为 9.67, 而在逐步回归中采用的是自由
度为(2, 97)的 F分布的 95%分位点 3.09, 因此模型的
假阳性率较高。在逐步选择过程中, 总是先找到使
得模型的离差平方和最小的一个主位点组, 所以假
设检验时的 F 统计量的值是一个最大值, 由此可利
用顺序统计量[9]的极大值的分布推算出逐步回归中
F统计量极大值的分布函数 Fmax(x)和密度函数 fmax(x)。
[ ] 12 1max ( ) ( ) nF x F x − −= ,
[ ] 12 2max ( ) ( ) ( )nf x n F x f x− −=
其中, n为双列杂交设计中亲本的个数, F(x)和 f(x)为
F分布的分布函数和概率密度函数。
由 F统计量值的分布曲线(图 1-B)可以看出, 利
用顺序统计量估计的分布的 0.95和 0.99分位点和模
拟数据的分位点几乎没有差异, 可顺序统计量(F 极
大值分布)的测验临界值作为 F测验的临界值, 从而
降低假阳性率, 但又不会影响主位点组检测功效。
根据模拟结果, 显著水平设置为 0.01 时, 主位点组
检测效果更佳, 因此后文模拟研究以及实例分析均
采用此临界值做假设测验。
2 方法功效的模拟评估
为了对主-微位点组遗传分析方法进行评价, 进
行了 5 组模拟研究。前 4 组模拟中主位点组筛选方
法采用 2 种策略: (1) 可能模型筛选(possible model
selection, PMS), 即对所有可能的模型进行穷举, 通过
比较得到最佳的模型; (2) 逐步筛选(stepwise model
selection, SMS)。模拟的试验均为 10 个亲本的完全
双列杂交试验, 并进行 200次重复。使用功效(power)
1252 作 物 学 报 第 36卷



图 1 模拟的 F 统计量极大值的次数分布(A); 模拟的 F 统计量极大值的分布函数、理论分布函数和估计的分布函数(B)
Fig. 1 Histogram of simulated F-value (A); theoretical, simulated and estimated distribution functions of F-value (B)

和假发现率(false discovery rate, FDR)两个指标来评
价, 功效是重复模拟样本中检测到真实主位点组的
频率, 反映了方法对主位点组检测的能力, 功效越
高说明方法越好; 假发现率是检测到的假主位点组
个数与检测到的全部主位点组个数的比值, 该值越
低说明方法越好。
2.1 遗传率对方法功效的影响
为了研究主位点组遗传率对方法的影响, 第一
组模拟中模拟了 3组包含 2个主位点组的 10个亲本
的完全双列杂交试验, 单个主位点组的遗传率分别
设定为 0.1、0.2和 0.3。从分析结果(表 2)可以看出, 方
法功效随着遗传率的增大而提高, 假发现率随着遗
传率的增大而降低。
2.2 主位点组个数对方法功效的影响
为了研究主位点组个数对方法功效的影响, 第
二组中模拟了主位点组个数分别为 1、2和 3的 3组
完全双列杂交试验, 将单个主位点组的遗传率设定
为 0.2。从分析结果(表 3)中可以看出, 随着主位点组

表 2 单个主位点组遗传率对主位点组筛选方法功效的影响
Table 2 Effect of heritability on power of identification meth-
ods of major locus groups
PMS SMS 遗传率
Heritability Power
(%)
FDR
(%)
Power
(%)
FDR
(%)
0.1 29.8 70.3 8.5 77.5
0.2 87.0 13.0 83.8 15.8
0.3 98.5 1.5 98.8 2.2
PMS: 可能模型筛选; SMS: 逐步筛选; Power: 功效; FDR:
假发现率。
PMS: possible model selection method; SMS: stepwise model
selection method; FDR: false discovery rate.
数的增加方法的功效略有增加, 这是由于未设定主
位点组间的交互效应, 主位点组的增加并没有增加
遗传结构的复杂程度, 却大大降低了误差方差。
2.3 ++基因型频率对方法功效的影响
++基因型频率即在所有亲本中基因型为增效的
亲本个数占亲本总数的比例。为了研究主位点组中
基因型频率对方法是否有影响, 第三组模拟中设定
一个遗传率为 0.3 的主位点组, 其中++基因型频率
被设定 5个水平, 分别为 0.1、0.2、0.3、0.4和 0.5。
从分析结果(表 4)可以看出, 这 5种情况下方法的功

表 3 主位点组个数对主位点组筛选方法功效的影响
Table 3 Effect of number of major locus groups on identifica-
tion power of methods of major locus groups
PMS SMS 主位点组个数
Number of
locus groups
Power
(%)
FDR
(%)
Power
(%)
FDR
(%)
1 75.0 25.0 74.5 28.0
2 88.5 11.5 87.8 14.2
3 95.7 4.3 85.7 15.0
缩写同表 2。Abbreviations are the same as given in Table 2.

表 4 亲本++基因型频率对主位点组鉴别方法的影响
Table 4 Effect of frequency of ++ genotype of parents on
power of identification methods of major locus groups
PMS SMS 频率
Frequency Power
(%)
FDR
(%)
Power
(%)
FDR
(%)
MVIF
0.1 99.0 1.0 98.0 7.1 4.6
0.2 94.5 5.5 93.0 10.1 2.1
0.3 94.5 5.5 94.0 9.6 1.4
0.4 96.0 4.0 95.0 9.1 1.1
0.5 95.0 5.0 95.0 7.3 1.0
MVIF: 平均方差膨胀因子, 其他缩写同表 2。
MVIF: mean variance inflation factor. Other abbreviations
are the same as given in Table 2.
第 8期 贺建波等: 双列杂交设计的主-微位点组遗传分析方法研究 1253


效并没有显著变化, 但是随着++基因型比例的降低,
模型的平均方差膨胀因子 (mean variance inflation
factor, MVIF)[10]明显增大, 因此极端的++基因型比
例会导致模型估计不准确。
2.4 主位点组间的相似性对方法功效的影响
设 n为亲本个数, i为亲本序号, 则主位点组 JA
和 JB间的相似性,
1| ( , ) ( , ) | / 2 /
n
A BiS f i J f i J n=
⎡ ⎤= +⎢ ⎥⎣ ⎦∑
在第 4组模拟中, 设定了 2个主位点组, 总遗传
率为 0.5, 主位点组间的相似性设定为 0.1、0.2、0.3、
0.4、0.5、0.6、0.7、0.8和 0.9等所有可能的 9个值。
从结果来看(表 5), 当相似性较高或较低时, 方法的
功效偏低, 平均方差膨胀因子偏高, 从相似性的定
义及主位点组基因型值可以看出, 当两个主位点组
相似性较低或较高时, 它们的设计矩阵的相关程度
较高, 容易引起多重共线性, 由于方法采用的最小
二乘估计, 故这两种情况对模型都有一定影响。
2.5 微基因效应对方法功效的影响
为了验证微基因效应对方法分析结果的影响 ,
进行了 2 组模拟研究, 第一组模拟仅包含主基因,
第二组模拟既包含主基因也包含微基因。模拟的试

表 5 主位点组间相似性对主位点组鉴别方法的影响
Table 5 Effect of similarity between major locus groups on
power of identification methods of major locus groups
PMS SMS 相似性
Similarity Power
(%)
FDR
(%)
Power
(%)
FDR
(%)
MVIF
0.1 68.0 32.0 57.8 11.8 2.7
0.2 85.0 15.0 78.0 8.5 1.7
0.3 89.3 10.8 84.5 6.1 1.4
0.4 88.8 11.3 85.5 8.6 1.3
0.5 91.0 9.0 85.8 6.8 1.3
0.6 82.5 17.5 78.5 14.7 1.3
0.7 74.3 25.8 66.0 22.6 1.4
0.8 60.3 39.8 52.3 28.4 1.7
0.9 62.3 37.8 53.0 4.9 2.8
缩写同表 2和表 4。Abbreviations are the same as given in
Table 2 and Table 4.
验为 10 个亲本的双列杂交设计, 仅包含正交组合, 设
置 3 个区组, 每组模拟都进行 200 次重复。从所有
210个位点组进行有放回的随机抽样, 从中抽取 29个
位点组作为控制数量性状的基因, 从基因中随机抽
取 2个不同的位点组作为主基因, 剩余的作为微基因。
主基因遗传率设为 0.5, 微基因的遗传率设为 0.1,
逐步筛选主位点组。
从表 6 可以看出, 当微基因不存在时, 主基因
的检测功效较高 , 主基因效应的估计也比较准确 ,
当微基因存在时, 主基因的检测功效有所下降, 但
是, 其效应的估计相对准确, 估计值的标准差有所
增加。
从表 7 中可以看出, 当微基因不存在时, 模型的
假发现率为 9.51%, 主位点组方差、微位点组方差、
误差方差及总体平均数估计都比较准确; 当微基因
存在时, 主位点组方差有所增大, 微位点组方差有
所减少, 这是因为在主位点组中包含了部分微基因
效应, 但是总体平均数却增大了, 这是因为数量较多
的微基因使得其效应在组合内呈现一种正态分布,
这个正态分布的中心与微基因的显性效应有关。
3 模拟实验
按照 Griffing方法 II模拟了 10个亲本的双列杂
交设计, 设置 3 个区组, 3 个主位点组分别是 J=62,
311和 221, 主位点组遗传率为 0.6, 微位点组遗传率
为 0.2, 总遗传率 0.8, 模拟的组合平均值见表 8。

表 6 主位点组的检测功效及效应估计
Table 6 Power of identification of major locus groups and
estimated effects
模拟组
Simulation
group
位点
Locus
功效
Power
(%)
加性效应
a
显性效应
d
309 93.50 0.80(0.77±0.12) 1.00(1.00±0.16)主 Major
148 92.00 1.10(1.10±0.15) 0.90(0.91±0.16)
309 90.50 0.80(0.90±0.24) 1.00(1.01±0.15)主+微
Major+minor 148 82.00 1.10(0.93±0.31) 0.90(1.00±0.17)
括号内为相应参数的估计值和标准差。
Values in parenthesis are estimated value and standard devia-
tion of parameter.

表 7 假发现率及遗传方差和误差方差的估计
Table 7 FDR and estimates of genetic variance and error variance
模拟组
Simulation group
假发现率
FDR (%)
主位点组方差
VG
微位点组方差
VW
误差方差
Ve
总体平均数
μ
主 Major 9.51 0.74(0.75±0.13) 0.00(0.00±0.07) 0.74(0.73±0.12) 30(30.07±0.92)
主+微 Major+minor 6.54 0.74(0.89±0.21) 0.18(0.08±0.12) 0.61(0.60±0.09) 30(35.95±5.96)
括号内为相应参数的估计值和标准差。
Values in parenthesis are estimated value and standard deviation of parameter.
1254 作 物 学 报 第 36卷

模拟的 3个区组数据方差分析(表 9)表明组合间
的变异极显著, 微位点组效应极显著, 从检测结果
可以看到(表 10), 检测到 3个主位点组, 分别是 J =
62, 311 和 221, 与设定值相同, 微位点组效应极显
著, 也与设定条件相符合。
估计的主位点组遗传率为 67.52%, 微位点组遗
传率为 10.45%, 总遗传率为 77.97%, 与设定值有一
些相差, 但不大。主位点组遗传效应估计值与设定
值也有一些相差, 但不大(表 10)。微位点组遗传效应
估计值(表 11 和表 12)与设定值有一定偏差, 相对大
于与主位点组的相差 , 有个别效应出现正负号不
同。鉴于这只是单次模拟试验的结果, 抽样波动较
大, 重复抽样将能更接近真值。从此项模拟结果看,
利用主-微位点组遗传分析方法可以给出主-微位点
组的相对贡献, 有效地检测主位点组, 并提供微位
点组综合效应的参考信息。
主、微位点组方差(κG2, κW2)的估计可从其期望
均方获得, 其关系式分别为:
2 2
2 2
( ) ,
2
( )
e G
e W
NE MSG
m
NE MSW
c
σ κ
σ κ
= +
= +

其中, E(MSG)和 E(MSW)分别为主位点组与微位点
组的期望均方, 从方差分析表中估计, N为总观测值
个数, m 为主位点个数, c 为双列杂交设计中组合数
目, σe2为误差方差。

表 8 模拟的 10 个亲本双列杂交组合平均值
Table 8 Simulated averages of the combinations among ten parents
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
P1 60.46
P2 68.89 54.47
P3 81.59 76.05 69.83
P4 68.82 74.97 61.89 46.07
P5 72.05 79.40 82.90 80.60 47.51
P6 96.09 64.37 71.58 65.93 33.02 10.93
P7 79.63 87.96 74.44 62.59 65.10 43.79 41.22
P8 84.17 71.85 62.27 67.89 31.14 11.93 34.15 47.16
P9 89.70 59.29 74.19 82.95 63.47 67.59 81.58 63.01 61.65
P10 85.16 79.95 69.15 82.14 67.00 52.84 51.25 71.83 88.03 38.16

表 9 模拟双列杂交数据的方差分析
Table 9 ANOVA of the simulated diallel crosses
变异来源
Source of variation
自由度
df
平方和
SS
均方
MS
F值
F-value
概率值
P-value
组合 Cross 54 55720.1722 1031.8550 11.62 <0.001
主位点组 Major locus group 6 45398.3522 7566.3920 85.21 <0.001
微位点组 Minor locus group 48 10321.8201 215.0379 2.42 <0.001
区组 Block 2 1701.3270 850.6635 9.58 <0.001
误差 Error 108 9589.8923 88.7953
总变异 Total 164 67011.3915

表 10 模拟数据主位点组亲本基因型与遗传效应的估计
Table 10 Genotypes of major locus groups and estimates of genetic effects of the simulated experiment
亲本代号 Index of parents 遗传效应估计 Genetic effect estimates主位点组
Major locus group P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 a d
62 ++ ++ ++ ++ – – – – – – – – ++ – – 10.06(10.00) 17.04(15.00)
311 ++ – – ++ ++ – – – – ++ – – – – ++ 6.32(8.00) 11.93(9.20)
221 ++ ++ – – – – ++ – – – – – – ++ ++ 7.37(6.00) 7.95(6.00)
括号内为设定的真值。Number in parenthesis is the true value.
第 8期 贺建波等: 双列杂交设计的主-微位点组遗传分析方法研究 1255


表 11 微位点组加性总效应估计值与设定值
Table 11 Estimates and true values of overall additive effects of collective minor locus groups
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
估计值 Estimate –11.25 –4.62 12.86 –10.91 8.54 –13.31 4.36 22.93 2.56 –13.45
设定值 True value –7.25 –13.21 15.06 –12.84 4.79 –10.87 9.90 4.85 –0.79 –14.76

表 12 微位点组显性总效应估计值与设定值
Table 12 Estimates and true values of overall dominant effects of collective minor locus groups
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
P1 8.54 –0.19 0.90 –0.64 24.99 –5.73 –3.40 17.51 14.32
P2 –0.50 –0.61 16.59 15.42 3.14 16.01 17.11 0.66 14.88
P3 8.49 –5.98 3.61 –8.14 8.15 –7.90 –16.94 –5.48 –13.03
P4 7.60 4.82 3.94 8.36 17.59 –2.51 11.73 15.75 6.69
P5 –10.90 11.37 –12.69 –3.11 –7.74 0.50 –6.47 –6.32 14.42
P6 23.48 6.69 2.24 8.47 –4.15 14.81 –8.17 11.47 13.47
P7 3.80 3.19 1.88 1.90 0.85 5.78 –12.96 –12.96 –3.10
P8 –6.57 –3.96 –25.20 –7.69 –24.15 –17.12 –21.98 –6.53 22.77
P9 16.72 1.24 –11.43 9.21 –8.15 6.31 –6.77 –16.39 14.35
P10 18.81 4.67 –9.84 15.03 12.24 8.42 3.60 9.29 9.16
上三角为微位点组显性总效应设定值, 下三角为微位点组显性总效应估计值。
True values of dominant effect are in the upper triangular part while their estimates in the lower triangular part.

主位点组遗传率和微位点组遗传率分别由主、
微位点组方差和方差分析表中估计的表型方差估算。
4 实例分析
用 11个甘蓝型油菜亲本按照 Griffing方法 II配
制 55个杂交组合, 加亲本共 66个试验材料。采用 3
次重复的随机区组设计, 种植 3 行区, 开花期数据
参见表 13。
甘蓝型油菜双列杂交实验开花期数据方差分析
表明 (表 14), 亲本及组合间存在显著的遗传变异 ,
有必要进一步分析亲本间存在的遗传差异。按本文
模型检测到 3 个显著的主位点组, 微位点组效应不
显著, 主位点组类型编号分别为 J=97, 924和 637 (表
15)。鉴于 11 个亲本有 211个差异类型, 在大量分割
下每个主位点组可以看作为一个基因位点, 因而这
组油菜的开花期有 3对基因差异。这和 Feirreia等[11]
控制开花期遗传可能为 3 对主基因的结果相似。从
表 15 各亲本主位点组的遗传构成及各主位点组的
加、显性效应可以解释各组合杂种优势的遗传原因。
5 讨论
双列杂交设计试验的目的有两个, 一个是以群

表 13 11 个甘蓝型油菜亲本及其双列杂交组合平均开花期
Table 13 Average days to flowering of 11 Brassica napus parents and their 55 diallel crosses
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11
P1 188.3
P2 183.3 193.7
P3 188.3 187.7 193.0
P4 177.7 190.0 193.0 194.0
P5 197.0 199.0 192.0 200.0 204.3
P6 197.0 197.3 193.0 197.7 206.0 203.0
P7 187.0 191.0 190.0 189.0 202.0 197.7 194.7
P8 184.7 190.3 191.3 183.3 200.0 200.0 192.3 195.0
P9 179.0 190.0 184.3 183.7 196.0 199.3 186.0 180.3 192.3
P10 188.0 185.3 189.3 188.0 197.7 200.0 187.3 180.3 177.0 200.7
P11 184.0 185.7 190.3 189.3 200.7 198.0 187.0 188.0 187.0 183.7 188.0
表中数据为从播种至初花期的日数。Data listed above are the number of days from sowing to initial flowering stage.
1256 作 物 学 报 第 36卷

表 14 油菜开花期试验的双列杂交数据的方差分析
Table 14 ANOVA of days to flowering of the rapeseed diallel crosses
变异来源
Sources of variation
自由度
df
平方和
SS
均方
MS
F值
F-value
概率值
P-value
组合 Cross combination 65 8051.3 123.9 6.20 <0.001
主位点组 Major locus group 6 6628.3 1104.7 45.80 <0.001
微位点组 Minor locus group 59 1423.0 24.1 1.21 0.1857
区组 Block 2 8.5 4.3 0.22
误差 Error 130 2598.8 20.0
总变异 Total 197 10658.6

表 15 油菜开花期试验数据的主位点组基因型与遗传效应的估计
Table 15 Genotypes of major locus groups and estimates of genetic effects of days to flowering of the rapeseed diallel crosses
亲本代号 Code of parents 遗传效应
Genetic effects estimates 主位点组
Major locus group P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 a d
97 – – – – – – – – ++ ++ – – – – – – – – – – 8.73** 4.24*
924 – – ++ ++ ++ – – – – ++ ++ – – ++ ++ 2.57* –2.94*
637 – – ++ – – – – ++ ++ ++ ++ ++ – – – – 0.85 –2.52*
*和**分别表示 0.05及 0.01水平下显著。* and ** denote P<0.05 and P<0.01, respectively.

体为分析对象, 期望获得群体中某性状的遗传方差
成分, 进而估算对应群体、性状的遗传效应、遗传
方差和遗传力等遗传参数。另一个是以双列杂交的
亲本为分析对象, 进行配合力分析, 评价亲本及杂
交后代。前者按随机模型分析和设计双列杂交试验,
其亲本必须从群体中随机抽取, 由于样本容量不可
能太大, 使其应用有局限性。而后者只对样本作直
接分析(有限总体), 无须上述假定。控制数量性状的
基因可能有主基因, 也可能有微基因, 还可能同时
存在主基因和微基因, 我们的后续研究中发现有些
数量性状的 QTL仅能解释较小一部分遗传变异, 而
微效基因解释了大部分遗传变异, 因此有必要研究
微基因效应, 本文方法在原主位点组分析基础上提
供了微位点组效应的假设测验及效应估计, 为利用
双列杂交设计的遗传分析提供了更多的信息。
本文的遗传模型中假定无复等位基因, 但是对
于复等位基因的情形仍然是有一定效果的, 因为本
文方法是从亲本的差异类型出发, 只要亲本间存在
差异, 就能够检测到差异, 复等位基因存在时亲本
间的差异类型数增加, 这时利用本文方法将会检测
到更多的主位点组以解析亲本间的差异, 复等位基
因将被拆分为多个双等位性的主位点组, 虽然无法
明确具体复等位基因的差异类型, 但是却检测到了
其效应。假定一个位点存在 3 个复等位基因, 就相
当于将其中两个复等位基因视为相同的, 这时的结
果仍能够解析一部分遗传信息; 若不能够视为相同
且差异较大, 这时可能会检测到 2 个主位点组, 合
并后的结果, 仍然有效, 这方面有待进一步实践的
检验。
随着分子标记技术的不断发展, 近年来也发展
了一些利用双列杂交后代多个 F2群体的 QTL 定位
方法[12], 结合分子标记信息和本研究中的遗传差异
类型概念, 可知分子标记信息的获得相当于检测到
了遗传差异类型, 为进一步分析数据提供了“可互
补”的益处, 这将有利于育种的设计和控制。
6 结论
在以往位点组分析方法的基础上, 将其扩展为
主基因+多基因遗传模型框架下双列杂交设计的主
-微位点组遗传分析方法, 并提出了逐步选入回归
法中 F 测验的调整方法。通过计算机模拟评估了方
法的统计功效, 并通过模拟实验数据和油菜实际试
验数据的分析验证了所提方法的应用效果。本文方
法可用于研究利用双列杂交设计的数量性状主、微
位点组的遗传分析。
References
[1] Gai J Y. Segregation analysis on genetic system of quantitative
traits in plants. Front Biol China, 2006, 1: 85–92
[2] Sprague G F, Tatum L A. General vs. specific combining ability
in single cross of corn. J Am Soc Agron, 1942, 37: 923–932
第 8期 贺建波等: 双列杂交设计的主-微位点组遗传分析方法研究 1257


[3] Griffing B A. Concept of general and specific combining ability
in relation to diallel crossing systems. Aust J Bio Sci, 1956, 9:
463–493
[4] Zhu J(朱军). General genetic models and new analysis methods
for quantitative traits. J Zhejiang Agric Univ (浙江农业大学学
报), 1994, 20(6): 551–559 (in Chinese with English abstract)
[5] Dudley J W. Evaluation of maize populations as sources of fa-
vorable alleles. Crop Sci, 1988, 28: 486–491
[6] Guan R-Z(管荣展). Applications of Diallel Cross Design to the
Improvement of Heterosis of Elite Crosses and the Distinction
Loci Groups among Parents. PhD Dissertation of Nanjing Agri-
cultural University, 1997 (in Chinese)
[7] Gai J-Y(盖钧镒 ), Guan R-Z(管荣展 ), Wang J-K(王建康 ).
Methods of genetic experiments for the detection of QTL system
in plants. World Sci-Tech R&D (世界科技研究与发展), 1999,
21(1): 34–40 (in Chinese with English abstract)
[8] Guan R-Z(管荣展), Gai J-Y(盖钧镒). Detection of differential
QTLs among a group of parents under additive-dominance model
by use of diallel design. J Biomath (生物数学学报), 2001, 16(5):
545–552 (in Chinese with English abstract)
[9] David H A, Nagaraja H N. Order Statistics (3rd edn). John Wiley
& Sons Inc, 2003. pp 9–11
[10] Kutner M H, Nachtsheim C J, Neter J. Applied linear regression
models (4th). The McGraw-Hill Companies Inc, 2004. pp
408–410
[11] Ferreira M E, Satagopan J, Yandel B S, Williams P H, Osborn T
C. Mapping loci controlling vernalization requirement and flow-
ering time in Brassica napus. Theor Appl Genet, 1995, 90:
727–732
[12] Verhoeven K J F, Jannink J L, McIntyre L M. Using mating de-
signs to uncover QTL and the genetic architecture of complex
traits. Heredity, 2006, 96: 139–149

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
信息索引
1264 欢迎订阅 2011年《作物学报》
1285 欢迎订阅 2011年《中国种业》
1295 欢迎订阅 2011年《分子植物育种》
1301 欢迎订阅 2011年《植物遗传资源学报》
1341 新书推介——《沈允钢学术文选》
1354 2011年《特产研究》征订征稿启事
1385 新书推介——《现代植物育种学》(生命科学专论)
1400 新书推介——《耕耘—章琦稻病抗性研究选集》
1408 新书推介——《节水节肥型多熟超高产理论与技术》