全 文 :作物学报 ACTA AGRONOMICA SINICA 2008, 34(10): 1734−1743 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
基金项目: 国家重点基础研究发展计划(973计划)项目(2006CB101700); 教育部“新世纪优秀人才支持计划”项目(NCET2005-05-0502); 江苏省
自然科学基金项目(BK2006066)
作者简介: 王学枫(1982–), 江苏靖江人, 现为 Case Western Reserve University流行病学与生物统计学系博士研究生。E-mail: qtls@hotmail.com
*
通讯作者(Corresponding author): 徐辰武, 教授, 博士, 研究方向: 统计基因组学及生物信息学。Tel: 0514-87979358; E-mail:
qtls@yzu.edu.cn
Received(收稿日期): 2008-01-10; Accepted(接受日期): 2008-04-30.
DOI: 10.3724/SP.J.1006.2008.01734
基于 NC III和 TTC设计的胚乳性状 QTL区间作图方法
王学枫 汤在祥 王亚民 宋 雯 徐辰武*
(扬州大学江苏省作物遗传生理重点实验室 / 教育部植物功能基因组学重点实验室, 江苏扬州 225009)
摘 要: 根据三倍体胚乳性状的遗传模型, 提出基于 NC III以及 TTC两种遗传设计的胚乳性状 QTL作图新方法, 并
通过计算机模拟数据, 对该方法的可行性和有效性进行了分析验证。模拟研究供试因素包括 QTL遗传力、F2群体植
株数和每家系混合样品测定的胚乳数。考察指标包括 QTL的统计功效以及 QTL位置和效应估计的准确度与精确度。
结果表明, 2种设计均有较高的 QTL统计功效, 在供试的大多数处理中, 即使 QTL的遗传力只有 5%, 其被发现能力
也可达 100%。两种设计均可有效区分胚乳 QTL的各种遗传效应。基于 TTC设计的胚乳 QTL 作图方法, 在 QTL 的
统计功效、位置估计和效应估计上, 均优于 NC III设计, 虽然这一优势随着 QTL遗传力的提高以及样本容量的增大
而有降低的趋势。
关键词: 胚乳性状; QTL作图; NC III设计; TTC设计; 极大似然估计; EM算法
Interval Mapping of Quantitative Trait Loci Underlying Endosperm
Traits with NC III and TTC Designs
WANG Xue-Feng, TANG Zai-Xiang, WANG Ya-Min, SONG Wen, and XU Chen-Wu*
(Jiangsu Provincial Key Laboratory of Crop Genetics and Physiology / Key Laboratory of Plant Functional Genomics, Ministry of Education, Yang-
zhou University, Yangzhou 225009, Jiangsu, China)
Abstract: The endosperm of cereal crops is a triploid tissue produced by a male gamete from the pollen grain fusing with two
female nuclei. Endosperm traits refer to those characteristics that determined by the physical and chemical properties of grain
endosperm. Because many quality traits are closely related to endosperms, the genetic study of endosperm traits plays a funda-
mental and vital role in improving grain quality. There have been several publications detailing the unique properties of en-
dosperm traits. A series of QTL mapping models and approaches specific for triploid traits have been proposed, using single grain
observation or more practical one that obtained from bulked samples. However, current methods based on bulked samples often
fail to estimate two dominance effects of endosperm QTL separately, or involve a heavy work of crossing. On the basis of quanti-
tative genetic models for triploid endosperm traits, a new mapping approach based on North Carolina Design III (NC III) and
Triple Test Cross (TTC) was proposed in this study. Feasibility and efficacy of the method were investigated through simulated
data. Experimental factors considered in the simulations include QTL heritability, number of plants in F2 population, and number
of endosperms collected per family. The results suggested that the two methods had satisfactorily high detection powers, which
reached 100% even when the QTL heritability was 5%. But the TTC-based approach tended to have slightly higher power than the
NC III-based one. Both approaches can distinguish two dominance effects successfully. But overall, the TTC-based approach can
offer better estimation of either QTL position or effect, though this superiority waned as the heritability and sample size increase.
Keywords: Endosperm trait; QTL mapping; North Carolina Design III; Triple Test Cross; Maximum likelihood estimation;
EM algorithm
第 10期 王学枫等: 基于 NC III和 TTC设计的胚乳性状 QTL区间作图方法 1735
谷物的胚乳是人类食粮和许多生活必需品的主
要来源, 因此, 其遗传研究一直受到遗传学家和植
物育种学家的重视[1]。谷类作物的胚乳是由母本的 2
个极核和父本的 1 个精核受精发育而成的三倍体组
织。由胚乳中的化学组分的物理性质或化学性质决
定的一类性状称为胚乳性状。由于胚乳性状与谷物
的籽粒品质密切相关, 因此, 了解胚乳性状的遗传
机制是谷物胚乳品质改良的重要基础。目前, 已经
报道了一系列适合于三倍体胚乳性状的QTL作图方
法, 包括基于单粒胚乳观察值以及胚乳性状平均值
两种数据模式的 QTL分析方法, 如笔者等提出的最
小平方法[2]和迭代重新加权最小平方法[3], Wu 等[4]
提出的基于 EM 算法实现的三倍体胚乳数量性状作
图的极大似然估计(MLE)方法。其后, Wu等[4]又进一
步提出基于二阶系统设计的胚乳性状 QTL 分析方
法。Cui 等[5]在 Wu 等的工作基础上, 进一步提出基
于回交群体的种子性状 QTL作图新方法。最近, 笔
者等[6]以及 Wang等[7], 先后发展了基于株平均值或
混合样品测定结果的胚乳性状QTL作图的极大似然
方法, 该方法已被成功用于玉米胚乳性状的 QTL分
析[8-9]。然而, 上述基于平均值的 QTL作图方法均无
法分辨胚乳 QTL的两种显性效应。为此, Wen等[10]
提出一种基于随机交配设计的胚乳性状QTL作图方
法, 以分辨胚乳性状的两种显性效应。由于分离群
体通常具有较多的个体, 随机成对杂交需要较大的
工作量, 难以适合于自花授粉作物胚乳性状的 QTL
分析。此外, Wen等[10]的方法也未提供基于家系平均
数的精确解法。为此, 本文根据三倍体胚乳性状的
数量遗传模型, 提出基于 NC III以及 TTC两种遗传
设计的胚乳性状 QTL区间作图新方法。
1 统计方法
1.1 基于平均值的胚乳性状的统计遗传模型
设控制某一胚乳性状的单个 QTL 涉及 Q 和 q
两个等位基因, 则胚乳性状单一座位可能有 QQQ、
QQq、Qqq和 qqq 4种基因型。各基因型的基因型值
可仿 Mo[11]和 Bogyo 等 [12]的定义为 3a/2, a/2+d1,
–a/2+d2和–3a/2, 其中 a 为加性效应, d1为第一显性
效应, d2为第二显性效应。第 i植株上第 j粒胚乳的
观察值 Yij可表示为:
1 2 1 3 2ij ij ij ij ijY X a X d X d eμ= + + + + (1)
其中, µ是胚乳性状的群体均值。eij表示误差效
应, 并假定 eij~N(0,σe2)。X1ij, X2ij和 X3ij是胚乳 QTL
基因型的指示变量。对 QQQ 基因型 , X1ij=3/2,
X2ij=X3ij=0; 对 QQq 基因型, X1ij=1/2, X2ij=1, X3ij=0;
对 Qqq基因型, X1ij=-1/2, X2ij=0, X3ij=1; 对 qqq基因
型, X1ij=-3/2, X2ij=X3ij=0。假设仅有混合样本表型值,
即第 i植株上 ni粒种子胚乳性状观察值的平均数, 上
述模型可以表示为
1 2 1 3 2i i i i iy x a x d x d eμ= + + + + (2)
其中,
1
/
in
i ij i
j
y Y n
=
= ∑ , 1 1
1
/
in
i ij i
j
x X n
=
= ∑ , 2 2
1
/
in
i ij i
j
x X n
=
= ∑ ,
3 3
1
/
in
i ij i
j
x X n
=
= ∑ ,
1
/
in
i ij i
j
e e n
=
= ∑ 。
显然, 剩余效应 ie 服从均值为 0、方差为 σe2/ni的正
态分布。
如上所述, 胚乳性状的平均数虽然可以参数加
性效应和显性效应的函数关系表示, 但在 QTL作图
时, 由于胚乳 QTL 的基因型未知, 所以需采用混合
模型策略, 即假设性状平均数的分布为多个潜在分
布的混合。在此基础上, 采用 EM 算法[13]实现的极
大似然方法估计未知参数。此处, 有两种构建混合
模型的策略, 一是将混合样本所有可能基因型组合
进行逐一分解, 以此模型实现的 EM 算法称为精确
算法; 二是将混合样本按母株的 QTL基因型进行分
类, 此时若干粒胚乳平均值的分布可以近似看成 3
个分布分量的混合, 这种简化模型下实现的EM算法
又称为近似算法。精确算法虽具有更高的精度, 但
是当混合样本所包含的籽粒数较多时, 往往会带来
巨大的计算量。
1.2 基于 NC III和 TTC设计的胚乳性状的遗传
组成及其平均数
NC III 设计是经典数量遗传学常用的遗传设计
之一。其主要做法是从两个纯系杂交衍生的 F2群体
中, 随机抽取 l个单株, 每一单株皆分别与两个亲本
回交, 每一 F2单株均衍生两类家系[14]。对胚乳性状
而言, NC III 设计是以 F2植株群体的随机个体为母
本, 分别授以 P1和 P2花粉, 从而可以在同一母株上
获得两类不同的胚乳世代家系群体。利用 NC III设
计进行胚乳性状 QTL分析时, 与笔者之前提出的基
于 F2:3株平均值的分析方法[6]一样, F2植株用于标记
分析, 各母株上两类家系的胚乳混合样品用于性状
测定。第 i (i=1, 2, …, l)母株上的两类家系分别用 L1i
和 L2i表示。
对于 L1i家系, QQ植株上的所有胚乳的基因型均
为 QQQ; Qq植株上的种子胚乳按(QQQ+Qqq)/2分离;
1736 作 物 学 报 第 34卷
qq 植株上的胚乳基因型均为 Qqq。对于 L2i家系, QQ
植株上着生的胚乳基因型均为QQq; Qq植株上着生的
胚乳按(QQq+qqq)/2 分离; qq 植株上的胚乳基因型均
为 qqq。据此, 可以导出不同家系群体的平均数(表 1)。
表 1 NC III设计下胚乳性状的遗传组成及其平均值
Table 1 Genetic constitution and mean of endosperm trait under NC III
L1i L2i 母株基因型
Maternal genotype 遗传组成
Genetic constitution
平均值
Mean
遗传组成
Genetic constitution
平均值
Mean
QQ QQQ 3a/2 QQq a/2+d1
Qq (QQQ+Qqq)/2 a/2+d2/2 (QQq+qqq)/2 −a/2+d1/2
qq Qqq −a/2+d2 qqq −3a/2
L1i and L2i represent the families derived from the ith F2 maternal plant backcrossed to the two parental lines, respectively. The same in
Table 2.
TTC 设计也是经典数量遗传学常用的遗传设计
之一。其主要做法是从两个纯系杂交衍生的 F2群体
中, 随机抽取 l个单株, 每一单株皆分别与两个亲本
以及 F1回交, 每一 F2单株均衍生 3类家系[14]。而对
胚乳性状来说, TTC 设计则是以 F2植株群体的随机
个体为母本, 分别授以 P1、P2和 F1花粉, 从而可以
在同一母株上获得 3 类不同的胚乳世代家系群体。
与前述的NC III设计一样, F2植株用于标记分析, 各
母株上 3 类家系的胚乳混合样品用于性状测定。第
i (i=1, 2, …, l)母株上的 3类家系分别用 L1i、L2i和
L3i表示。
在 TTC设计下, 不同的母株 QTL基因型, 其上
着生的 L1i和 L2i家系的群体组成与 NC III设计完全
相同。而对 L3i家系, QQ 植株上着生的胚乳的遗传
组成为(QQQ+QQq)/2; Qq植株上的胚乳的遗传组成
为(QQQ+QQq+Qqq+qqq)/4; qq植株上的胚乳的遗传
组成则为(Qqq+qqq)/2。TTC设计下不同胚乳家系群
体的遗传组成及其平均值一同列于表 2。
表 2 TTC设计下胚乳性状的遗传组成及其平均值
Table 2 Genetic constitution and mean of endosperm trait under TTC
L1i L2i L3i
母株基因型
Maternal genotype
遗传组成
Genetic constitution
平均值
Mean
遗传组成
Genetic constitu-
tion
平均值
Mean
遗传组成
Genetic constitution
平均值
Mean
QQ QQQ 3a/2 QQq a/2+d1 (QQQ+QQq)/2 a+d1/2
Qq (QQQ+Qqq)/2 a/2+d2/2 (QQq+qqq)/2 −a/2+d1/2 (QQQ+QQq+Qqq+qqq)/4 (d1+d2)/4
qq Qqq −a/2+d2 qqq −3a/2 (Qqq+qqq)/2 −a+d2/2
L3i represents the families derived from the ith F2 maternal plant backcrossed to the F1.
1.3 胚乳 QTL参数估计的精确算法
以 p1i、p2i和 p3i分别表示 F2群体中第 i 植株的
3 种 QTL 基因型的条件概率, 该概率可用双侧标记
基因型(标记基因型信息完全时)或整条染色体上的
所有标记基因型(标记基因型信息不完全时)联合推
断[15]。由 p1i、p2i和 p3i可以进一步计算出第 i 植株
上任一粒种子胚乳 4种可能基因型 QQQ、QQq、Qqq
和 qqq的条件概率 ,1ip 、 ,2ip 、 ,3ip 和 ,4ip 。例如, 无论
是NC III设计还是 TTC设计, 其 L1i家系的 4种QTL
基因型的概率分别为 ,1ip =p1i+p2i/2, ,3ip =p2i/2+p3i,
,
2ip =
,
4ip =0; 而 L2i家系的 4种 QTL基因型的概率则
分别为 ,1ip = ,3ip =0, ,2ip =p1i+p2i/2, ,4ip =p2i/2+p3i; TTC
设计的 L3i家系的 4 种 QTL 基因型的概率则分别为
,
1ip =
,
2ip =p1i/2+p2i/4,
,
3ip =
,
4ip =p2i/4+p3i/2。以 1iy 、 2iy
和 3iy 分别表示第 i 母株上 3 类家系各 n1i、n2i和 n3i
粒胚乳混合样品的性状平均值, nki(k=1, 2, 3, 代表 3
类不同家系)粒胚乳中 4种QTL基因型出现次数 nki1、
nki2、nki3和 nki4为一多项式分布, 具有概率
1 2 3 4
1 2 3 4
!
( , , , )
! ! ! !
ki
ki ki ki ki
ki ki ki ki
n
p n n n n
n n n n
=
1 2 3 4, , , ,
1 2 3 4( ) ( ) ( ) ( )ki ki ki ki
n n n n
i i i ip p p p (3)
已知 kin 粒胚乳中 4种QTL基因型的可能出现次
数共有(nki+1)(nki+2)(nki+3)/6种。因此, kiy 的分布为
(nki+1)(nki+2)(nki+3)/6个分布的混合, 其密度函数
1 2 3 4 1 2 3 4( ) ( , , , ) ( | , , , )ki ki ki ki ki ki ki ki ki kif y p n n n n f y n n n n
Ω
= ∑ (4)
其中 , 1 2 3 4( | , , , )ki ki ki ki kif y n n n n 为对应于某一观察次
第 10期 王学枫等: 基于 NC III和 TTC设计的胚乳性状 QTL区间作图方法 1737
数 nki1、nki2、nki3和 nki4下 kiy 的正态概率密度函数。
Ω表示(nki+1)(nki+2)(nki+3)/6 种可能 nki1、nki2、nki3
和 nki4取值域。
在本文的 2 种设计中, 由于每一 F2母株上有 2
个(NCIII 设计)或 3 个(TTC设计)家系平均数, 因此,
模型(2)有关符号的下标需进一步细化为
1 2 1 3 2ki ki ki ki kiy x a x d x d eμ= + + + + (5)
对应于 nki1、nki2、nki3 和 nki4, 具有关系 x1ki =
(3nki1+nki2-nki3-3nki4)/(2nki), x2ki = nki2/nki 和 x3ki =
nki3/nki 。 因 此 , kiy 的 条 件 期 望 为 E ( kiy
1| ,kin 2 3 4, , )ki ki kin n n = μ + 1 2 1 3 2ki ki kix a x d x d+ + ,
kiy 的条件方差为 1 2 3 4Var ( | , , , )ki ki ki ki kiy n n n n =
2 /e kinσ 。
从而 1 2 3 4( | ) exp, , ,ki ki ki ki ki kif y n n n n n= [ (ki kin y− −
1kix aμ − − 2 2 22 1 3 2 ) / 2 ] / 2πki ki e ex d x d σ σ− 。
对 NCIII设计, l个 F2母株 2l个独立平均值的联合对
数似然值可以表示为 2
11
ln ln ( )
k
l
ki
i
L f y
==
= ∑∑ (6)
对 TTC设计, l个 F2母株 3l个独立平均值的联合对
数似然值则可以表示为
3
11
ln ln ( )
k
l
ki
i
L f y
==
= ∑∑ (7)
为了描述的方面, 以下引入新变量 N, 用于表
示每一 F2母株上的家系数, 显然 N=2对应于 NC III
设计, N=3对应于 TTC设计。因此, 公式(6)和(7)可
以统一描述成
11
ln ln ( )
N
k
l
ki
i
L f y
==
= ∑∑ (8)
公式(8)中的参数 μ, a, d1, d2和 σe2可用 EM算法实现
的极大似然方法估计。
令 Xki =(1 x1ki x2ki x3ki), b=(μ a d1 d2)T, 公式(5)可
用矩阵形式表示为
ki ki kiy e = +X b (9)
参数 b和 σe2估计程序[13]如下。
以当前参数 θ(t-1)和表型观察值 { }kiy=Y 为条件,
按下式计算信息完全下对数似然函数的期望,
( ) ( 1) ( 1)
2 2 ( 1)
2
1 1 1 1
( | ) E [ ( , ) | ]
1(1/ 2)(ln 2π ln ) E [( ) | ]
2
t t t
l N l N
t
e ki ki ki ki
i k i ke
L L
n n yσ σ
− −
−
= = = =
= ,
= − + − − , ∑∑ ∑∑
X
X
θ θ θ X θ Y
X b θ Y
(10)
对 b和 σe2分别取偏导数, 获得
( 1) T ( 1)
2
1 1
2 ( 1) 2 2 4
2
1 1 1 1
1( | ) E [2 ( )| ] 0
2
( | ) [ ( ) ] / 2 0
l N
t t
ki ki ki ki
i ke
l N l N
t
e e ki ki ki ki e
i k i ke
L n y
L n n y
σ
σ σ σσ
− −
= =
−
= = = =
⎧ ∂ = − , =⎪∂ ⎪⎨ ∂⎪ = − − − =⎪∂⎩
∑∑
∑∑ ∑∑
Xb θ X X b θ Yb
θ X b
(11)
解方程可得
1 2 3
1 1 1 1 1 1 1 1
( )
2
1 1 1 2( )
1 1 1 1( )
( )
1
( )
2
E( ) E( ) E( )
ˆ
E( ) E( ) E( )
ˆˆ
ˆ
ˆ
l N l N l N l N
ki ki ki ki ki ki ki
i k i k i k i k
t l N l N
ki ki ki ki ki ki kit
i k i k kt
t
t
n n x n x n x
n x n x n x x
a
d
d
μ
= = = = = = = =
= = = = =
⎡ ⎤⎢ ⎥⎢ ⎥= =⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦
∑∑ ∑∑ ∑∑ ∑∑
∑∑ ∑∑
b
1 3
1 1 1 1
2
2 1 2 2 2 3
1 1 1 1 1 1 1 1
3 1 3 2 3
1 1 1 1 1 1
E( )
E( ) E( ) E( ) E( )
E( ) E( ) E( ) E(
l N l N
ki ki ki
i i k
l N l N l N l N
ki ki ki ki ki ki ki ki ki ki
i k i k i k i k
l N l N l N
ki ki ki ki ki ki ki ki ki
i k i k i k
n x x
n x n x x n x n x x
n x n x x n x x n x
= = =
= = = = = = = =
= = = = = =
∑∑ ∑∑
∑∑ ∑∑ ∑∑ ∑∑
∑∑ ∑∑ ∑∑
1
1 1
1
1 1
2
1 1
2
3 3
1 1 1 1
E( )
E( )
) E( )
l N
ki ki
i k
l N
ki ki ki
i k
l N
ki ki ki
i k
l N l N
ki ki ki ki
i k i k
n y
n x y
n x y
n x y
−
= =
= =
= =
= = = =
⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦
∑∑
∑∑
∑∑
∑∑ ∑∑
(12)
和 ( ) ( )2( ) ( ) ( ) 2e 1 2 31 2
1 1
1 1
1ˆ ˆ ˆE[ ]
l N
t tt t t
ki ki ki ki kil N
i k
ki
i k
n y x a x d x d
n
σ μ
= =
= =
= − − − −∑∑∑∑
(13)
公式(12)和(13)中的“E”表示缺失变量的期望值。
首先需要计算第 i 植株上第 k 家系 (nki+1)(nki+2)
(nki+3)/6种基因型组合的后验概率
1738 作 物 学 报 第 34卷
* 1 2 3 4 1 2 3 4
1 2 3 4
1 2 3 4 1 2 3 4
( , , , ) ( | , , , )
( , , , )
( , , , ) ( | , , , )
ki ki ki ki ki ki ki ki ki
ki ki ki ki
ki ki ki ki ki ki ki ki ki
p n n n n f y n n n n
p n n n n
p n n n n f y n n n n
Ω
= ∑ (14)
再利用后验概率计算不同期望值
*
1 1 2 3 4 1 2 3 4
*
2 1 2 3 4 2
*
3 1 2 3 4 3
2 *
1 1 2 3 4 1 2
E( ) ( , , , )(3 3 ) /
E( ) ( , , , ) /
E( ) ( , , , ) /
E( ) ( , , , )(3
/ 2 / 2 / 2 / 2
/ 2 / 2
ki ki ki ki ki ki ki ki ki ki
ki ki ki ki ki ki ki
ki ki ki ki ki ki ki
ki ki ki ki ki ki ki k
x p n n n n n n n n n
x p n n n n n n
x p n n n n n n
x p n n n n n n n
Ω
Ω
Ω
= + − −
=
=
= + −
∑
∑
∑
2 2
3 4
2 * 2
2 1 2 3 4
2 * 2
3 1 2 3 4
* 2
1 2 1 2 3 4 1 2 3 4 2
*
1 3
2
2
2
3
3 ) /
E( ) ( , , , ) /
E( ) ( , , , ) /
E( ) ( , , , )(3 3 ) /
E( )
/ 2 / 2
/ 2 / 2 / 2 / 2
i ki ki
ki ki ki ki ki ki
ki ki ki ki ki ki
ki ki ki ki ki ki ki ki ki ki ki ki
ki ki
ki
ki
n n
x p n n n n n n
x p n n n n n n
x x p n n n n n n n n n n
x x p
Ω
Ω
Ω
Ω
−
=
=
= + − −
=
∑
∑
∑
∑
2
1 2 3 4 1 2 3 4 3
* 2
2 3 1 2 3 4 2 3
2
1 2 3
*
1 2 3 4 1 2 3
1 2
( , , , )(3 3 ) /
E( ) ( , , , ) /
E( )
( , , , )[ (3 3
/ 2 / 2 / 2 / 2
/ 2 / 2 / 2
ki ki ki ki ki ki ki ki ki ki
ki ki ki ki ki ki ki ki ki
ki ki ki ki
ki ki ki ki ki ki ki ki ki
n n n n n n n n n n
x x p n n n n n n n
y x a x d x d
p n n n n y n n n n
μ
μ
Ω
Ω
+ − −
=
− − −
= − − + − −
−
∑
∑
2
4 2 31 2) / / / ]/ 2 ki ki ki ki kia n n d n n d n
Ω
−
⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ −⎪⎩ ∑
(15)
从而有如下 EM算法的步骤:
(1) 初始化。为参数 b设定初值 μ(0)、a(0)、d1(0)、
d2(0)和 σe2(0)。
(2) E步。根据公式(14)计算第 i植株第 k家系所
有可能基因型组合的后验概率。再根据公式(15)计算
所有缺失变量的期望值。
(3) M 步。利用公式(12)和(13)进行参数估计得
(1)μˆ 、 (1)aˆ 、 (1)1ˆd 、 (1)2dˆ 和 2(1)ˆeσ , 并将之作为下一轮迭
代的初值。
(4) 重复(2)和(3), 直至收敛为止。收敛标准为
上下两轮参数估计值或上下两轮似然值的相差小于
某一指定小值, 如 10−6。收敛时的参数估计值, 即为
相应参数的极大似然估计值。
1.4 胚乳 QTL参数估计的近似算法
由于任一平均值 kiy 的概率分布均可看成是
(nki+1)(nki+2)(nki+3)/6 个分布混合而成的, 因而需要
从理论上将之进行上述分解。这种对胚乳性状平均
值的概率组成进行分解的方法, 其本质是将 nki粒胚
乳的所有可能基因型组合直接进行分解。但该方法
由于涉及多个多项式概率计算, 占用机时较多。为
了减少运算量, 可以采用一种近似方法—即根据分
离群体中 F2植株的 QTL 基因型进行所谓的“不分
解”的极大似然估计。此时由表 1 和表 2 可知, 若
母株基因型为 QQ, 则其上 L1i 家系平均值为 3a/2;
L2i家系平均值为 a/2+d1; L3i家系平均值为 a+d1/2。
若母株基因型为 qq, 则其上 L1i 家系平均值为
–a/2+d2; L2i 家系平均值为–3a/2; L3i 家系平均值为
–a+d2/2。若母株基因型为 Qq, 则其上 L1i家系平均
值为 a/2+d2/2; L2i家系平均值为–a/2+d1/2; L3i家系平
均值为(d1+d2)/4。因此, 依据第 i 植株的 3 种 QTL
基因型 QQ、Qq和 qq, 分别有条件概率分布:
2
1 1
2
1 2 1
2
1 2 1
2
2 1 2
2
2 1 2
2
2 2
2
3 1 3
3 1 2
| ~ ( 3 / 2, )
| ~ ( / 2 / 2, )
| ~ ( / 2 , )
| ~ ( / 2 , )
| ~ ( / 2 / 2, / )
| ~ ( 3 / 2, / )
| ~ ( / 2, / )
| ~ ( / 4 / 4,
i e i
i e i
i e i
i e i
i e i
i e i
i e i
i
y QQ N a n
y Qq N a d n
y qq N a d n
y QQ N a d n
y Qq N a d n
y qq N a n
y QQ N a d n
y Qq N d d
μ σ
μ σ
μ σ
μ σ
μ σ
μ σ
μ σ
μ σ
+
+ +
− +
+ +
− +
−
+ +
+ + 2 3
2
3 2 3
/ )
| ~ ( / 2, / )
e i
i e i
n
y qq N a d nμ σ
⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪ − +⎩
显然, 第 i 母株上 N 个家系平均数的联合概率
分布为一混合分布, 其密度函数
第 10期 王学枫等: 基于 NC III和 TTC设计的胚乳性状 QTL区间作图方法 1739
1 1 2
1 1
, , ( | ) ( | )( )
N N
i Ni i ki i ki
k k
y y f y QQ f y Qqf p p
= =
+= ∏ ∏
3
1
( | )
N
i ki
k
f y qqp
=
+ ∏ (16)
作图群体中 Nl个平均值的联合对数似然函数为
1
1
ln ln ( , , )
l
i Ni
i
L f y y
=
= ∑ (17)
以(17)为目标函数 , 可以进行类似上述精确算法的
极大似然估计。
1.5 胚乳 QTL的似然比测验
QTL 的似然比测验, 即测验染色体上某一假定
位置是否存在 QTL。对其无效假设 H0: a=d1=d2=0,
即该位置无 QTL; 对备择假设 H1, a, d1, d2至少有一
不为零, 即该位置存在 QTL。在 H0假设下, 模型(5)
被缩减为 ki kiy eμ= + 。此时仅有 2个模型参数, 其极
大似然估计值为
1 1 1 1
2 2
e
1 1
1 1
ˆˆ /
1ˆ ˆˆ ˆ( )
l N l N
ki ki ki
i k i k
l N
ki kil N
i k
ki
i k
n y n
n y
n
μ
σ μ
= = = =
= =
= =
⎧ =⎪⎪⎪⎨ = −⎪⎪⎪⎩
∑∑ ∑∑
∑∑∑∑
(18)
H0下的对数似然值为
0
1 1
ln ln ( )
l N
ki
i k
L f y
= =
= ∑∑ (19)
其中, 2 2 2e e( ) exp[ ˆ ˆ ˆˆ ˆ ˆ( ) / 2 ] / 2πki ki ki kif y n n y μ σ σ= − − 。
而 H1下的对数似然值 lnL1, 则可以模型(5)中相
应参数极大似然估计值代入公式(8)或近似算法的公
式(17)计算获得。从而似然比测验统计量
0 12(ln ln )LR L L= − − (20)
公式(20)中 LR渐近服从自由度为 3的卡方分布。
2 模拟研究
2.1 模拟设置
为了检验两种遗传设计的胚乳性状QTL作图方
法的可靠性, 针对 QTL遗传力、F2植株数和每一家
系测定胚乳数 3个可能对 QTL作图效果产生影响的
因素进行模拟分析。对供试因素水平的设置 : (1)
QTL遗传力, 2个水平, 分别为 5%和 10%; (2) F2群
体大小, 2个水平, 分别为 50和 100; (3) 每一家系测
定胚乳数, 3 个水平, 分别为 1、5 和 20。全试验共
有 2×2×3=12个模拟处理。假设某一控制胚乳性状的
QTL位于一染色体的 55 cM处。设该染色体长 100
cM, 其上均匀分布 11个分子标记, 相邻标记间距为
10 cM。进一步设该 QTL的加性效应为 4, 第一和第
二显性效应均为 2, 而该胚乳性状的均值为 20。每
一处理重复模拟 100次。
考察指标包括: (1) QTL的统计功效, 以 100个
重复样本中检测到显著 QTL 样本的出现频率表示;
(2) QTL 位置和效应估计的准确度和精确度, 前者
以达到显著的若干样本相应QTL估计值的平均值度
量, 后者则以达到显著的若干样本相应 QTL估计值
的标准差度量。采用 Piepho[16]的方法进行 QTL的显
著性测验。
由于精确算法涉及多个多项式概率的计算, 对
于家系内胚乳数较多的处理需要的运算时间太长 ,
而基于 F2:3 株平均值的模拟研究结果表明, 虽然基
于基因型分解的精确算法比之近似算法有较高的
QTL位置估计精确度, 但在 QTL统计功效以及位置
和效应估计准确度上差异并不十分明显[6]。本文研
究重点并不在不同方法的比较, 而是要提供可以用
于实际胚乳性状 QTL作图的有效方法。基于上述考
虑, 方法可行性的模拟研究仅以近似算法进行。如
果近似算法已有很好的效果, 可以预期精确算法将
会有更好的效果。
2.2 模拟结果
无论是 NC III 设计(表 3)还是 TTC 设计(表 4),
均具有理想的统计功效。在 12个处理中, NC III和
TTC均仅有 5个处理的统计功效未达 100%, 而本模
拟研究的其他处理下 2 种设计均能够发现所有的潜
在 QTL。例如, 即使在只有 50个单株, 且每家系测
定 5粒胚乳均值的情况下, 对遗传力仅为 5%的 QTL,
NC III和 TTC方法的统计功效也均可以达到 95%以
上。
两种设计均能够准确估计胚乳性状QTL的全部
遗传参数。例如, 在仅有 50个 F2单株, 每家系测定
5粒胚乳表型均值的情况下, NC III设计和 TTC设计
对各参数的估计值均可以达到较高的准确度和精确
度。尤其值得注意的是, 在适当的样本容量下, 2种
方法均能够准确估计胚乳性状的两种显性效应, 即
克服了基于 F2:3家系平均数的胚乳性状 QTL作图中
存在的显性效应混杂问题。
对比表 3和表 4, 可以看出, TTC设计的 QTL统
计功效明显大于 NC III 设计下的统计功效。例如,
100 个 F2单株, 每家系测定 1 粒胚乳, TTC 设计有
72%的机会发现遗传力仅为 5%的 QTL; 而相同条件
下, NC III 设计则仅有 57%的机会发现相同大小的
1740 作 物 学 报 第 34卷
表 3 NC III设计下各处理 QTL的统计功效、位置和效应估计值的平均值和标准差
Table 3 Statistical powers of QTL detection and means and standard deviations of the QTL estimates obtained from NC III design
遗传力
h2 (%)
株数
No. of plants
胚乳数
No. of endosperms
统计功效
Power
位置
Position (cM)
群体均值
Average
加性效应
a
第一显性
效应 d1
第二显性
效应 d2
真值 Parameter
55 20 4 2 2
估计值 Estimate
5 50 1 28 49.29(18.61) 19.64(3.60) 5.41(1.86) 4.57(8.24) 1.65(7.67)
5 95 53.39(9.58) 19.91(1.07) 4.06(0.57) 2.21(2.29) 2.03(2.12)
20 100 54.98(3.13) 19.96(0.59) 3.95(0.38) 2.03(1.21) 2.04(0.83)
100 1 57 53.46(14.18) 19.58(1.74) 4.64(1.05) 3.28(3.75) 1.54(3.47)
5 100 54.28(6.02) 19.96(0.66) 4.09(0.46) 2.15(1.76) 1.96(1.16)
20 100 55.05(2.11) 20.03(0.32) 3.96(0.24) 1.94(0.71) 1.98(0.60)
10 50 1 65 52.69(16.97) 20.03(1.97) 4.44(0.98) 3.03(4.23) 1.79(3.79)
5 100 55.43(5.25) 20.05(0.72) 4.04(0.52) 1.95(1.54) 2.02(1.31)
20 100 54.98(2.45) 20.06(0.36) 3.98(0.25) 1.86(0.75) 1.92(0.57)
100 1 88 57.06(10.48) 19.90(1.18) 4.15(0.69) 2.26(3.00) 2.26(2.08)
5 100 55.51(4.11) 20.09(0.46) 4.01(0.32) 2.00(1.08) 1.87(0.83)
20 100 55.07(1.83) 19.98(0.23) 4.02(0.15) 2.04(0.49) 2.04(0.39)
括号内数字为相应估计值的标准差。
Numbers in parentheses are standard deviations of corresponding estimates.
表 4 TTC设计下各处理 QTL的统计功效、位置和效应估计值的平均值和标准差
Table 4 Statistical powers of QTL detection and means and standard deviations of the QTL estimates obtained from TTC design
遗传力
h2 (%)
株数
No. of plants
胚乳数
No. of endosperms
统计功效
Power
位置
Position (cM)
均值
Mean
加性效应
a
第一显性
效应 d1
第二显性
效应 d2
真值 Parameter
55 20 4 2 2
估计值 Estimate
5 50 1 36 50.39(14.13) 19.64(3.01) 5.52(1.13) 3.57(6.29) 2.10(6.27)
5 99 53.99(6.60) 19.99(0.99) 4.14(0.62) 2.21(2.02) 2.02(2.03)
20 100 55.08(2.71) 19.96(0.43) 4.03(0.30) 2.04(1.02) 2.04(0.87)
100 1 72 53.47(11.17) 19.87(1.76) 4.42(0.82) 2.77(3.74) 1.74(3.88)
5 100 55.08(3.70) 19.98(0.75) 4.05(0.39) 2.06(1.65) 2.06(1.26)
20 100 55.24(1.69) 20.05(0.35) 3.98(0.22) 1.89(0.76) 1.92(0.63)
10 50 1 63 56.161(3.38) 19.81(1.85) 4.43(0.93) 2.40(4.37) 2.14(4.34)
5 100 55.36(3.38) 20.04(0.70) 3.98(0.40) 2.00(1.51) 2.06(1.25)
20 100 54.96(2.56) 20.00(0.34) 3.99(0.22) 2.02(0.62) 2.00(0.63)
100 1 97 56.21(10.24) 20.01(1.24) 4.21(0.59) 1.48(2.89) 2.02(2.30)
5 100 55.03(2.31) 19.94(0.46) 4.02(0.32) 2.03(0.97) 2.09(0.79)
20 100 55.00(1.22) 19.97(0.22) 3.99(0.15) 1.98(0.49) 2.01(0.40)
括号内数字为相应估计值的标准差。
Numbers in parentheses are standard deviations of corresponding estimates.
第 10期 王学枫等: 基于 NC III和 TTC设计的胚乳性状 QTL区间作图方法 1741
QTL。此外, 在遗传力较低且样本容量较小时, TTC
方法对QTL的位置和效应估计值的准确度和精确度
均优于 NC III 方法, 但是这一优势随着遗传力的提
高和样本容量的增大而降低。由此说明, 只要在适
当的样本容量下, 2种设计均可有效用于实际胚乳性
状的 QTL分析。
3 讨论
Mo[11]在 20世纪 80年代首次提出了三倍体胚乳
性状的数量遗传模型, 随后, 不同研究者提出了不
同的三倍体遗传模型, 并应用于多个实例数据的数
量遗传分析[12,17-19]。随着分子生物学技术的发展, 高
密度标记图谱的出现使得进一步精确定位各种遗传
因子和 QTL成为可能。目前, 已有很多二倍体性状
作图方法[20-25], 不少研究者仍沿用这些方法对三倍
体胚乳性状进行分析[26-28], 而完全忽略了胚乳的三
倍体遗传特性, 这显然是不合理的。
胚乳性状QTL分析方法是近几年才逐渐引起注
意的一个研究课题。笔者等[2]首次报道了利用分子
标记对胚乳性状进行QTL图谱构建的双侧标记基因
型均值回归方法。这一方法是根据某一区间双侧标
记基因型胚乳性状的平均值为依变数, 以该区间内
任一点假定存在的QTL的加性效应和显性效应的系
数为自变数, 进行有重复观察值的多元线性回归分
析。类似于 Haley 和 Knott[21]的简单回归 QTL 作图
方法, 该方法的优点是计算速度快。但其不足之处,
一是未能考虑标记基因型内 QTL 方差的异质性和
QTL 基因型的混合分布特性; 二是该方法无法估计
胚乳性状的两种显性效应。Wu等[4]提出基于 F3单粒
种子观察值的胚乳 QTL定位模型, 但其模型仅针对
每个 F2植株上只观测一粒 F3种子的情形。笔者等[3]
根据标记基因型内 QTL方差的异质性, 提出专用于
方差异质的 QTL迭代重新加权最小平方法。但其仍
无法区分 2 种显性效应, 而且也忽略了标记基因型
内 QTL 基因型的混合分布特性。Wu 等[4]进一步提
出可以利用分离群体的植株和该植株上自交种子的
胚的分子标记基因型, 联合推断该种子的胚乳 QTL
基因型。由于利用了 2个世代 DNA的信息, 故可以
提高 QTL的作图精度。但其不足则是试验成本显著
增加, 而且其精度提高并不明显。因为, 对于 QTL
基因型为纯合的植株来说, 该植株上的所有自交种
子的胚的基因型均不分离。所以, 对于 QTL基因型
为 QQ和 qq的植株来说, 该植株上所有胚的基因型
均为 QQ 和 qq, 测定这些植株上的胚的分子标记基
因型并不能增加胚乳 QTL 基因型的推断效益。Cui
等[5]在Wu等的基础上, 进一步提出基于简单回交群
体的种子性状 QTL作图新方法, 用于研究母体和子
代的直接遗传效应及上位性遗传效应。Cui等的模拟
研究结果表明, 该方法能够准确估计不同世代的加
性效应和显性效应。最近, Cui等[29]又发展了适用于
二倍体胚和三倍体胚乳基因组之间上位性效应分析
的 QTL作图方法。大量模拟研究显示, 该方法在中
等样本容量和遗传力下就可以获得QTL位置和效应
的准确估计值。Cui等[29]的模型是在 QTL作图框架
中研究种子发育调控的有力尝试。
上述关于胚乳性状的 QTL作图方法中, 极大似
然方法由于综合利用了QTL基因型的先验概率以及
相关个体胚乳性状的观察结果, 理所当然要优于基
于最小平方算法的标记基因型均值回归方法以及
IRWLS 方法[30]。这一结论在 Xu[30-31]以及 Kao[32]的
研究中均已得到证明。然而, 上述 Wu 等[4]以及 Cui
等[29]提出的胚乳性状极大似然 QTL 作图方法均是
以单粒胚乳观察值为数据模式进行的, 无法直接用
于分析那些以多粒胚乳混合样品测定的胚乳性状。
而许多胚乳性状在现有研究水平和实验条件下还难
以单粒定量分析。为此, 笔者等[6]以及 Wang 等[7]先
后发展了基于株平均值或混合样品测定结果的胚乳
性状 QTL作图的极大似然方法, 该方法以分离群体
植株的分子标记基因型以及植株上若干粒自交种子
胚乳混合样本观察值为数据模式, 采用 EM 精确算
法和近似算法两种策略实现QTL参数的极大似然估
计。这一方法在玉米爆裂性状, 籽粒淀粉含量和蛋
白含量的 QTL 分析上已有应用[8-9,33]。但其不足是,
无论精确算法还是近似算法, 均无法区分胚乳 QTL
的两种显性效应。近来, Wen等[10]率先提出一种基于
随机交配设计的胚乳性状 QTL作图方法, 该方法以
分离群体的个体的成对杂交衍生的家系平均数为数
据模式, 模拟分析结果表明该方法确实可以分辨胚
乳性状的两种显性效应。其不足是, 由于分离群体
中具有较多的个体, 杂交工作量较大, 难以适合于
自花授粉作物胚乳性状的QTL分析。此外, Wen等[10]
的方法也并未涉及家系平均数的精确解法。
本文提出利用经典数量遗传学上常用的 NC III
设计以及 TTC设计进行胚乳性状的QTL分析, 并分
别发展了基于这两种设计的家系平均值的胚乳 QTL
作图的极大似然方法。较 Wen等[10]基于随机交配设
1742 作 物 学 报 第 34卷
计的胚乳性状QTL分析方法, 显著减少杂交工作量,
例如, 100个 F2植株, NC III设计仅需 200个杂交, 而
Wen等的随机交配设计, F2群体 20个植株两两杂交
即有 200 个左右的杂交, 显然 20 个个体构成的 F2
群体的遗传组成可能因遗传漂变而非常有偏。为了
保证群体遗传组成的无偏性, 随机交配设计的 F2群
体可能需要适中的样本容量, 此时的杂交量将成倍
增加。此外, 本文提出用 P1、P2和 F1花粉授予同一
母株的做法, 工作量主要在母株的去雄上, 因为无
论是 NC III设计还是 TTC设计, 不同家系的父本均
为同质群体, 其花粉量以及授粉均非常容易。
通过计算机模拟数据系统验证了本文方法的可
行性和有效性。2 种设计均有较高的 QTL统计功效
以及 QTL位置和效应估计的准确度与精确度。但相
对来说, TTC设计的 QTL统计功效以及位置与效应
估计精度要高于 NC III 设计。这主要是因为, TTC
设计每一母株上有 3 个家系群体, 而 NC III设计则
仅有 2 个家系群体。但是本文模拟研究也发现, 随
着样本容量的增大和 QTL 遗传力的提高, 2 种方法
对QTL各种遗传效应估计的精确度和准确度渐趋一
致。因此, 就总体而言, 2种方法的作图效果并无太
大差别。其可能原因是, 在 F2植株基因型杂合的情
况下, 用 F1给该植株授粉所产生的家系中两种胚乳
杂合基因型是混杂的, 因此并不能为 2种显性效应的
分别估计提供更多信息。笔者认为基于 NC III设计
的胚乳性状 QTL作图方法, 可能具有更高的实用价
值。此外, 模拟研究还发现, 相同大小的 QTL, 采用
不同的抽样策略 , 虽然可能会有不同的分析效果 ,
但总体来说, 只要 F2群体植株数与家系内胚乳测定
数的乘积相仿, 不同抽样策略的分析效果差异并不
太明显。例如, 在 NC III 设计下, 50×20 和 100×10
的 2种抽样策略的 QTL分析精度几乎没有可分辨的
差异。但值得注意的是, 由于不同抽样策略的标记
分析成本与胚乳性状测定成本不同, 通常前者的试
验成本大得多 , 因此 , 为了降低整个试验成本 , 可
以考虑在适当的 F2植株数的基础上, 尽可能增大混
合样品测定的胚乳数, 以提高 QTL分析的精度。
此外 , 虽然本文模拟研究仅用近似算法进行 ,
而未进行精确算法的计算机模拟分析, 但这并非暗
示在实际数据分析中, 只需采用本文提出的近似算
法。由于基于平均数的精确算法在 QTL效应的估计
精度上要优于近似算法, 这在 F2:3 设计的模拟分析
中已得到验证[6], 因此, 在实际胚乳性状的 QTL 分
析时, 建议采用本文发展的精确算法, 这不仅可以
提高 QTL 作图的精度, 而且一次实验数据的分析,
并不像模拟分析那样占用太多的机时。
最近, 研究者陆续发展了一些新 QTL作图方法
用于研究胚乳性状表达中的各种遗传现象, 如 Cui
等[5]的亲子间上位性效应 QTL作图方法, Zhang等[34]
的亲子间联合效应的QTL作图方法, Hu等[35]的包含
母体效应的胚乳性状 QTL作图方法, 以及 Cui等[29]
提出的研究胚和胚乳间上位性效应作图方法。它们
无疑为胚乳性状研究注入了新的活力, 同时也使胚
乳性状 QTL作图研究进入了新的发展阶段。但是这
些方法均是在单粒胚乳性状观察值的基础上发展起
来的, 因此并不适用于那些目前尚无法单粒定量的
胚乳性状。因此, 本文发展的基于混合样品观察值的
QTL作图策略可以进一步拓展用于此类胚乳性状研究,
使上述方法具有更为广泛的适用性。
值得注意的是, 本文方法是在假定胚乳性状仅
受三倍体遗传控制的基础上发展起来的。虽然有许
多胚乳性状的遗传表达确实是仅受(或主要受)胚乳
基因型控制的, 但可能仍有一些胚乳性状是同时受
控于三倍体胚乳基因型以及二倍体母体基因型[1]。
针对不同遗传表达系统的胚乳性状, 要采取相应不
同的育种策略。对于受母体基因型控制的胚乳性状
来说, 首要目标是选育到理想的母体基因型; 而对
受胚乳基因型控制的性状, 则要选育到理想的胚乳
基因型。这对常规的纯系品质育种应该没有问题 ,
但对杂优利用中的品质育种来说, 则要注意到杂种
F1植株上的 F2代米粒可能会因胚乳基因型的不同而
发生遗传分离。因此, 为了阻止因 F2代米粒发生遗
传分离而影响品质, 理想途径是使两个杂交亲本具
有等位的优质基因。
4 结论
根据三倍体胚乳性状的数量遗传模型, 首次提
出基于 NC III 以及 TTC 两种遗传设计的胚乳性状
QTL 作图新方法, 通过计算机模拟数据验证了方法
的可行性和有效性, 2种设计均可有效定位控制胚乳
性状的 QTL以及估计胚乳 QTL的 2个显性效应。
References
[1] Mo H-D(莫惠栋). Seed traits and the identification of its ge-
netic effect. Jiangsu Agric Res (江苏农业研究), 1990, 11(2):
11−15 (in Chinese with English abstract)
[2] Xu C-W(徐辰武), He X-H(何小红), Kuai J-M(蒯建敏), Gu
第 10期 王学枫等: 基于 NC III和 TTC设计的胚乳性状 QTL区间作图方法 1743
S-L(顾世梁). Mapping quantitative trait loci underlying en-
dosperm traits in cereals. Sci Agric Sin (中国农业科学), 2001,
34(2): 117−122 (in Chinese with English abstract)
[3] Xu C, He X, Xu S. Mapping quantitative trait loci underlying
triploid endosperm traits. Heredity, 2003, 90: 228−235
[4] Wu R, Lou X Y, Ma C X, Wang X, Larkins B A, Casella G. An
improved genetic model generates high-resolution mapping of
QTL for protein quality in maize endosperm. Proc Natl Acad
Sci USA, 2002, 99: 11281−11286
[5] Cui Y, Casella G, Wu R. Mapping quantitative trait loci inter-
actions from the maternal and offspring genomes. Genetics,
2004, 167: 1017−1026
[6] Xu C-W(徐辰武), Wang W(王伟), Hu Z-Q(胡治球), Sun
S-S(孙长森). Plant average-based maximum likelihood map-
ping of quantitative traits loci controlling endosperm traits.
Acta Agron Sin (作物学报), 2005, 31(10): 1271−1276 (in
Chinese with English abstract)
[7] Wang X, Hu Z, Wang W, Li Y, Zhang Y, Xu C. A mixture
model approach to the mapping of QTL controlling en-
dosperm traits with bulked samples. Genetica, 2008, 132:
59−70
[8] Li Y-L(李玉玲), Dong Y-B(董永彬), Cui D-Q(崔党群), Niu
S-Z(牛素贞 ), Wang Y-Z(王延召 ), Yu Y-L(余永亮 ). QTL
mapping of popping characteristics in popcorn using the
model of trisomic inheritance in the endosperm. Sci Agric Sin
(中国农业科学 ), 2006, 39(3): 488−455 (in Chinese with
English abstract)
[9] Dong Y-B(董永彬), Li Y-L(李玉玲), Niu S-Z(牛素贞). QTL
analysis of starch content in maize kernels using the trisomic
inheritance of the endosperm model. Hereditas (遗传), 2006,
28(11): 1401−1406 (in Chinese with English abstract)
[10] Wen Y X, Wu W R. Methods for mapping QTLs underlying
endosperm traits based on random hybridization design. Chin
Sci Bull, 2006, 51: 1976−1981
[11] Mo H. Genetic expression for endosperm traits. In: Weir B S,
Eisen E J, Goodman M M, Namkoong G, eds. Proceedings of
the Second International Conference on Quantitative Genetics.
Massachusetts: Sinauer Associates, Inc., 1988. pp 478−487
[12] Bogyo T P, Lance R C M, Chevalier P, Nilan R A. Genetic
models for quantitatively inherited endosperm characters.
Heredity, 1988, 60: 61−67
[13] Dempster A P, Laird M N, Rubin D B. Maximum likelihood
from incomplete data via the EM algorithm. J Royal Stat Soc,
Ser B (Methodol), 1977, 39: 1−38
[14] Zhai H-Q(翟虎渠), Wang J-K(王建康). Applied Quantitative
Genetics (应用数量遗传学 ). Beijing: China Agricultural
Scientech Press, 2007 (in Chinese)
[15] Jiang C, Zeng Z B. Mapping quantitative trait loci with
dominant and missing markers in various crosses from two
inbred lines. Genetica, 1997, 101: 47−58
[16] Piepho H P. A quick method for computing approximate
thresholds for quantitative trait loci detection. Genetics, 2001,
157: 425−432
[17] Foolad M R, Jones R A. Models to estimate maternally con-
trolled genetic variation in quantitative seed traits. Theor Appl
Genet, 1992, 83: 360−366
[18] Pooni H S, Kumar I, Khush G S. A comprehensive model for
disomically inherited metrical traits expressed in triploid tis-
sues. Heredity, 1992, 69: 166−174
[19] Zhu J, Weir B S. Analysis of cytoplasmic and maternal effects:
II. Genetic models for triploid endosperms. Theor Appl Genet,
1994, 89: 160−166
[20] Lander E S, Botstein D. Mapping mendelian factors underly-
ing quantitative traits using RFLP linkage maps. Genetics,
1989, 121: 185−199
[21] Haley C S, Knott S A. A simple regression method for map-
ping quantitative trait loci in line crosses using flanking
markers. Heredity, 1992, 69: 315−324
[22] Jansen R C. Interval mapping of multiple quantitative trait
loci. Genetics, 1993, 135: 205−211
[23] Zeng Z B. Precision mapping of quantitative trait loci. Ge-
netics, 1994, 136: 1457−1468
[24] Kao C H, Zeng Z B. General formulas for obtaining the MLEs
and the asymptotic variance-covariance matrix in mapping
quantitative trait loci when using the EM algorithm. Biomet-
rics, 1997, 53: 653−665
[25] Kao C H, Zeng Z B, Teasdale R D. Multiple interval mapping
for quantitative trait loci. Genetics, 1999, 152: 1203−1216
[26] Tan Y F, Li J X, Yu S B, Xing Y Z, Xu C G, Zhang Q. The
three important traits for cooking and eating quality of rice
grains are controlled by a single locus in an elite rice hybrid,
Shanyou 63. Theor Appl Genet, 1999, 99: 642−648
[27] Wang X, Woo Y, Kim C S, Larkins B A. Quantitative trait lo-
cus mapping of loci influencing elongation factor 1α content
in maize endosperm. Plant Physiol, 2001, 125: 1271−1282
[28] Wang X, Larkins B A. Genetic analysis of amino acid accu-
mulation in opaque-2 maize endosperm. Plant Physiol, 2001,
125: 1766−1777
[29] Cui Y, Wu J, Shi C, Littell R C, Wu R. Modelling epistatic
effects of embryo and endosperm QTL on seed quality traits.
Genet Res, 2006, 87: 61−71
[30] Xu S. Further investigation on the regression method of map-
ping quantitative trait loci. Heredity, 1998, 80: 364−373
[31] Xu S. Iteratively reweighted least squares mapping of quanti-
tative trait loci. Behav Genet, 1998, 28: 341−355
[32] Kao C H. On the differences between maximum likelihood
and regression interval mapping in the analysis of quantitative
trait loci. Genetics, 2000, 156: 855−865
[33] Li Y-L(李玉玲), Wang Y-Z(王延召), Dong Y-B(董永彬).
QTL analysis of protein content in popcorn kernels by using
the trisomic inheritance of the endosperm model QTL. J
Maize Sci (玉米科学), 2006, 14(6): 13−16 (in Chinese with
English abstract)
[34] Zhang L, Yang M C, Wang X, Larkins B A, Gallo-Meagher M,
Wu R. A model for estimating joint maternal-offspring effects
on seed development in autogamous plants. Physiol Genomics,
2004, 19: 262−269
[35] Hu Z Q, Xu C W. A new statistical method for mapping QTLs
underlying endosperm traits. Chin Sci Bull, 2005, 50:
1470−1476