针对林木单地点半同胞子代测定试验,给出遗传模型不同形式的表达式,采用方差分析法推导平衡数据和不平衡数据条件下方差分量估计式,并给出方差分量估计的抽样方差以及方差分量假设检验统计量的计算方法。在此基础上,给出不平衡数据条件下家系遗传力的计算公式以及家系遗传力和单株遗传力抽样方差近似计算方法。对于2个数量性状,给出不平衡数据条件下遗传相关系数估计式,而且还给出遗传相关系数估计的方差近似计算方法。用VC++6.0编写计算单地点半同胞子代测定模型中各种遗传参数的Windows应用软件。
In this paper, different expressions of a genetic model were presented for the halfsib progeny test of forest trees at a single site. Formulas of estimating the variance components were derived by using ANOVA method for both balanced data and unbalanced data based on the genetic model, and the procedures were also given for calculating sampling variances of the estimators and the statistic for hypothesis test of variance components. Furthermore, a formula of family heritability was given for unbalanced data, and the procedures to calculate sampling variances of family heritability and single tree heritability were also described. For any two quantitative traits, the methods to calculate the genetic correlation coefficient and its sampling variance were presented. Finally, a Windows software was developed to calculate all the parameters of the genetic model and can be freely used by forest breeders.
全 文 :第 !" 卷 第 # 期
$ % # % 年 # 月
林 业 科 学
&’()*+(, &(-.,) &(*(’,)
./01 !",*/1 #
2345,$ % # %
林木半同胞子代测定遗传模型分析!
童春发6 卫6 巍6 尹6 辉6 施季森
(南京林业大学林木遗传与生物技术省部共建教育部重点实验室 6 南京 $#%%78 )
摘 6 要:6 针对林木单地点半同胞子代测定试验,给出遗传模型不同形式的表达式,采用方差分析法推导平衡数据
和不平衡数据条件下方差分量估计式,并给出方差分量估计的抽样方差以及方差分量假设检验统计量的计算方
法。在此基础上,给出不平衡数据条件下家系遗传力的计算公式以及家系遗传力和单株遗传力抽样方差近似计算
方法。对于 $ 个数量性状,给出不平衡数据条件下遗传相关系数估计式,而且还给出遗传相关系数估计的方差近
似计算方法。用 .’ 9 9 "1 % 编写计算单地点半同胞子代测定模型中各种遗传参数的 :;4=> 应用软件。
关键词:6 子代测定;方差分量;遗传力;遗传相关;不平衡数据
中图分类号:&8$$1 7;?7!@6 6 6 文献标识码:,6 6 6 文章编号:#%%# A 8!@@($%#%)%# A %%$B A %8
收稿日期:$%%@ A #% A %@。
基金项目:福建省重点公关项目“杉木纸浆材选育研究”(%$#%#%7#!);国家“十一五”科技支撑育种工程项目“速生优质杉木新品种”
($%%"C,D%#,#!)。
! 施季森为通讯作者。
!"#$%&’& () *+"+,’- .(/+$ )(0 1#$)23’4 50(6+"% 7+&, ’" 8(0+&, 70++&
+/4E ’FG4H36 :I; :I;6 J;4 KG;6 &F; 2;>I4
(!"# $%&’(%)’(# ’* +’(",) -".")/0, 1 2/’)"03.’4’5# ’* 6/./,)(# ’* 7890%)/’.6 :%.;/.5 +’(",)(# <./="(,/)#6 :%.;/.5 $#%%78 )
!4&,0#-,:6 (4 LF;> M3MIN,<;HHINI4L IOMNI>>;/4> /H 3 EI4IL;P Q/
LNII> 3L 3 >;4E0I >;LI5 U/NQG03> /H I>L;Q3L;4E LFI V3N;34PI P/QM/4I4L> =INI
S3034PI< <3L3 34< G4S3034PI< <3L3 S3>I< /4 LFI EI4IL;P Q/
>3QM0;4E V3N;34PI> /H LFI I>L;Q3L/N> 34< LFI >L3L;>L;P H/N FTM/LFI>;> LI>L /H V3N;34PI P/QM/4I4L>5 UGNLFINQ/NI,3 H/NQG03 /H
H3Q;0T FIN;L3S;0;LT =3> E;VI4 H/N G4S3034PI< <3L3,34< LFI MN/PI
34< >;4E0I LNII FIN;L3S;0;LT =INI 30>/ PN;SI<5 U/N 34T L=/ XG34L;L3L;VI LN3;L>,LFI QILF/<> L/ P30PG03LI LFI EI4IL;P
P/NNI03L;/4 P/IHH;P;I4L 34< ;L> >3QM0;4E V3N;34PI =INI MNI>I4LI<5 U;4300T,3 :;4=> >/HL=3NI =3>
9+% :(0/&:6 MN/EI4T LI>L;V3N;34PI P/QM/4I4L>;FIN;L3S;0;LT;EI4IL;P P/NNI03L;/4;G4S3034PI< <3L3
6 6 虽然林木遗传育种的理论研究已进入基因组时
代,但是目前在林木遗传改良的实践中,子代测定仍
然是林木遗传改良工作的关键环节,遗传测定工作
的好坏直接关系到遗传增益能否获得提高和育种工
作能否获得持续发展(王明庥,$%%#)。林木遗传测
定的一项重要任务就是估算亲本性状的遗传方差、
协方差以及遗传相关、遗传力等遗传参数,这些参数
是进一步估算遗传增益或计算多性状选择指数的先
决条件。林木遗传参数的估计需要建立线性模型进
行分析,模型中会包含种源、家系、单株、地点、年份
等因素的效应,这些效应有的是固定的,有的则是随
机的,这样的线性模型称为混合线性模型或方差分
量模型。林木遗传育种学家通常采用方差分析法
(,*W.,)对模型中的方差分量进行估计,进而估计
其他的遗传参数。由于混合线性模型是数理统计学
领域里一个比较复杂的专题,这使得不少林木遗传
育种学家在估算遗传参数时感到比较困难。事实
上,文献中对林木遗传模型,特别是非平衡数据的林
木遗传模型的参数估计理论和方法论述得不多或不
够详尽,并且到目前为止还没有开发出比较好的应
用软件来估计林木遗传育种参数。
方差分量模型在遗传育种模型分析中的应用由
来已久,并且还在不断地发展和完善之中。方差分
析法是估计方差分量模型中方差分量的一种统计方
法,最 早 由 U;>FIN( #B$Y)提 出,后 来 由 +;MMILL
(#B7#)、*ITQ34 等(#B7Y)和 D34;I0>(#B7B)等得到
发展。KI4
的方差分析法,其最大的贡献在于其能够处理不平
衡数据,且能分析较为复杂的方差分量模型,随后方
差分析法在动植物遗传模型分析中得到了广泛的应
林 业 科 学 !" 卷 #
用。虽然 $% 世纪 &% 年代后提出了估计方差分量的
极大似然法(’()()*+,-./ !" #$0,12"&)、边缘极大
似然法(34’()(5*,,.+678 !" #$0,12&1)和最小范数
二次无偏估计(’9:;<4)(3*7,12&1)等,但是迄今
为止方差分析法在遗传育种模型分析中的应用仍然
是最为广泛的。最近 $% 多年来,对方差分量估计的
抽样方差和假设检验也展开了一些研究(=>.,.+6 !"
#$0,122?;@AB+> !" #$0,122C;DAB !" #$0,$%%!;
E>*FG*7-> !" #$0,$%%2)。经典的林木遗传育种模型
大多属于方差分量模型,其理论方法来源于一般的
方差分量模型,其研究对象有别于动物和农作物。
国内 外 林 木 数 量 遗 传 学 文 献( H+>IA,, 12&";
:*FJ778I,12&2;H>-->*F6 !" #$0,$%%$;续九如,
$%%")中有关林木遗传模型分析大多只涉及平衡数
据模型,对非平衡数据模型以及有关方差分量估计
的统计性质,如标准误差、假设检验等,没有详尽的
论述或根本没有论述。
半同胞子代测定在林木家系选择中有着重要应
用,目前仍然有不少研究报道(季孔庶等,$%%?;黄少
伟等,$%%";翟思万等,$%%&;K-*L* !" #$0,$%%&;
M.NN.88 !" #$0,$%%C)。本文针对林木单地点半同胞
子代测定试验,给出遗传模型不同形式的表达式,采
用方差分析法推导了平衡数据和不平衡数据条件下
方差分量估计式,并给出方差分量估计的抽样方差以
及方差分量假设检验统计量的计算方法。在此基础
上,给出了不平衡数据条件下家系遗传力的计算公式
以及家系遗传力和单株遗传力抽样方差近似计算方
法。对于 $ 个数量性状,给出了不平衡数据下遗传相
关系数估计式,而且还给出了遗传相关系数估计的方
差近似计算方法。最后,用 OP Q Q "0 % 编写了计算
单地点半同胞子代测定模型中各种遗传参数的
H>8L7R6 应用软件,供林木遗传育种工作者使用。
1# 统计方法
!" !# 统计模型
林木单地点半同胞家系子代测定为随机区组试
验,被测的某个数量性状值可用线性模型表示为
%&’( ) ! * +& * ,’ *(+,)&’ * !&’(, (1)
式中,! 为总体均值;+& 为第 & 个区组的固定效应,
& S 1,$,⋯ ,-;,’ 为第 ’ 个家系的随机效应,’ S
1,$,⋯ ,.,4(,’)) %,O*+(,’)) "
$
T ;(+,)&’ 为
第 & 个区组第 ’ 个家系的随机效应,4[(+,)&’] )
% ,O*+[(+,)&’] ) "
$
KT;!&’( 为第 & 个区组第 ’ 个家
系第 ( 个单株的随机误差,( S 1,$,⋯ ,/&’,
4( !&’() ) %,O*+( !&’() ) "
$
.。同时假定所有因子间
的协方差为 %(HA>,. !" #$0,12C2)。对于模型(1),
主要任务是对方差分量 "$T、"
$
KT 和 "
$
. 作出估计,并
考察它们的统计性质。
模型(1)还可以用矩阵表达为
% ) 0# * 11, * 1$(+,)* !, ($)
式 中, # ) (!,+1,⋯,+-)2,, ) (,1,⋯,,.)2,
(+,) )[(+,)11,(+,)1$,⋯,(+,)-.]2,0 为 / 3
( - * 1)矩阵,11 为 / 3 .矩阵,1$ 为 / 3 -.矩阵,%
为 / 3 1 的数量性状观测向量,! 为 / 3 1 的随机误
差向量,这里 / ) $
&,’
/ &’ 为观测的总株数。
当小区单株个数均为 4 时,即数据是平衡的,那
么上述遗传模型还可以表示为
% )[(1 -,5-)( 1 . ( 1 4]# *(1 - ( 5. ( 1 4), *
( 5- ( 5. ( 1 4)(+,)*( 5- ( 5. ( 54)!。(U)
式中,符号 ( 表示矩阵的 @+78.VJ.+ 乘积,5- 表示 -
阶单位矩阵,1 -表示元素全为 1 的 -维向量,其他符
号类似。
!" $# 方差分析法
方差分析法估计方差分量的主要思想是将方差
分量模型中的随机效应看作固定效应,按通常的方差
分析法算出各效应对应的平方和,再根据随机效应模
型计算这些平方和的数学期望,它们是方差分量的线
性函数,然后令这些数学期望等于各自对应的平方
和,便得到关于方差分量的 1 个线性方程组,解此方
程组就得到方差分量的估计(王松桂等,$%%&)。对于
模型(1),可按如下方法估计方差分量。
1)先将 , 和(+,)看作随机效应向量,设
61 ) 5 7 0(020)
7 02,式中右上角“ 7”号表示矩阵
的广义逆,则模型的误差平方和为 4MM(#) )
%261 %;再将 , 看作固定效应向量,而(+,)仍然看
作随机效应向量,并记 6$ ) 5 7(0,11)[(0,
11)2(0,11)]
7(0,11)2,则模型的误差平方和为
4MM(#,,)) %26$ %;最后将 , 和(+,)都看作固定
效应向 量,并 设 6U ) 5 7(0,11,1$)[(0,11,
1$)2(0,11,1$)]
7(0,11,1$)2,则模型的误差平方
和为 4MM(#,,,+,) ) %26U %。
$)设 8% ) 5 7 61,81 ) 61 7 6$,8$ ) 6$ 7 6U,
8U ) 6U,则区组间、家系间、小区间和小区内的误差
平方和分别为 4MMK ) %28% %,4MMT ) %281 %,4MMKT )
%28$ % 及 4MM. ) %28U %。不难验证矩阵 8%、81、8$ 和 8U
都是投影阵,而且它们所张成的向量空间相互正交,
因此数量性状值的平方和可以分解为
%2% ) 4MMK * 4MMT * 4MMKT Q 4MM.。 (!)
%U
! 第 " 期 童春发等:林木半同胞子代测定遗传模型分析
此外,家系间、小区间和小区内的误差平方和的数学 期望分别为
#(#$$%) & ’([!" )*+( ")] # ’(($%"!"$")!
,
% & ’(($%,!"$,)!
,
-% & ’((!")!
,
.;
#(#$$-%) # ’([!, )*+( ")] # ’(($%,!,$,)!
,
-% & ’((!,)!
,
.;
#(#$$.) # ’([!/ )*+( ")] # ’((!/)!
,
.
{
。
(0)
式中,’( 表示矩阵的迹。
/)记 "" # ’(($%"’"$"),", # ’(($%,’,$,),
并根据矩阵的广义逆和迹运算的性质,则(0)式中
方差分量的系数可以作如下简化:
’(($%"!"$") # ""
’(($%,!"$,) # "" ( ",
’(($%,!,$,) # "
{
,
! 及
’((!") # ) ( "
’((!,) #( * ( ")( ) ( ")
’((!/)
{
# + ( *)
。 (1)
这样就得到了不平衡数据的方差分析表(表 ")。
表 !" 单地点半同胞子代测定不平衡数据的方差分析表
#$%& !" ’($)*+,+ -. /$0,$(12 .-0 3(%$)$(124 4$5$ .0-6 $
7$).8+,% 90-:2(* 52+5 $5 $ +,(:)2 +,52
方差来源
$*2().
自由度
34
误差平方和
#((*( 526
*4 5728(.5
数学期望
#9:.);8;<*=
区组间 ->*)? * ( " #$$!
家系间 %86<>@ ) ( " #$$%
""!
,
% &("" (
",)!
,
-% &
( ) ( ")!,.
区组 A家系
->*)? A %86<>@
( * ( ")( ) ( ") #$$-%
",!
,
-% &
( * ( ")( ) ( ")!,.
误差 #((*( + ( *) #$$. ( + ( *))!,.
! ! 令家系间、小区间和小区内的误差平方和的数
学期望等于各自的误差平方和,解线性方程组,得到
各方差分量的估计为
,!,. #
"
+ ( *)
#$$.;
,!,-% #
"
",
#$$-% (
( * ( ")( ) ( ")
",(+ ( *))
#$$.;
,!,% #
"
""
#$$% (
"" ( ",
""",
#$$-% &
! !
[""( * ( ")( ", *]( ) ( ")
""",(+ ( *))
#$$.
。
(B)
! ! 当数据平衡时,即小区单株数均为 - 时,则 + #
*)-,"" # *-( ) ( "),", # -( * ( ")( ) ( ")。此时,
家系间、小区间和小区内的误差平方和可表示为
#$$% # *-$
)
. # "
()"·.· ( )")
,;
#$$-% # -$
*
/ # "
$
)
. # "
()"/.· ( )"/·· ( )"·.· & )")
,;
#$$. # $
*
/ # "
$
)
. # "
$
0
1 # "
( "/.1 ( )"/.·)
,
。
(C)
!; <" 方差分量估计的抽样方差
由于模型(")中各随机效应均服从正态分布,
所以 " 2 3(4#,$),其中 $ # )*+( ")# $%"$"!
,
% &
$%,$,!
,
-% & 5!
,
.。对于平衡数据,根据多元正态分布
的二次型理论($.8(>. 67 89D ,"EE,),可知
"%!" " :( *-!
,
% & -!
,
-% & !
,
.) 2 %
,
) (";
"%!, " :( -!
,
-% & !
,
.) 2 %
,
( * (")( ) (");
"%!/ " : !
,
. 2 %
,
*)( - (")
{
。
(E)
由上式并注意到区组间、小区间和小区内的误差平
方和互不相关,得到各方差分量估计方差的无偏估
计为:
F8(G( ,!,.) #
,
*)( - ( ")& ,
H$#,.;
F8(G( ,!,-%) #
,
-,
"
( * ( ")( ) ( ")&[ ,H$#,-% &
! ! ! ! ! "
*)( - ( ")& ,
H$#, ]. ;
F8(G( ,!,%) #
,
*, -,
"
) & "
H$#,%[ &
! ! ! ! ! "
( * ( ")( ) ( ")& ,
H$#, ]-%
。
("I)
式中,H$# 为误差平方和的均方。
对于不平衡数据,用上述方法仍然可以得到
F8((#$$.)的无偏估计为
F8(G( ,!,.) #
,
(+ ( *)),(+ ( *) & ,)
#$$,.。("")
但对于 F8((#$$%)和 F8((#$$-%)的估计,情况却
有所不同,因为 #$$-% 和 #$$% 不再服从 %
, 分布,不
相关不再成立。但是根据二次型的方差和协方差的
有关结论($.8(>.,"EEB),可以得到
F8(G(#$$%) # ,’((!"$)
,;
F8(G(#$$-%) # ,’((!,$)
,{ 。 (",)
"/
林 业 科 学 !" 卷 #
$%&(’((),’((*))! +,-(".!"+!)!
+,-[(#. $ #+)%+%&+#+%+%&+]"
!
*);
$%&(’((),’((/)! +,-(".!"0!)! 1;
$%&(’((*),’((/)! +,-("+!"0!)! 1
。
(.0)
# # 由( .+)和( .0)式,并注意到 23-(’((/) !
+
’ $ () * +
’((+/ ,根据(4)式得到在不平衡数据条件
下 +"+*) 和 +"
+
) 的方差的估计为
23-( +"+)) !
.
#+.
23-(’(())*
(#. $ #+)
+
#+.#
+
+
23-(’((*))$
+(#. $ #+)
#+.#+
$%&(’((),’((*))*
# # # # #
[#.( ( $ .)$ #+ (]
+( ) $ .)+
#+.#
+
+(’ $ ())
+ 23-(’((/);
23-( +"+*)) !
.
#++
23-(’((*))*
( ( $ .)+( ) $ .)+
#++(’ $ ())
+ 23-(’((/
)。
(.!)
!" #$ 方差分量的假设检验
常用 5367 方法对方差分量是否显著为零进行
假设检验(王松桂等,+114)。首先考虑 "+*) 的假设
检验问题,此时零假设为 81:"
+
*) ! 1,备择假设为
8.:"
+
*) , 1。将模型(+)中的随机效应向量 -和 .-
视为固定效应,则模型拟合后的误差平方和为
’((/ ! / /。若零假设成立,则模型(+)变为 / !
0$ * %.- * 1,此时同样将 - 视为固定效应向量,模
型拟合后的误差平方和为 ’((/1 ! /+ /。可以验
证:.)’((/ 2 "
+
/ 3 %
+
’ $ ();+)当 "
+
*) ! 1 时,(’((/1 $
’((/)2 "
+
/ 3 %
+
( ( $.)( ) $.)且与 ’((/ 相互独立。因此在
零假设成立时,有
- !
(’((/1 $ ’((/)2( ( $ .)( ) $ .)
’((/ 2(’ $ ())
3
# -[( ( $ .)( ) $ .),’ $ ()], (.9)
这就是检验 "+*) 是否显著为零的统计量。
由此可以看出,无论是平衡数据还是不平衡数
据,利用(.9)式均可对 "+*) 是否为零进行显著性检
验。下面考虑 "+) 是否显著为零的假设检验问题,即
零假设为 81:"
+
) ! 1 ,备择假设为 8.:"
+
) , 1 。对
于平衡数据,由(:)式可知,在零假设成立的条件
下,有
- !
/&". / 2( ) $ .)
/&"+ / 2( ( $ .)( ) $ .)
3
-[( ) $ .),( ( $ .)( ) $ .)], (.")
此为平衡数据条件下 "+) 是否显著为零的假设检验
问题的统计量。
当数据不平衡时,"+) 的假设检验问题比较复
杂,这里采用 ;<&/-=>/?(.::0)提出的方法推导出 "+)
假设检验的统计量及其计算方法。首先存在一个正
交矩阵 4 ,使得,
4/ !
5.
5+
50
5
!
!
6( )1
$
-
.
-
* 41
!
6.. 6.+ 6.0
1 6++ 6+0
1 1 600
1 1 1
$
-
.
-
* 41, (.4)
式中,6 是行满秩矩阵,(6..,6.+,6.0)的秩为 (,
(6++,6+0)的秩为 ) $ .,600 的秩序为( ( $ .)( ) $
.)。设
7 !(7.,7+) !
6++ 6+0
1 6( )00 ,
则存在正交矩阵 8 ,使得 7+7&+ ! 8&8&,其中 & 为
对角矩阵,而且对角线元素均大于零。记 9 !
& $. 2 +8&,令 : ! 9
5+
5( )0 ,并设 ; ! (( ) $ .),则有
’( :) ! 1,
23-( :) ! 97.7&.9&"
+
) * <;"
+
*) * &
$."+/。
设 # 为 & $. 对角线元素中的最大值,5; 为 5! 的 . 个
子向量,令
= ! : *(#<; $ &
$.). 2 + 5;, (.@)
那么有
’(=) ! 1,
23-(=) ! 97.7&.9&"
+
) *("
+
*) * #"
+
/)<;。
由于 7. 的秩为 ) $ .,因此存在正交矩阵 >,使得
>97. !(?&,1&)&,其中 ? 为行满秩矩阵,其秩为
) $ .。定义随机向量
@ !
@.
@( )+ ! >=,
式中,@. 含有 ) $ . 个元素,@+ 含有( ( $ .)( ) $ .)
个元素,并有
@. 3 A(1,??&"
+
) * <) $."
+
;),
@+ 3 A(1,<( ( $.)( ) $.)"
+
;),
这里 "+; ! "
+
*) * #"
+
/。由于 @. 与 @+ 相互独立,因此
检验零假设 81:"
+
) ! 1 是否成立的统计量为
- !
@&.@. 2( ) $ .)
@&+@+ 2( ( $ .)( ) $ .)
3
+0
! 第 " 期 童春发等:林木半同胞子代测定遗传模型分析
![ " # ",( $ # ")( " # ")]。 ("#)
!" #$ 遗传力的估计及其抽样方差
对于单地点半同胞子代林测定模型("),家系 %
的平均值为
)&·%· ’ ! (
$
$
) ’ "
*)%+)
*·%
( !% (
$
$
) ’ "
*)%(+!))%
*·%
(
$
$
) ’ "
$
*)%
, ’ "
-)%,
*·%
,
($%)
其方差为
&’(()&·%·) ’ "
$
) (
$
$
) ’ "
*$)%
*$·%
"$*) (
"
*·%
"$+( % ’ ",⋯,")。
($")
显然,当数据不平衡时,各家系均值的方差不全相
同,因此在定义家系遗传力时用其平均值来代替,即
家系遗传力定义为
.$) ’
"$)
"
"$
"
% ’ "
&’(()&·%·)
’
"$)
"$) ( ,""
$
*) ( ,$"
$
+
,
($$)
式中,," ’
"
"$
"
% ’ "
$
$
) ’ "
"
*$·%
,,$ ’
"
"$
"
% ’ "
"
*·%
。当数据平衡
时,上式简化为
.$) ’
"$)
"$) ( "
$
*) / $ ( "
$
+ / $0
。 ($,)
! ! 从理论上来讲半同胞家系间的遗传差异只能解
释加性遗传方差的 " - .,因此在计算单株遗传力时,
"$) 则要乘以 .,而分母则以单株的方差 &’(( &)%,)来
代替(/(0123,"#45),即单株遗传力的计算公式为
.$) ’
."$)
"$) ( "
$
*) ( "
$
+
。 ($.)
很明显,单株遗传力计算公式对平衡和不平衡数据
都适用。
遗传力是方差分量函数的比,其抽样方差可用
$ 种近似的方法得到。一种是由 6078+(9:;("#5#)
提出的比较简单的方法:
&’( 1"
1( )$ ’ &’((1")1$$ 。 ($<)
此法将分母看作常量而非随机变量,这是由于遗传
力计算公式中的分母是表型方差,在通常情况下表
型方差比加性方差更容易得到精确估计,因此在实
际操作中常把表型方差当作 " 个已知的参数
(60+3+(9 -2 34=,"##<)。
另一种是基于一阶太勒展开式而得到的 $ 个随
机变量比值方差的近似计算公式:
&’( 1"
1( )$ * &’((1")#$$ ( #
$
"&’((1$)
#.$
#
$#">:?(1",1$)
#,$
,
($5)
式中, #" ’ 5(1"),#$ @ A( 1$ )。上 式 在
B+CD32:(;+("#<4)、*+78+(("#E.) 和 F’C8::;1
("#4#)中有所提及或应用,但没有给出完整的推导
过程,详细推导过程可参见 60+3+(9 等("##<)。式
($<)和($5)均可用来估计遗传力的方差,但($5)
式较为常用(60+3+(9 -2 34=,"##<)。
这里采用($5)式估计家系遗传力和单株遗传
力的方差。由于方差分析法所获得的方差分量估计
都是无偏估计,因此各方差分量估计的数学期望等
于其自身。根据(4)式和(",)式,可以得到方差分
量估计间的协方差。为了计算不平衡数据条件下家
系遗传力的方差,只需在($5)中设 1" @ G!
$
) ,1$ ’
6"$) ( ," 6"
$
*) ( ,$ 6"
$
+,并计算 #" ’ "
$
),#$ ’ "
$
) (
,""
$
*) (,$"
$
+,&’((1"),&’((1$),>:?(1",1$)即可。
类似地可以计算单株遗传力的方差以及平衡数据下
的遗传力的方差。
!" %$ 遗传相关系数估计及其抽样方差
对于 $ 个数量性状 &" 和 &$,在(4)式中令
AHH) ’ &7"8" &$,AHH*) ’ &7"8$ &$,AHH+ ’ &7"8, &$,
则可以得到这 $ 个性状家系间及区组内家系间的遗
传协方差。根据遗传协方差可以得到 $ 个性状的遗
传相关系数的估计为
69# ’
#G"$
#G"" #G! $$
, ($4)
式中,# ’( #"",#$$,#"$)7,#"" 和 #$$ 分别为性状 &" 和
&$ 的遗传方差,#"$ 为这 $ 个性状的遗传协方差,#G""
和 #G$$ 分别为这 $ 个性状的遗传方差估计,#G"$ 为这
$ 个性状的遗传协方差估计。利用($4)式在 # 处的
一阶太勒展开式,得到遗传相关系数估计 69# 的抽样
方差的近似式为
&’(( 69#)
9$#
*
&’(( #G"$)
#$"$
(
&’(( #G"")
.#$""
(
&’(( #G$$)
.#$$$
#
>:?( #G"$,#G"")
#"$ #""
#
>:?( #G"$,#G$$)
#"$ #$$
(
>:?( #G"",#G$$)
$#"" #$$
。 ($E)
! ! 该式最早由 I’JJ09("#<#)提出,后来 H72+0;K+(1
("#55)应用此式推导了 " 个遗传相关系数的抽样
方差近似表达式。根据正态分布的二次型有关结论
(H+’(J+,"##4)可以计算 &7"8" &$,&7"8$ &$ 和 &7"8, &$
,,
林 业 科 学 !" 卷 #
的方差以及它们之间的协方差,进而可以计算遗传
协方差的方差及其与方差分量之间的协方差,最后
利用($%)式就可以近似计算出遗传相关系数估计
的抽样方差。
$# 结果与讨论
本文详细地分析了林木单地点半同胞子代测定
遗传模型,给出了模型不同表达形式,用方差分析法
推导了不平衡数据条件下方差分量估计的表达式,
并给出了方差分量的抽样方差和假设检验统计量的
计算方法;给出了不平衡数据条件下家系遗传力的
计算表达式以及计算家系遗传力和单株遗传力抽样
方差的方法;描述了任意 $ 个数量性状遗传相关系
数及其抽样方差的计算方法。由于篇幅的限制,文
中有些结果(如遗传力和相关系数的抽样方差)只
描述了其方法步骤和理论依据,没有给出详细的推
导过程和表达式。但是为了弥补这点不足,根据本
文的理论结果,用 &’ ( ( ") * 编写了 +,-./01 应用
软件 23451,677 8) *。该软件可以对单地点半同胞子
代测定的多性状数据进行分析,对于无论是平衡数
据还是非平衡数据,可以计算每个性状的方差分量、
方差分量的标准误、方差分量的假设检验统计量、家
系遗传力和单株遗传力及其标准误、性状间的遗传
相关系数及其标准误。23451,677 8) * 可以免费得到
使用,下载网址为 9::;: < < 5=6,/) ->5?@ A.?@ B- < :/-= <
93451,611 < 93451,611@ 9:C。
在计算方差分量及模型中的其他参数时,本文
在计算方法上有所突破,使得在很短的时间内可以
处理上万个单株数据。如果按照理论表达式(D)计
算方差,那么就会涉及到广义逆矩阵的计算,当数据
量较大时,如大于$ ***个单株数据,个人电脑是难
以承担的。利用正交变换将模型中的设计阵变成
(8D)式中 ! 矩阵,同时也变换数量性状数据,可以
简化计算各个误差平方和以及有关二次型的方差和
协方差,避免了广义逆矩阵的计算。
虽然 7E7 等软件也可以分析方差模型,但它们
不能够完全直接解决林木遗传模型中许多参数计算
问题。7E7 中的 &EF’GHI 过程可对方差分量模型
计算分析,然而 &EF’GHI 过程的方差分析法只给
出方差分量的估计,不能给出方差分量估计的抽样
方差以及方差分量假设检验结果,当然不可能给出
遗传力和遗传相关系数的估计以及它们的抽样方
差。$* 世纪 J* 年代初南京林业大学开发的 7IKL
软件包在国内林木遗传育种界颇受好评(施季森
等,8JJ8),但它的大多功能是进行多元统计分析,
在林木遗传模型方面只涉及到林木双列杂交遗传模
型,而且迄今为止只有 MG7 版本,再没有继续发展
新的版本。
通过林木单地点半同胞子代测定遗传模型分析
可以看出,林木遗传模型的统计理论比较复杂。因
此,文献中关于林木遗传模型,尤其是不平衡数据模
型描述得不够详细,这正是多年来不少林木遗传育
种工作者在分析处理林木试验数据时感到困难的最
主要原因。本文所研究的林木遗传模型形式上比较
简单,但其统计理论和计算方法可用来分析和计算
其他林木遗传模型,如多地点半同胞子代测定模型、
双列杂交遗传模型等。
参 考 文 献
黄少伟,钟伟华,陈炳铨 @ $**"@ 火炬松半同胞子代配合选择的遗
传增益估算 @ 林业科学,!$(!):NN O ND@
季孔庶,樊明量,徐立安 @ $**P@ 马尾松无性系种子园半同胞子代
变异分析和家系选择 @ 林业科学,!8("):!N O !J@
施季森,叶志宏 @ 8JJ8@ 林木遗传改良实用统计应用软件包( 7IKL)
系统简介 @ 林业科技通讯,(88):N* O N$@
王明庥 @ $**8@ 林木遗传育种学 @ 北京:中国林业出版社 @
王松桂,史建红,尹素菊,等 @ $**D@ 线性模型引论 @ 北京:科学出
版社 @
续九如 @ $**"@ 林木数量遗传学 @ 北京:高等教育出版社 @
翟思万,陈启贵,代 # 毅,等 @ $**D@ 华山松半同胞子代测定遗传力
分析及优良家系选择 @ 种子,$"(8$):P O %@
QABRAS + E@ 8J%!@ H3-?34 /5 T?3-:,:3:,UA =A-A:,B1@ ! :9 A.@ I?44C3-:
EB3.AC,B V-:AS;S,1A@
Q43.3 W,I/;A1B? X@ $**D@ 70,11 1:/-A ;,-A ;S/UA-3-BA AY;AS,CA-: ,-
F/C3-,3:WW &3S,3:,/- ,- =S/0:9 3-. 6S3-B9,-= :S3,:1 :/ 3=A 8!@
7,4U3A LA-A:,B3,P"(N < !):8!% O 8P%@
M3-,A41 2 V@ 8JNJ@ Z9A A1:,C3:,/- /5 B/C;/-A-:1 /5 U3S,3-BA@ [/?S-34 /5
:9A F/\34 7:3:,1:,B34 7/B,A:\,7?;;4@ ":8%" O 8JD@
M,BRAS1/- L V@ 8J"J@ ZAB9-,T?A1 5/S SA1A3SB9 ,- T?3-:,:3:,UA 3-,C34
=A-A:,B1 < < ZAB9-,T?A1 3-. ;S/BA.?SA1 ,- 3-,C34 1B,A-BA SA1A3SB9@
]A0 ^/SR:EC 7/B E-,C 7B,,N" O DJ@
M,A:AS1 H [,+9,:A Z _,_,::A44 F ’, "# $%@ 8JJP@ E;44,B3:,/- /5
3;;S/Y,C3:A U3S,3-BA1 /5 U3S,3-BA B/C;/-A-:1 3-. :9A,S S3:,/1 ,-
=A-A:,B :A1:1@ Z9A/SA:,B34 3-. E;;4,A. LA-A:,B1,J8:8P O $!@
X,19AS F E@ 8J$P@ 7:3:,1:,B34 CA:9/.1 5/S SA1A3SB9 0/SRAS1@ 8 1: A.@
V.,-6?S=9 3-. _/-./-:G4,UAS ‘ Q/\.@
L,3C;3/4, &,7,-=AS [ H@ $**J@ LA-AS34,aA. 4,RA4,9//. S3:,/ :A1:1 5/S
U3S,3-BA B/C;/-A-:1 ,- 4,-A3S C,YA. C/.A41@ [/?S-34 /5 7:3:,1:,B34
I43--,-= 3-. W-5ASA-BA,8NJ(!):8!NP O 8!!%@
23S:4A\ 2 G,F3/ [ ] b@ 8J"D@ H3Y,C?C 4,RA4,9//. A1:,C3:,/- 5/S :9A
C,YA. 3-34\1,1 /5 U3S,3-BA C/.A4@ Q,/CA:S,R3,N!:$NN O $!N@
2A-.AS1/- ’ F@ 8JPN@ V1:,C3:,/- /5 U3S,3-BA 3-. B/U3S,3-BA
B/C;/-A-:1@ Q,/CA:S,B1,J:$$" O $P$@
bAC;:9/S-A G@ 8JPD@ E- ,-:S/.?B:,/- :/ =A-A:,B 1:3:,1:,B1@ ]A0 ^/SR:
[/9- +,4A\ ‘ 7/-1@
b9?S, E,H3:9A0 Z,7,-93 Q b@ 8JJ%@ 7:3:,1:,B34 :A1:1 5/S C,YA. 4,-A3S
!N
! 第 " 期 童春发等:林木半同胞子代测定遗传模型分析
#$%&’() *&+ ,$-.:/$01 23’&4 5 6$1(,718)
*9#.$$1: ;) "<=<) 71>-$%?8>3$1 >$ @?91>3>9>3A& :&1&>38( 31 B$-&(>-4) C)
6) D&E9->#&1> $B F:-38?’>?-& G$-&(> 6&-A38& H&801389’
I?’’&>31 "JKK)
*&4#91 /, 7+9(L.3&+38L M, M$’$%L3&N8L4. 6 H) "
E-$P’( 31 9:-38?’>?-9’ &QE&-3#&1>9>3$1) / R 6>9> 6$8 6?EE’,S:
"T= U "JV)
WBA&-(>&1 /) "<
#3Q&% ’31&9- #$%&’() I3$#&>-38(,V<("):VJ U J=)
Y9>>&-($1 Z D,H0$#E($1 R) "<=") R&8$A&-4 $B 31>&-[P’$8. 31B$-#9>3$1
+0&1 P’$8. (3L&( 9-& ?1&@?9’) I3$#&>-3.9,JK:JVJ U JJV)
R9$ \ R) "<=") X(>3#9>3$1 $B A9-3918& 91% 8$A9-3918& 8$#E$1&1>([
]7*^CX >0&$-4) /$?-19’ $B ]?’>3A9-39>& F19’4(3(,":SJ= U S=J)
680&31P&-: X) "<__) H0& (9#E’31: A9-3918& $B >0& 8$--&’9>3$1 8$&BB383&1>(
&(>3#9>&% 31 :&1&>38 &QE&-3#&1>() I3$#&>-38(,SS("):"K= U "<")
6&9-’& 6 R,\9(&’’9 ;,]8\?’’$80 \ X) "<()
*&+ ,$-.:/$01 23’&4 5 6$1(,718)
6&9-’& 6 R) "<<=) a31&9- #$%&’() *&+ ,$-.:/$01 23’&4 5 6$1(,718)
6&PP&11 F ],F-91>&( G \,I$9( W ‘,!" #$) STTK) ;&1&>38 A9-39>3$1 31
91 31>&-19>3$19’ E-$A&1918&[E-$:&14 >&(> $B %&’() *#+&,#!# ]$-) A9-)
,#-#.!’)&) I9-) &> ;$’),31 6b$ Y9?’$,I-9L3’) 63’A9& ;&1&>389,J=
(V c J):"K" U "K_)
H9’’3( ; ]) "
89’8?’9>&% B-$# 919’4(3( $B A9-3918& 91% 8$A9-3918&) F?(>-9’391
/$?-19’ $B 6>9>3(>38(,":OJ U VO)
H3EE&>> a Z \) "
23’’39#( 91% *$-:9>&)
203>& H a, Z$%:& ; R) "
9EE’389>3$1( 31 B$-&(> >-&& 3#E-$A&1>) I$(>$1:M’?+&- F89%&
Y?P’3(0&-()
23’’39#( X R,]9>0&($1 F \,Z9-+$$% \ X) STTS) XQE&-3#&1>9’ %&(3:1
91% 919’4(3( B$- >-&& 3#E-$A&1>) \$’’31:+$$%,‘7\,F?(>-9’39:
\67RW Y?P’3(031:)
2-3:0> / 2) "<=_) 71>-$%?8>3$1 >$ B$-&(> :&1&>38() *&+ ,$-.:F89%&
Y-&((,718)
d0? d,G?1: 2 M) STTV) ‘9-3918& 8$#E$1&1> >&(>31: 31 (E9-9#&>-38
#3Q&% #$%&’() / ]?’>3A9-39>& F19’,<":"T= U ""K)
(责任编辑 ! 徐 ! 红)
JO