全 文 :
第 27 卷 第 4 期 作 物 学 报 V ol. 27, N o. 4
2001 年 7 月 A CTA A GRONOM ICA S IN ICA July, 2001
品种区域试验中算术平均值、BLUP 和AMM I估值的精度比
较Ξ
张群远1 孔繁玲1 杨付新2
(1中国农业大学植物遗传育种系, 北京 100094; 2 中国农业科学院棉花研究所, 河南安阳 455112)
提 要 利用 1982 年以来我国棉花、小麦、水稻和玉米的 60 套区域试验数据, 采用交叉验证方法, 对
区域试验中算术平均值、最佳线性无偏预测值 (best linear unbiased p redicto r, BLU P)和AMM I(additive
m ain effects and m ultip licative in teraction) 模型估值的预测精度进行比较, 结果表明, 与算术平均值相
比, AMM I估值精度的增益倍数 (gain facto r, GF)平均为 1. 045, 变幅为 0. 963~ 1. 414, 其精度多数情
况下提高不大; BLU P 的 GF 平均为 1. 170, 变幅为 1. 008~ 1. 619, 其精度普遍较高。同时, 文中对 3
种估值的模型作了论述和比较。
关键词 区域试验; BLU P; AMM I; 预测精度
Compar ison of the Predictive Accuracy of Ar ithmeticM ean s and BL UPs
and AMM I Estima tes in Reg iona l Crop Tr ia ls
ZHAN G Q un2Yuan1 KON G Fan2L ing1 YAN G Fu2X in2
(1 D epartm ent of P lant Genetics and B reed ing , China A g ricultural U niversity , B eij ing 100094; 2 Institu te of Cotton, Chinese
A cad em y of A g ricultural S cience, A ny ang 455112, China)
Abstract Six ty sets of data from regional trials of co tton, w heat, rice and m aize since 1982 in
Ch ina w ere used in cross validation to compare the p redictive accuracy of arithm etic m eans and
BLU P s (best linear unbiased p red ictors) and AMM I (ad d itive m ain ef f ects and m u ltip licative in2
teraction) estim ates. T he average p recision gain facto r (GF) of AMM I relative to arithm etic m ean
w as 1. 045 w ith a range from 0. 963 to 1. 414, w h ich show ed sligh t increases of p recision; BLU P
w as found commonly to outperfo rm arithm etic m ean and AMM I w ith an average GF of 1. 17,
ranged from 1. 008 to 1. 619.
Key words R egional T rial; BLU P; AMM I; P redictive A ccuracy
作物品种区域试验的目的是在多环境下对参试品种进行比较和评价, 以确定新品种的推
广价值和适应范围。这种比较和评价有赖于对各品种在各环境下的产量 (或其它性状值, 统
称品种×环境组合均值) 作出准确估计。我国区试中历来采用算术平均值进行估计。算术平
均值是最为常用的一种估值, 虽简便易行, 但存在一定局限。一方面, 由于算术平均值是直
接以样本平均数来估计总体均值, 估计时未能充分利用试验中多种变异的信息, 要获得准确Ξ 国家自然科学基金资助项目 (30070433)。赵虹、王磊、王洁、葛知男和孙世贤同志提供了部分数据, 特此致谢!
收稿日期: 2000210208; 接受日期: 2000212224
Received on: 2000210208; A ccep ted on: 2000212224
估值, 需较多的重复数; 另一方面, 算术平均值实质上是对品种试验表现的事后描述, 并非
对品种未来表现的预测, 而后者是我们真正感兴趣的, 具有更重要的实践意义。近年来, 国
外不少研究表明, 利用一些较复杂的模型和方法, 可以得到预测精度比算术平均值更高的估
值, 其中混合线性模型 (m ixed linear model) 的最佳线性无偏预测 (best linear unbiased p redic2
tion, BLU P) [ 1 ]和AMM I(additive m ain effects and m ultip licative in teraction) 模型的AMM I估
值[ 2 ]是最主要的两种。本文结合我国多年区域试验的数据, 对算术平均值、BLU P 和AMM I
三种估值的模型和预测精度进行比较, 探讨各种方法在我国区试中的适用性, 以期有针对性
地引入和利用。
1 材料和方法
1. 1 数据资料
数据取自我国棉花、小麦、水稻和玉米区试分重复记载的共 60 年次的历史资料 (详见表
1)。其中棉花数据为皮棉产量, 小麦、水稻和玉米数据为子粒产量, 单位均为 kgöhm 2。
表 1 区试数据及其提供单位
Table 1 Data and the ir providers
作物
Crop s
区试组别
T rial group s
年份
Years
资料提供单位
p roviders of data
棉花 黄河流域春棉 82~ 96 中国农科院棉花所
Cotton 黄河流域夏棉 86~ 93 中国农科院棉花所
长江流域常规棉 90~ 98 江苏农科院经作所
小麦
W heat
黄淮春水组
黄淮冬水组 87~ 91
河南农科院小麦所
水稻
R ice
中早粳晚熟组
中早粳中熟组
92, 93, 96, 97, 98
93, 94, 98 中国农科院作物所
中籼迟熟组 91, 94, 95, 96 中国农科院水稻所
玉米 华北春玉米 96~ 98 全国农技推广服务中心
M aize 西北春玉米 96, 97
黄淮夏玉米 96
1. 2 各种估值的模型和计算
为便于论述, 下面以 v 个品
种, s 个环境 (通常是地点或地点×
年份的组合环境) , r 次重复的区域
试验为例来阐明各种估值所依据的
数学模型及具体计算方法。第 i 个
品种在第 j 个环境中的第 k 次重复
观测值记为 Y ijk。各种估值的计算
就是依据特定模型对 Y ijk中的信息
进行处理和提取的过程; 而各种模
型的实质是根据各种假设把 Y ijk表
达成相应的理论构成。
1. 2. 1 算术平均值 用算术平
均值来估计各品种在各环境下的性状值, 所依据的是统计学上最简单的一种线性模型:
Y ijk = Λij + Εij k (1)
Λij 为第 i 个品种在第 j 个环境中的真实均值, 也就是我们要估计的真值; Εijk为第 i 个品
种在第 j 个环境中的第 k 次重复观测值的误差。从试验设计的角度看, 区试中品种和环境是
两个因素, 品种 i和环境 j 的搭配即为一个处理, Λij也就是处理均值。所以, 此模型也叫处理
均值 ( treatm en t m eans) 模型[ 2 ]; 它把每个 Y ijk表示为 Λij加上 Εij k的形式, 并用算术平均的方法
对 Λij作出估计: Λδij = Yθ ij = ∑r
k= 1
Y ij kör (2)
Yθ ij 即为第 i个品种在第 j 个环境中的算术平均值。这一模型十分简单和直观, 实际应用
中往往不对其作专门说明。
1. 2. 2 最佳线性无偏预测值 (BLU P) 区试中由于方差分析的需要, 更常用的是另一种线
性可加模型[ 2 ]:
9244 期 张群远等: 品种区域试验中算术平均值、BLU P 和AMM I估值的精度比较
Y ijk = Λ + g i + ej + Ηij + Εij k (3)
Λ为所有观测值所属总体的均值; g i 为品种 i 的效应; ej 为环境 j 的效应; Ηij为品种 i 与
环境 j 的基因型×环境 (GE) 互作效应; Εijk同 (1) 式。区试中往往根据这一模型来进行方差分
析。这一模型实质上是把 (1) 式模型中的 Λij进一步分解为 Λ、g i、ej 和 Ηij四种构成, 此时, Λij
为四种效应的一个可估函数 (即四者之和) ; 利用更一般的线性模型求解方法, 可以获得 Λij的
最佳线性无偏估值 (best linear unbiased estim ation, BLU E)或最佳线性无偏预测值 (BLU P) [ 3 ]。
在模型求解之前, 首先要对各种效应是随机还是固定作出假设。“固定”意味着该效应值在试
验中是一系列定值; “随机”则是指试验中该效应的一系列值是来自于具有特定均值和方差的
总体的一个随机样本。一般来说, Λ是固定效应, Εijk是随机效应, g i、ej 和 Ηij则可根据实际情
况作出各种假设, 所以, (3)式往往是一个既有固定效应, 又有随机效应的混合线性模型。在Λij的四种构成均为固定效应时, 其估值为BLU E; 在四种构成中含有随机效应时, 由于 Λij不
再是一个严格意义上的参数, 故其估值称为预测值, 即BLU P。Peipho (1994) [ 1 ]曾在H ender2
son (1975) [ 3 ]基础上推导出平衡数据时各种模型下 Λij的BLU E 或BLU P 的计算公式如下:
模型É : g i、ej 和 Ηij均为固定效应; Λij的估值记为BLU E;
BLU E = Yθ + (Yθ i - Yθ) + (Yθ j - Yθ) + (Yθ ij - Yθ i - Yθ j + Yθ) = Yθ ij (4a)
模型Ê : g i、ej 和 Ηij均为随机效应; Λij的估值记为BLU Pge;
BLU Pge = Yθ + hg (Yθ i - Yθ) + he (Yθ j - Yθ) + hg e (Yθ ij - Yθ i - Yθ j + Yθ) (4b)
模型Ë : ej 为固定效应, g i 和 Ηij为随机效应; Λij的估值记为BLU Pg。
BLU Pg = Yθ + hg (Yθ i - Yθ) + (Yθ j - Yθ) + hge (Yθ ij - Yθ i - Yθ j + Yθ) (4c)
模型Ì : g i 为固定效应, ej 和 Ηij为随机效应; Λij的估值记为BLU Pe。
BLU Pe = Yθ + (Yθ i - Yθ) + he (Yθ j - Yθ) + hg e (Yθ ij - Yθ i - Yθ j + Yθ) (4d)
其中:
hg =
Ρ2GE + sΡ2GΡ2ör + Ρ2GE + sΡ2G (5a)
he =
Ρ2GE + vΡ2EΡ2ör + Ρ2GE + vΡ2E (5b)
hg e =
Ρ2GEΡ2ör + Ρ2GE (5c)
以上各式中, Yθ 为试验总均值; Yθ i 为第 i 个品种的试验均值; Yθ j 为第 j 个环境的试验均
值; Yθ ij同 (2) 式; Ρ2、Ρ2G、Ρ2E 和 Ρ2GE分别为误差、品种、环境以及品种×环境互作的方差; 均衡
数据时, 可以按一定模型假设进行方差分析, 通过求解期望均方组成来估计这些方差值[ 4 ]。
用这些方差估值代替真值后得出的结果, 虽然已不再是严格的BLU P, 但习惯上仍称之为
BLU P。
根据 (4a) 式可看出, 算术平均值其实就是固定模型下 Λij的BLU E。由 (4b)、 (4c) 和 (4d)
式不难看出, BLU P 实质是依据随机效应方差和误差方差的大小, 相应减小了随机效应在 Λij
估值中所占的比例, 对算术平均值作了适当的“收缩”。模型Ê 和Ë 中把品种效应 g i 看作随机
的, 这似乎与我们区试中方差分析时通常采取的品种效应固定的习惯做法有所矛盾。事实
上, 只要品种效应值服从一定的概率总体的分布, 即使试验方案中品种并非随机抽取, 依据
特定的分析目的, 在统计上也可作为随机效应看待[ 1 ]。就实际含义来看, (5a)式意味着, 若试
验误差 Ρ2 越大, 对试验中表现越极端的品种 (即 Yθ i- Yθ 的绝对值越大) , 越应该持“谨慎”态度
034 作 物 学 报 27 卷
(即 Yθ i- Yθ 的“缩小”越多) , 这与我们的实际经验是吻合的。所以, 品种随机的假设在此有其
合理性。
1. 2. 3 AMM I 模型及其估值 对模型 (3) 中的互作效应值 Ηij 进行主成分分解 (p rincipal
componen t analysis, PCA ) , 即得到AMM I模型[ 2 ]:
Y ijk = Λ + g i + ej + ∑p
n= 1
Κnu inv jn + Θij + Εijk (6)
Κn 为品种×环境两向互作值矩阵的第 n 个奇异值 (其平方即为特征根) ; u in为互作值矩阵
中品种 i的特征向量的第 n 个元素; v jn为互作值矩阵中环境 j 的特征向量的第 n 个元素; Θij为Ηij进行 PCA 分解后的剩余部分; p 的最大可取值N 为 s 和 v 中的最小值减 1, 即 p≤N = M in
( s- 1, v- 1)。p 的取值不同, (6) 式可得到不同的模型, 所以, AMM I模型其实是一系列模
型的总称。p 取值从到N , 对应模型分别称为AMM I20、AMM I21、AMM I22⋯⋯AMM I2N 模
型。实际应用中往往根据 F 测验的显著性来确定 p 的大小 (一般取 Κn 值较大的前 1~ 3 项) ,
这时, p 以后的 (N 2p) 个 PCA 项被当作剩余归入 Θij中。AMM I模型中的 Θij被当作误差看待,
所以, 品种×环境组合均值 Λij的AMM I组成为:Λij = Λ+ g i + ej + ∑p
n= 1
Κnu inv jn (7)
由于AMM I模型把各种效应看作是固定的, 所以, 与 (4a)式同理, (7) 式中的 Λ、g i 和 ej
分别以 Λδ= Yθ , gδi= (Yθ i- Yθ)和 eδj = (Yθ j - Yθ ) 进行估计; Κn、u in和 v jn则需先求出互作值矩阵 Ηδij =
Yθ ij - Yθ i- Yθ j + Yθ , 再作特征分解求得它们的估值。最后得到 Λij的AMM I估值为:
AMM I(Λij ) = Yθ i + Yθ j - Yθ + ∑p
n= 1
Κδnuδinvδjn (8)
AMM I模型在保留模型 (3) 加性主效部分的同时, 利用 PCA 方法压缩简化了互作的信
息。理论上讲, 这有助于剔除算术平均值中所包含的部分误差, 从而提高 Λij估值的精度。需
要指出的是, 当AMM I模型的p 取最大值N 时 (此时称为AMM I全模型) , 模型中乘式互作项
总和与 (3)式中的 Ηij一致, 所以, 此时AMM I(Λij )与 (5a)式的BLU E (Λij )以及算术平均值相等。
1. 3 各种估值精度的交叉验证
各种估值精度的比较采用交叉验证 (cross validation) 方法[ 2 ]。具体做法是, 对每年的区试
数据 (v 个品种, s 个地点, r 次重复) , 以试点为单位, 把 r 个重复观测值随机分开, 其中 r21
个用于建立模型和估计 Λij (称为建模数据) , 剩余 1 个用于验证 (称为验证数据)。利用建模数
据, 根据 (4) 组式和 (8) 式, 分别求出 Λij的BLU E、BLU Pge、BLU Pg、BLU Pe 和AMM I估值
(算术平均值即BLU E, 故不再单独计算) ; 由于本文使用的是平衡数据, (5)组式中的各种方
差成分直接通过方差分析的方法获得[ 4 ]。对于每种估值, 先根据 (9)式出计算相应的平均预测
差平方和 (m ean square p rediction differences, M SPD ) , 然后根据 (10) 式求出该估值相对于算
术平均值的精度增益倍数 (gain facto r, GF)。
M SPD = ∑
v
i= 1
∑
s
j= 1
(Yδij - Y ′ij ) 2övs (9)
GF = M Se(r - 1) (M SPD - M Se) (10)
公式中 Yδij为品种 i在环境 j 上的估计值; Y ′ij为验证观测值; M Se 为环境内的误差项均方,
由全部观测值的方差分析获得。重复进行 3000 次数据分样和计算, 得到每种估值的平均
1344 期 张群远等: 品种区域试验中算术平均值、BLU P 和AMM I估值的精度比较
M SPD 和 GF。M SPD 反映了估计值和验证观测值之间的接近程度; GF 则意味着某估值的精
度相当于算术平均值精度的倍数。所以, M SPD 越小, GF 越大, 表明估值精度越高。上述过
程中, 采用Q R 算法获得AMM I模型的奇异值和特征向量[ 5 ]。具体计算在微机上利用VB 5. 0
编程实现。
2 结果与分析
针对表 1 中共 60 套一年多点的平衡数据, 按照上述方法对BLU E、BLU Pge、BLU Pg、
BLU Pe 和AMM I估值分别进行 60 轮交叉验证, 并统计各种作物和区试组别的精度增益倍数
(GF) 的均值和变幅, 列于表 2。水稻和玉米由于数据较少, 所以未分组别进行统计。另外,
AMM I模型随 p 取值的不同, 可以得到多种AMM I估值, 表中AMM I是指各轮验证中 GF
最大的一个, 它代表AMM I系列模型在配合数据时所达到的最高精度。
表 2 60 次区试中的 BLUE、BLUP 和AMM I估值的交叉验证结果
Table 2 Cross val idation results of BLUE, BLUP and AMM I in 60 tr ia ls
作物
Crop s
区试组别
T rial group s
五种估值的精度增益倍数的平均值和变幅
M eans and ranges of P recision gain factors(GF) of 5 kinds of estim ators
BLU E BLU Pge BLU Pg BLU Pe AMM I
棉花 长江流域常规棉 Common cotton 1. 001 1. 208 1. 204 1. 207 1. 054
Cotton in Changjiang R iver region 0. 984~ 1. 018 1. 102~ 1. 424 1. 101~ 1. 407 1. 102~ 1. 420 0. 989~ 1. 273
黄河流域春棉 Sp ring cotton 1. 003 1. 221 1. 216 1. 220 1. 025
in Yellow R iver region 0. 972~ 1. 033 1. 024~ 1. 402 1. 022~ 1. 394 1. 024~ 1. 400 0. 972~ 1. 081
黄河流域夏棉 Summ er cotton 1. 002 1. 105 1. 102 1. 105 1. 028
in Yellow R iver region 0. 962~ 1. 031 1. 037~ 1. 166 1. 034~ 1. 164 1. 036~ 1. 166 0. 985~ 1. 098
棉花 (总) 1. 002 1. 188 1. 184 1. 188 1. 034
Cotton ( to tal) 0. 962~ 1. 033 1. 024~ 1. 424 1. 022~ 1. 407 1. 024~ 1. 420 0. 972~ 1. 273
小麦 黄淮春水组 Sp ring2w ater w heat 1. 013 1. 127 1. 123 1. 121 1. 034
W heat in Huanghuai region 0. 997~ 1. 036 1. 068~ 1. 182 1. 066~ 1. 179 1. 065~ 1. 181 0. 963~ 1. 242
黄淮冬水组W inter2w ater w heat 1. 005 1. 133 1. 128 1. 130 1. 061
in Huanghuai region 0. 982~ 1. 041 1. 090~ 1. 226 1. 088~ 1. 213 1. 086~ 1. 221 0. 994~ 1. 207
小麦 (总) 1. 009 1. 130 1. 126 1. 126 1. 047
W heat ( to tal) 0. 982~ 1. 041 1. 068~ 1. 226 1. 066~ 1. 213 1. 065~ 1. 221 0. 963~ 1. 242
水稻 (总) 1. 007 1. 095 1. 096 1. 084 1. 068
R ice ( to tal) 0. 974~ 1. 043 1. 009~ 1. 294 1. 008~ 1. 298 1. 009~ 1. 287 0. 974~ 1. 414
玉米 (总) 1. 003 1. 286 1. 284 1. 285 1. 059
M aize ( to tal) 0. 992~ 1. 024 1. 097~ 1. 619 1. 093~ 1. 619 1. 097~ 1. 618 0. 992~ 1. 298
四种作物 (总) 1. 004 1. 170 1. 167 1. 166 1. 045
Four k inds of crop s( to tal) 0. 962~ 1. 043 1. 009~ 1. 618 1. 008~ 1. 619 1. 009~ 1. 618 0. 963~ 1. 414
从表 2 可以看出, BLU E 估值的 GF 在所有区试中都接近 1, 总平均为 1. 004。这是因为
BLU E 即算术平均值, 二者的精度是等同的。当然, BLU E 的各轮 GF 并不正好等于 1, 而是
在 0. 962~ 1. 043 间波动, 这是由于交叉验证的数据分样只是所有可能分样的一部分, 存在着
一定的随机分样误差。一般来说, 分样次数越大, 误差越小。这里, 分样误差造成的最大波动
只有 (1. 04321) = 4. 3% , 对结果影响不大, 所以本文 3000 次分样是足够的。如果误差过大
(比如大于 10% ) , 则需增加分样次数。
234 作 物 学 报 27 卷
表 2 中 3 种BLU P 估值的 GF 相差不大, 均平均为 1. 170 左右。这说明各种BLU P 的精
度均高于算术平均值 (为算术平均值的 1. 17 倍左右) , 而且不同模型对其精度影响不大。相对
而言, 品种和试点效应都随机的BLU Pge 的精度稍高一点。不过, BLU P 的精度在不同作物
间有一定差别, BLU Pge 的 GF 在棉花、小麦、水稻和玉米区试中的平均分别为 1. 188、
1. 130、1. 095 和 1. 286, 棉花和玉米中较高, 水稻和小麦中稍低。另外, 同一作物的不同区试
组别间也有一定差别, 如黄河春棉和夏棉区试的BLU Pge 的平均 GF 分别为 1. 221 和 1. 105。
但是, 总的来看, 所有区试中各种BLU P 的 GF 都大于 1, 说明比起算术平均值来, BLU P 在
各种区试中均有利于分析精度的提高。
最后, 表 2 中AMM I估值的平均 GF 为 1. 045, 变幅为 0. 963~ 1. 414, 而且各种区试中
都比较一致; 说明虽然AMM I估值存在着比算术平均值精度高的情况, 但普遍来说, 精度提
高不明显。
3 讨论
本文分析表明, BLU P 用于我国区试中品种×环境组合均值的估计, 其精度可普遍提高
到目前算术平均值的 1. 17 倍左右。这意味着, 在同样精度要求下, BLU P 比算术平均值可以
节约 17% 的试验小区重复数。这对我国区试精度和效率的提高来说很有意义。此外, 若结合
混合线性模型求解的一些方法, BLU P 还能很好地解决不平衡数据的问题[ 6, 7 ]。目前, BLU P
的方法在作物遗传育种中正得到越来越多的关注和应用[ 8~ 13 ]。就本文分析结果来看, BLU P
的方法值得在我国区试中加以研究和应用。
另外, 虽然国外多数研究均表明, AMM I 精度高于算术平均值 ( GF 最大的达
4. 30) [ 2, 14~ 18 ] , 但本文AMM I 精度的提高并不明显, 这可能与我国区试数据的自身特点有
关, 譬如试点的范围和数目, 品种的数目与类型, GE 互作的强弱以及误差的大小等。这也说
明, 一种统计模型或方法的精度高低, 与它所面对的数据有关。当然, 本文只是从品种×环
境组合均值估计的角度探讨AMM I在我国区试中的精度特点; 至于AMM I其它方面 (如品种
稳定性分析)在我国区试中的应用效果及精度情况, 尚需进一步研究。
参 考 文 献
1 Peipho H P. TA G , 1994, 89: 647~ 654
2 Gauch H G. S tatistical A naly sis of R eg ional Y ield T rials. E lsevier, N ew York. 1992
3 Henderson C R. B iom etrics, 1975, 31: 423~ 447
4 莫惠栋. 农业试验统计 (第二版). 上海: 上海科学技术出版社, 1992
5 P ressW H , B P F lannery, et al. N um erical R ecipes. Cam bridge U niv P ress, London. 1986
6 王松桂. 线性模型的理论及应用. 合肥: 安徽教育出版社, 1987
7 朱 军. 遗传模型分析方法. 北京: 中国农业出版社, 1997
8 Zhu J , B S W eir. TA G , 1994, 89: 160~ 166
9 Panter D M , F L A llen. C rop S ci, 1995, 35: 397~ 405
10 Bernardo R. C rop S ci, 1996, 36: 872~ 876
11 Bernardo R. TA G , 1997, 95: 655~ 659
12 Bernardo R. TA G , 1998, 97: 473~ 478
13 Bernardo R. C rop S ci, 1999, 39: 1277~ 1282
14 Gauch H G, R W Zobel. TA G , 1988, 76: 1~ 10
15 Gauch H G. B iom etrics, 1988, 44: 701~ 705
16 Crossa J , H G Gauch, R W Zobel. C rop S ci. , 1990, 30: 493~ 500
17 N achit MM , G N achit, H Ketata, et al. TA G , 1992, 83: 597~ 601
18 M oreno2Gonzalez J , J Crossa. TA G , 1998, 96: 803~ 811
3344 期 张群远等: 品种区域试验中算术平均值、BLU P 和AMM I估值的精度比较