为了研究空间统计分析法在作物育种田间试验品系选择中的效果,采用剩余误差空间相关线性混合模型对一个具有56个品系的小麦育种随机区组设计田间试验产量资料进行了空间统计分析。运用地理统计学中的半变异函数法确定剩余误差空间协方差的函数。结果表明,试验的剩余误差存在着典型的空间相关性,利用剩余误差空间协方差结构的信息可降低品系效应估计的误差和提高品系效应差异F检验与t检验的效率。此外,空间分析法对品系效应估计受试验条件不均匀的影响小,可导致较经典方差分析法不同的品系排序和优系选择结果。
The objective of this study was to evaluate the efficiency of spatial statistical analysis in the superior genotype selection of plant breeding using the data from a yield trial of wheat with 56 test lines in a block design. The spatial analysis used linear mixed model with spatial covariance for residuals which was estimated using semivariogram defined in geostatistics. Results showed a typical spatial correlation of residuals, which allowed a reduction in standard errors of line effect estimate and a greater efficiency of F- and t-test in discrimination of lines when spatial analysis was applied. Furthermore, in estimation of line effect the spatial analysis was less influenced by assay condition variation, and led to a different ranking and selection of genetic materials, in comparison with traditional analysis of variance.
全 文 :作物学报 ACTA AGRONOMICA SINICA 2008, 34(3): 412−417 http://www.chinacrops.org/zwxb/
ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@chinajournal.net.cn
基金项目: 国家自然科学基金项目(30571072);教育部留学回归人员基金项目(2005-2007)
作者简介: 胡希远(1963–), 男, 副教授, 博士, 主要从事生物统计应用研究。Tel: 029-87081390; E-mail: xiyuanhu@yahoo.com.cn
Received(收稿日期): 2007-07-25; Accepted(接受日期): 2007-09-27.
DOI: 10.3724/SP.J.1006.2008.00412
空间统计分析在作物育种品系选择中的效果
胡希远 李建平 宋喜芳
(西北农林科技大学农学院, 陕西杨凌 712100)
摘 要: 为了研究空间统计分析法在作物育种田间试验品系选择中的效果, 采用剩余误差空间相关线性混合模型,
对一个具有 56个品系的小麦育种随机区组设计田间试验产量资料进行了空间统计分析。运用地理统计学中的半变异
函数法确定剩余误差空间协方差的函数。结果表明, 试验的剩余误差存在着典型的空间相关性, 利用剩余误差空间协
方差结构的信息可降低品系效应估计的误差和提高品系效应差异 F 检验与 t 检验的效率。此外, 空间分析法对品系
效应估计受试验条件不均匀的影响小, 可导致较经典方差分析法不同的品系排序和优系选择结果。
关键词: 空间统计; 植物育种; 品系选择
Efficiency of Spatial Statistical Analysis in Superior Genotype Selection
of Plant Breeding
HU Xi-Yuan, LI Jian-Ping, and SONG Xi-Fang
(Agriculture Collage, Northwest A & F University, Yangling 712100, Shaanxi, China)
Abstract: The objective of this study was to evaluate the efficiency of spatial statistical analysis in the superior genotype selec-
tion of plant breeding using the data from a yield trial of wheat with 56 test lines in a block design. The spatial analysis used linear
mixed model with spatial covariance for residuals, which was estimated using semivariogram defined in geostatistics. Results
showed a typical spatial correlation of residuals, which allowed a reduction in standard errors of line effect estimate and a greater
efficiency of F- and t-test in discrimination of lines when spatial analysis was applied. Furthermore, in estimation of line effect the
spatial analysis was less influenced by assay condition variation, and led to a different ranking and selection of genetic materials,
in comparison with traditional analysis of variance.
Keywords: Spatial statistics; Plant breeding; Superior genotype selection
作物育种过程中的重要工作之一就是对基因型
材料或杂交后代通过田间试验进行性状表现鉴定和
优系选择。由于田间试验普遍存在着试验条件的空
间变异, 即相距较近的小区间比相距较远的小区间
有更大的相关性, 影响试验材料鉴定与评价的准确
性[1]。因此, 控制和处理试验条件空间变异成为试验
材料评价与选择过程中必须考虑的因素[2-3]。传统上,
解决这一问题的重要技术为试验对象的随机化和区
组化处理。随机化处理是为了获得无偏的效应估计,
区组化是使区组间可能的不均匀性误差能从随机误
差中分离出来, 以提高试验的精确性。然而区组控
制误差的实际效果与对试验条件特征把握的准确性
及区组设置状况有关, 且不能解决区组内可能存在
的不均匀性问题。相应于区组化设计的方差分析模
型, 假设试验单元在区组间不相关、在区组内协方
差相同[4]。这一假设只符合试验条件在区组内均匀
一致、在区组间不连续变化的一种理想情况, 而实
际上试验单元(数据)在区组内和区组间都可能存在
连续性的空间变异[5-6]。特别是作物育种初期和中期
的田间试验, 由于需要试验鉴定的基因型材料或杂
交后代很多, 往往区组较大而小区面积较小, 会使
小区间的空间变异进一步加大[7]。因此, Stroup等[8]
认为, 基于区组化和随机化的经典方差分析法难以
有效处理作物育种田间试验的空间变异并对基因型
效应做出准确的评价。
空间统计分析的发展为处理试验数据空间变异
第 3期 胡希远等: 空间统计分析在作物育种品系选择中的效果 413
提供了一种新途径, 其中最受关注的是Zimmerman
等 [1]基于地理统计学提出的称之为空间随机场
(spatial random field)的空间统计分析方法。该方法
利用试验剩余误差的空间协方差矩阵反映试验数据
的空间变异, 并将其空间协方差矩阵引入线性混合
模型来调正空间变异对试验分析的影响。近年来 ,
关于用随机场理论和方法处理田间试验空间变异及
其对试验分析结果影响的研究成为生物统计与田间
试验领域研究热点之一 [9-13], 然而大部分研究仅局
限于空间统计分析对降低试验处理效应估计误差的
作用。本文拟研究空间统计分析在作物育种品系评
价与选择中的应用效果, 为提高作物育种田间试验
品系选择效果提供依据。
1 材料与方法
1.1 试验数据
2003—2004年在西北农林科技大学试验农场进
行小麦育种中期品系田间鉴定试验, 共有 56个材料
或品系(本文均称为品系), 小区面积 5.01 m2, 采用
随机完全区组设计, 4次重复。每小区种 5行, 行距
24 cm。本文仅分析小区产量数据。为进行空间统计
分析, 需要计算各小区间的距离, 因此数据中还包
含有小区中心点在试验田位置坐标的信息。本文用X
和Y轴分别代表试验田东西和南北方向。
1.2 分析模型
试验数据采用两种统计模型分别进行分析。一
种为经典方差分析模型:
ij i j ijy g b eμ= + + + (1)
式中, 为第i品系在第j区组的观测值, ijy μ为总体平均
值, 为第i品系的效应值, 为第j区组的效应值,
为第i品系在第j区组的剩余误差。剩余误差假定为相互
独立且均数为零、方差为 的正态分布 , 即e
ig jb ije
2
eσ ij ~
N , 该模型的特征是剩余误差间的协方差为零;
另一种为剩余误差空间相关的空间统计分析模型:
2(0, )eσ
ij i ijy g eμ= + + (2)
该模型中各部分的意义与模型(1)相同, 但剩余误差
的分布为 , C(h)代表距离为h的两小区
剩余误差的方差-协方差。若以 和 分别表示
某小区和与该小区距离为h的小区的剩余误差 , 依
据空间随机场理论
)](,0[~ hCNeij
)(se )( hse +
[4,14], C(h)被定义为:
s ( )
2 2
0
2
,
, 0
( )
[ ( )], 0
s he e
h
C h
f h h
σ σ
σ σ+
⎧⎪ + =⎪⎪=⎨⎪ = >⎪⎪⎩
当
当
其中 , 和 分别表示随机性和结构性误差方差
组分 , 两者之和构成剩余误差的方差;
2
0σ 2σ
2[ ( )]f hσ 是
剩余误差间的协方差, 表明两个剩余误差的协方差
是其所在小区间距离的函数。由于区组设置本身就
是对空间变异的一种特定形式的处理, 模型(2)通过
剩余误差间的协方差考虑了空间变异的因素, 所以
该模型中不再单独出现区组效应组分。
为了实现上述不同剩余误差假设条件下两模型
中有关效应的统计计算和统计检验, 两种模型可用
下面混合模型的一般矩阵形式予以概括[15]:
y X Zuβ= + +ε (3)
式中, y为试验观测值向量, β为固定效应向量, u为随
机效应向量, ε 为剩余效应向量, X为固定效应试验
设计矩阵 , Z为随机效应试验设计矩阵 , 且假设
~N(0, G), ε ~N(0, R), E(y)=Xβ, Var(y)=ZGZ+R′=V。
依据线性混合模型原理
u
[16-17]:
βˆ = 1 1( ) X V X X V y− − −
1 ˆˆ (u GZ V y Xβ−= − )
ˆˆ ˆy X Zβ= + u
;
对模型(1), G = I 和 R = I (I为单位矩阵,
为区组效应方差)。对模型(2)则G = 0和 R = Σ, 即
R 是元素为 C(h) 的矩阵(主对角线元素为 + ,
非主对角线元素为 )。这样, 无论经典的方
差分析还是空间统计分析, 都可通过线性混合模型
予以实现。
2
bσ 2eσ
2
bσ
2
0σ 2σ
)]([2 hfσ
1.3 空间协方差函数的确定
依据模型(2)进行空间统计分析的关键是确定剩
余误差的协方差矩阵, 即函数 C(h)的模型。本文采
用半变异函数法。在假设剩余误差不相关条件下 ,
依据混合模型原理利用限制性极大似然法(REML)
估计出 , 进而求出剩余误差 =2eσ εˆ ˆy y− 及其半变异
函数, 然后利用半变异函数模型与空间协方差模型
的关系间接确定 C(h)。
半变异函数的计算和拟合是地理统计学中研究
在空间分布上既有随机性变异又有结构性变异自然
现象的标准统计方法。该方法及其理论依据在许多
文献中都有较为详尽的阐述[18-19]。半变异函数被定
义为给定间距h的样点观测值之差平方的数学期望,
对应于本研究中的品系试验, 剩余误差的半变异函
数可表示为:
2
( ) ( )
1( ) [ ]
2 s h s
h E e eγ += −
414 作 物 学 报 第 34卷
实际操作中, 半变异函数的估计采用称为经验(或样
本)半变异函数的公式:
2
( ) ( )
( )
1 ˆ ˆˆ( ) [ ]
2 ( ) s h sN h
h e
N h
γ += −∑ e
式中, N(h)是间距为h的所有小区的成对数。半变异
函数 是h的函数, 以 对h作图得到半变异函
数散点图。典型空间变异的半变异函数图特征是 ,
随着h的增大而增加, 当h增大到超过某一距离
a时 的值稳定在一个最大值水平。 的这个最
大值被称为基台值 (sill), 相当于剩余误差方差
+ 的估计值 , 的截距相当于剩余误差方
差随机组分 的估计值; 达到基台值时样点间的距
离a称为变程(range), 表示距离等于或大于该距离的
样点间空间协方差为零。一般而论, 空间协方差函
数模型与半变异函数模型的对应关系为
ˆ( )hγ ˆ( )hγ
ˆ( )hγ
ˆ( )hγ ˆ( )hγ
2
0σ 2σ ˆ( )hγ
2
0σ
[14,20]:
2 2
0( ) ( )C h hσ σ γ= + − (4)
因此, 只要利用剩余误差的经验半变异函数图拟合
一个半变异函数模型便可得到剩余误差相应的空间
协方差模型。最常用的半变异函数理论模型有球型、
指数型、高斯型和线型模型[9,19]。
本文采用 SAS软件中 PROC MIXED和 PROC
VARIGRAM程序分别进行混合线性模型分析和半
变异函数的计算及其模型拟合。由于半变异函数一
般只有在试验观测区域最大间距的 1/2 内才有意
义[14], 所以只采用间距小于或等于试验区最大距离
一半的小区参与半变异函数的计算。
2 结果与分析
2.1 试验数据空间变异
假设剩余误差独立时估计和分离品系效应后 ,
得到的剩余误差曲面如图 1 所示。可以看出, 剩余
误差并不是如同假设的情况随机分布, 而是具有明
显的大小区域性变化。一方面, 剩余误差沿 X 轴坐
标增大的方向有增大的趋势; 另一方面, 剩余误差
在X轴坐标较小的区域沿Y轴也有一定的趋势变化,
即中部大两边小。从这一结果不难想象, 区组设置
对该试验很难达到理想的空间变异控制效果。所以
有必要利用该信息探讨空间统计分析的效果。
计算的距离小于 30 m 小区间剩余误差经验半
变异函数(点)和对其拟合得到的半变异函数模型(曲
线)如图 2所示。该半变异函数图显示了一个典型的
空间相关过程, 即随着小区间距离的增大, 半变异
函数值增加, 距离在约大于 22 m以后半变异函数达
到一个稳定的基台值。对该经验半变异函数的拟合
表明 , 球状半变异函数模型拟合效果最佳。
3
2 2
0 3
3( )
2 2
h hh
a a
γ σ σ
⎛ ⎞⎟⎜ ⎟⎜= + − ⎟⎜ ⎟⎟⎜⎝ ⎠
, 式中 , =0.02, =0.50,
a=24.5。由此拟合结果知 , 剩余误差的方差为
+ =0.52, 依据式(4)得到剩余误差的空间协方
差 结 构 模 型 为
2
0σ 2σ
2
0σ 2σ
3
( ) 0.50 1
16.3 14706.1
h hC h
⎛ ⎞⎟⎜ ⎟⎜= × − + ⎟⎜ ⎟⎟⎜⎝ ⎠
( 当
h>0)。利用该模型即可定义模型(2)中剩余误差的协
方差矩阵 R=Σ, 即主对角线元素均为 0.52, 而非主
对角线元素为
3
0.50 1
16.3 14706.1
h h⎛ ⎞⎟⎜ ⎟⎜× − + ⎟⎜ ⎟⎟⎜⎝ ⎠
, 两小区间的
距离 h可通过各小区所在行列的坐标计算。这样, 试
验数据的空间协方差得到确定。下面将展现此空间
变异信息对品系统计分析结果的影响。
图 1 小麦品系选择试验在误差独立假设条件下分离出的剩余
误差区域性变化
Fig. 1 Local variation of residual in wheat line selection
experiment under postulation of independent error
X轴和 Y轴分别为小区东西和南北方向的位置坐标。
X and Y are east-west and south-north coordinates of plot station,
respectively.
图 2 小麦品系选择试验剩余误差的经验半变异函数(散点)及
拟合的半变异函数模型(曲线)
Fig. 2 Sample variogram (dots) and fitted model (continuous
line) of residuals in wheat line selection experiment
2.2 空间统计分析与方差分析的比较
试验数据拟合效果是评价一种模型或分析方法
第 3期 胡希远等: 空间统计分析在作物育种品系选择中的效果 415
优劣的重要指标[14]。一般情况下, 具有较多参数的
模型比具有较少参数的模型拟合效果好。因此, 在
比较模型拟合效果时应考虑参数个数对数据拟合的
影响。满足此要求的常用模型拟合指标有AIC
(Akaike’s Information Criterion) 和 BIC(Schwarz’s
Bayesian Criterion)指标。它们都以数据拟合极大似
然负对数值的 2 倍(-2lnL)减去参数个数的特定函
数来计算其指标值[13]。所以, AIC和BIC值越小, 相应
的模型对数据拟合效果越好。空间分析法R=Σ和方
差分析法R=I 拟合小麦品系选择试验数据的 3 个
指标(表 1)均显示, 空间分析法比方差分析法对试验
数据拟合效果更好。
2
eσ
所有品系效应估计的误差, 在方差分析中均为
0.386, 而在空间分析中变化在 0.301~0.305 范围内,
平均为 0.303。说明后者较前者分析效率有所提高,
以平均值看 , 后者分析效率是前者的 1.27(0.386/
0.303)倍。两种方法分析效率的差异必然在它们对品
系效应差异的 F 检验和 t 检验中显现出来(表 2)。F
检验结果在方差分析法中未达显著水平 (P>0.05),
但在空间分析法中达极显著水平(P<0.01)。在进一步
对 7对品系产量效应比较的 t检验中, 没有一对品系
的差异在方差分析法中达显著水平, 而空间分析法
中则有一对品系效应的差异(1 vs 3)达显著水平, 一
对品系效应的差异(3 vs 4)达极显著水平。
表 1 方差分析与空间分析对小麦品系选择试验产量数据拟合
效果的 3个指标值
Table 1 Value of 3 fitting criteria of different analysis methods
for yield data from wheat line selection experiment
指标
Criterion
方差分析
ANOVA
空间分析
Spatial analysis
-2lnL 444.0 381.0
AIC 448.0 387.0
BIC 446.8 397.2
−2lnL为极大似然值自然对数的负 2倍; AIC为 Akaike信息
指标; BIC为 Schwarz信息指标。
−2lnL: −2 × maximum log-likelihood; AIC: Akaike’s infor-
mation criterion; BIC: Schwarz’s Bayesian criterion.
表 2 方差分析和空间分析对小麦品系产量效应 F检验和部分 t检验的结果
Table 2 F- and t-test of some wheat line effects based on ANOVA and spatial analysis
方差分析 ANOVA
空间分析 Spatial analysis
品系对比
Contrast
第一自由度
NDR 第二自由度
DDF
F P>F 第二自由度
DDF
F P>F
所有品系 All lines 55 165 0.88 0.7119 92.3 5.46 <0.0001
t P>t t P>|t|
1 vs 2 1 165 0.50 0.6180 79.4 −1.01 0.3146
1 vs 3 1 165 −0.39 0.6977 63.3 −2.13 0.0367
1 vs 11 1 165 0.31 0.7541 114.0 −0.86 0.3943
2 vs 11 1 165 −0.19 0.8528 86.3 0.16 0.8762
2 vs 8 1 165 0.68 0.4972 168.0 0.49 0.6231
3 vs 4 1 165 1.87 0.0639 85.6 3.44 0.0009
8 vs 9 1 165 0.21 0.8352 95.0 −0.59 0.5599
第一列中的数字为小麦品系的代号。
The numbers in the first column are codes of wheat line.
若按产量高低对所试验的品系以 25%的选择率
进行选择, 则需从 56 个品系中选择 14 个。方差分
析法所选 14 高产品系及其在空间分析中的位次如
表 3所示。方差分析选择的品系中只有 6个(25、55、
3、12、5 和 53)在空间分析中居 14 位前, 即两方法
对品系选择仅有 42.9%的一致性。方差分析所选产
量排序第一位的品系 25 在空间分析中却排到了第
11位。此外, 方差分析所选品系中有 4个品系(28、
1、24 和 29)在空间分析中排在了很差的位置(25 位
以后)。另一方面, 空间分析法所选择 14个高产品系
中有 8个被方差分析法排除在外。这些差异说明, 不
同的分析方法对品系选择具有较大影响, 采用适宜
的方法分析作物育种田间试验是提高品系选择准确
性不容忽视的重要问题。
从方差分析法和空间分析法所选 14 个高产品
系在试验田中的位置分布(图 3), 就不难理解两种品
系选择结果的差异与可靠性。从图 3-A可以看出, 采
用方差分析法所选择的 14 个高产品系主要集中在
试验田远离X轴原点的区域。这种品系集中在一局部
区域表现高产的现象很可能是该区域肥力较高或其
他生态条件优越所致, 这可以从图 1 中剩余误差的
趋势变化得到验证。而采用空间分析法时, 较好地
考虑了田间空间变异对品系产量估计的影响, 优良
品系选择受空间变异影响小, 所选 14个高产品系的
位置较均匀地分布在试验田的整个区域(图 3-B)。通
常情况下, 类似图 3-B的选择结果显然要比图 3-A的
选择效果可靠。这一结果验证了笔者早先[13]及莫惠
栋和思扬 [21 ]的结论 , 即区组设置虽可在一定程度
416 作 物 学 报 第 34卷
表 3 方差分析和空间分析对 14个品系产量效应的估计值、标准误与排序
Table 3 Yield estimate, standard error (SE) and rank of 14 wheat lines based on ANOVA and spatial analysis
方差分析 ANOVA
空间分析 Spatial analysis
品系代号
Code of wheat line 产量估计值
Yield estimate
标准误
SE
位次
Rank
产量估计值
Yield estimate
标准误
SE
位次
Rank
25 3.26 0.386 1 2.76 0.303 11
55 3.13 0.386 2 2.90 0.303 3
24 3.09 0.386 3 2.53 0.303 26
3 3.05 0.386 4 2.85 0.301 5
17 3.03 0.386 5 2.67 0.304 18
12 3.01 0.386 6 2.89 0.303 4
37 3.01 0.386 7 2.62 0.303 22
33 2.98 0.386 8 2.72 0.304 15
5 2.94 0.386 9 2.74 0.302 12
53 2.94 0.386 10 2.77 0.303 9
34 2.93 0.386 11 2.72 0.304 16
1 2.86 0.386 12 2.45 0.303 34
28 2.84 0.386 13 2.35 0.302 39
29 2.81 0.386 14 2.58 0.302 25
图 3 方差分析法(A)和空间分析法(B)所选 14个高产品系在试验田中的位置
Fig. 3 Location of plots of 14 high-yielding lines based on ANOVA (A) and spatial analysis (B)
X轴和 Y轴分别为小区东西和南北方向的位置坐标; 图中数字为小麦品系的代号; 每一品系重复 4个小区, 所以图中共有
14 × 4 = 56个点。
X and Y are east-west and south-north coordinates of plot station, respectively. The numbers are codes of wheat line. In each figure, 56 points
came from 14 wheat lines with 4 replicates in 4 plots.
上控制空间变异, 然而其控制空间变异的效果与区
组的大小和设置的要求(区组设置的方向与空间变
异最大方向垂直, 区组内条件均匀一致, 而实际上
很难做到)有关, 空间统计分析控制空间变异比区组
控制更有效。同时也表明, 常规的试验设计和方差
分析, 很难获得处理效应的无偏估计, 从而降低品
系试验选择的可靠性。
3 讨论
在作物育种工作中, 作物的产量性状需要通过
田间试验来鉴定。田间试验条件异质性是影响作物品
系间产量性状差异鉴定准确性及优系选择可靠性的
重要因素。通常采用区组设计来控制田间变异的影响,
但作物育种通常需要从大量的品系材料中进行选择,
试验小区面积小、数目多, 使区组设置在作物育种品
系选择试验中对选择准确性的改进难以发挥理想的
作用。所以为了提高作物品系试验选择的可靠性, 除
了改善试验条件外, 还应从统计学上寻求更加有效
的分析方法。许多研究表明[10-13], 剩余误差空间相关
的空间统计分析能够降低田间试验处理效应估计的
误差。本研究进一步表明, 该空间统计分析不仅能降
低作物育种试验品系效应估计的误差, 而且能导致
不同于经典方差分析的品系排序和优系选择, 类似
的结果Kemptom[2]和Duarte等[7]也曾报道过。因此, 空
间统计分析对植物育种品系选择具有重要意义。
本试验中每个品系有 4 个重复, 通常在作物育
种早代选择试验中每品系可能只有 2 个甚至 1 个重
复数(如增广设计), 对这样的试验空间统计分析是
否也有效?Brownie等[12]对一个具有 72 个品系、2
次重复的田间试验进行了模拟研究, 表明空间统计
第 3期 胡希远等: 空间统计分析在作物育种品系选择中的效果 417
分析比方差分析具有较高的分析效率; Duarte等[7]对
110 个待测品系和 5 个对照品系的增广设计进行了
研究, Sebolai等[22]对多个形式的顺序排列品系比较
试验进行了模拟研究, 其结果均显示空间统计分析
对品系效应排序更可靠。
由空间统计分析的过程可知, 试验数据的空间
协方差直接关系到品系效应估计误差、品系排序与
差异性检验、以及最终的优系选择结果。所以空间
统计分析的关键是准确地确定试验数据空间协方差
的结构模型及其参数。确定试验数据空间协方差模
型的一种较简单的方法是根据线性混合模型原理利
用SAS中PROC MIXED程序直接拟合试验数据。该
方法在许多文献中都有介绍和应用 [13,23], 但因其计
算方法的复杂性和数据空间信息利用的不完善性 ,
经常会出现迭代过程不收敛或参数估计极端异常的
现象, 导致空间统计分析无结果或参数估计结果无
实际意义, 例如本文中的试验数据恰巧用该方法就
不能获得协方差参数估计。此外, 该方法对参数的
估计结果还受设置的参数起始值影响, 参数估计结
果不一定最优 , 从而影响空间统计分析的应用效
果。这些不足之处在应用时应予以考虑。本文采用
了地理统计学中的半变异函数法确定试验数据的空
间协方差模型, 基本可克服前述方法的缺点。关于
SAS中PROC MIXED程序直接拟合试验数据的方法
和半变异函数法 2 种方法的应用及其优缺点的详细
论述可参阅文献[14]。
还需指出的是, 增加对照也是作物育种控制田
间变异常用的一种简便方法, 这样不同品系的选择
可相对于最近的对照来进行。但是, 随着试验品系
数目的增加和田间变异的加剧, 为达到较好田间变
异控制效果所需对照的数目势必增加很多。由此导
致试验用地和费用的增加将使该方法的实用性受到
限制。此外, 这种方法还存在相距较远的待测品系
间无可比性的缺点。
4 结论
在小区面积小、测试品系较多的育种田间试验
条件下 , 空间分析法能够获得无偏的品系效应估
计、较小的估计误差以及较高的统计测验效率, 因
而能更好地区分试验品系之间的差异。
与经典的方差分析法相比, 空间分析法可得到
关于品系效应的不同排序和由此导致优良品系的不
同选择结果。空间分析法对品系效应的评价受田间
变异影响小, 因而依据其对优良品系的选择会更可
靠。这对改善作物育种成效具有重要意义。
References
[1] Zimmerman D L, Harville D A. A random field approach to the
analysis of field-plot experiments and other spatial experiments.
Biometrics, 1991, 47: 223−39
[2] Kempton R A, Seraphin J C, Sword A M. Statistical analysis of
two-dimensional in variety yield trials. J Agric Sci, 1994, 122:
335−342
[3] Wu T-X (吴天侠), Gai J-Y (盖钧镒), Ma Y-H (马育华). An in-
quiring into the nearest neighboring analysis for trait with large
number of lines in plant breeding. Acta Agron Sin (作物学报),
1995, 21(1): 9−16 (in Chinese with English abstract)
[4] Schabenberger O, Pierce F J. Contemporary Statistical Models
for the Plant and Soil Sciences. Boca Raton, FL: CRC Press,
2002. pp 599−648
[5] Kempthorne O. The Design and Analysis of Experiments. New
York: John Wiley & Sons, 1952. pp 86−156
[6] Stroup W W. Power analysis based on spatial effects mixed mod-
els: a tool for comparing design and analysis strategies in the
presence of spatial variability. J Agric Biol Environ Stat, 2002, 7:
491−511
[7] Duarte J B, Vencovsky R. Spatial statistical analysis and selection
of genenotypes in plant breeding. Pesquisa Agropecuária Bra-
sileira, 2005, 40: 107−114
[8] Stroup W W, Baenziger P S, Mulitze D K. Removing spatial
variation from wheat yield trials: a comparison of models. Crop
Sci, 1994, 86: 62−66
[9] Fagroud M, Meirvenne M V. Accounting for spatial auto-correla-
tion in the design of experimental trials. Soil Sci Soc Am J, 2002,
66: 1134−1142
[10] Grondona M O, Cressie N. Using spatial considerations in the
analysis of experiments. Technometrics, 1991, 33: 381−392
[11] Brownie C, Bowman D T, Burton J W. Estimating spatial varia-
tion in analysis of data from yield trials: a comparison of models.
Agron J, 1993, 85: 1244−1253
[12] Brownie C, Gumpertz M L. Validity of spatial analysis for large
field trials. J Agric Biol Environ Stat, 1997, 2: 1−23
[13] Hu X-Y (胡希远), Spilke J. Spatial variability and its statistical
control in field experiment Acta Agron Sin (作物学报), 2007,
33(4): 620−624 (in Chinese with English abstract)
[14] Little R C, Milliken G A, Stroup W W, Wolfinger R D. SAS Sys-
tem for Mixed Models. Cary, NC: SAS Institute, 1996. pp
303−326
[15] Hu X, Spilke J, Richter C. The influence of spatial covariance on
the type error and the power for different evaluation models. Ⅰ
Biometrical Lett, 2006, 43: 19−37
[16] Henderson C R. Applications of Linear Models in Animal Breed-
ing. Guelph: University of Guelph, 1984. p 462
[17] Verbeke G, Molenberghs G. Linear Mixed Models in Practice.
New York: Springer-Verlag, 1997. pp 185−210
[18] Zhang R-D (张仁铎). Theory and Application of Spatial Variation
(空间变异理论及应用). Beijing: Science Press, 2005. pp 13−22
(in Chinese)
[19] Schabenberger O, Gotway C A. Statistical Methods for Spatial
Data Analysis. Boca Raton, FL: CRC Press, 2005. pp 133−211
[20] Es H M, Es C L. Spatial nature of randomization and its effect on
the outcome of field experiments. Agron J, 1993, 85: 420−428
[21] Mo H-D(莫惠栋), Si Y(思扬). Trend variation and its control in
field experiment. Acta Agron Sin (作物学报 ), 1986, 12(4):
233−240 (in Chinese with English abstract)
[22] Sebolai B, Pederson J F, Marx D B, Boykin D L. Effect of control
plot density, control plot arrangement, and assumption of random
or fixed effects on nonreplicated experiments for germplasm
screening using spatial methods. Crop Sci, 2005, 45: 1978−1984
[23] Kravchenko A N, Robertson G P, Snap S S, Smucker A J M. Us-
ing information about spatial variability to improve estimates of
total soil carbon. Agron J, 2006, 98: 823−829