全 文 :植物生理学通讯 第 46 卷 第 2 期,2010 年 2 月 161
配对实验设计在植物生理学实验中的应用
王兴安 1, 杨洪兵 2, 邱念伟 1,*
1 曲阜师范大学生命科学学院, 山东曲阜 273165; 2 青岛农业大学生命科学学院, 山东青岛 266109
Application of Paired-Sample Design in Plant Physiology Experiment
WANG Xing-An1, YANG Hong-Bing2, QIU Nian-Wei1,*
1College of Life Sciences, Qufu Normal University, Qufu, Shandong 273165, China; 2College of Life Sciences, Qingdao Agricultural
University, Qingdao, Shandong 266109, China
收稿 2009-10-26 修定 2009-12-02
资助 山东省高等学校科技计划(J09LC16)和曲阜师范大学科
研基金(XJ2 00 82 0)。
* 通讯作者(E-mail: nianweiqiu@163.com; Tel: 0537-4458471)。
在植物生理学实验中经常用到 2 组数据平均
数的比较, 如某个实验指标用 2种测定方法测定结
果的比较、实验的对照组与处理组各种生理生化
指标的比较、转基因植株与野生型植株各种生理
生化指标的比较、同种作物 2 个品种生理特性的
比较等等。两组数据平均值的比较常用的实验设
计方法有成组实验设计、配对实验设计和非参数
检验设计等, 其中成组实验设计最为常用。成组数
据的统计分析方法是Gosset 1908年以笔名 “Student”
提出的, 所以称为 “ 学生氏 t检验(Student’s t-test)”。
这种实验设计和统计分析方法为科研工作者所熟
悉, 在科研工作中被广泛使用。它可以比较 2个平
均数的差异显著性, 也可以用于检验各处理组平均
数与对照组平均数之间的差异。很多科研工作者
还将它用于多处理实验中, 各处理平均数固定地两
两相比, 每个平均数仅参与一次比较的实验设计(李
春喜等 2005; 陆建身和赖霖 2003)。
双样本实验设计中, 虽然成组实验设计及其数
据分析十分简单, 使用非常广泛, 但它也有很多缺
陷, 并不能随意使用。由于忽视了成组实验设计及
其平均数 t 检验的使用条件, 导致这种统计分析方
法在很多科技研究中滥用, 产生很多错误的实验结
论。配对实验设计就是根据成组实验设计的缺陷
提出来的另一种 2 组数据的实验设计。与成组实
验设计相比, 配对实验设计具有多方面的优点, 数
据分析方法也更为简便。可是, 这种方法却一直被
植物生理学界的同行忽视而很少被采用。为了减
少成组实验设计的误用, 并使植物生理学界的同行
对配对实验设计有更为清晰的认识, 本文以玉米耐
盐性实验为例介绍配对实验设计的使用方法, 并将
这一实验设计方法与成组实验设计进行比较。
1 成组实验设计与配对实验设计
1.1 成组设计及其平均数的检验 成组设计是指当
只进行2个处理(对照也是一种处理方法)的实验时,
将实验对象完全随机地分成 2 个组, 然后对 2组实
验对象各随机施加一个处理。在这种设计中所得
的 2个样本(处理)相互独立, 样本含量(指每个处理
实验对象的个数, 也称为 “ 重复数 ”)不一定相等。
成组实验设计的平均数差异显著性检验用成组数据
t 检验, 它有以下应用条件和缺点, 不能滥用。
(1)成组数据t检验要求2组数据的方差必须具
有齐性(具齐性指 2 组实验数据的变异性不能相差
太大, 即方差不能差异太大), 因此 t 检验之前应先
进行方差齐性检验(F检验)。如果 2组数据的方差
不具齐性, 只能用Aspin-Welch-t检验或其他试验设
计(杜荣骞 2005)。
(2)成组数据 t 检验要求 2 组数据的变异系数
(标准差与平均值之比)不超过 12%。否则系统误
差可能会掩盖处理效果而得出错误结论。因此, 数
据变异性比较大的实验指标不能用成组实验设计。
大多数生物统计学教材都忽视了这一点(曲均革等
2006)。
(3)成组数据 t 检验主要用于 2 个平均数的比
较, 有时也用于多个处理的平均数仅与对照组平均
数的比较, 或者多个平均数固定地两两相比且仅参
与一次比较的实验设计。科技论文中, 其他多个平
均数比较的试验设计常用方差分析和多重比较, 否
则实验结论的可靠性大大降低。
技术与方法 Techniques and Methods
植物生理学通讯 第 46 卷 第 2 期,2010 年 2 月162
(4)成组实验设计与配对实验设计相比, 所得数
据的系统误差一般比较大, 显著性检验的准确性和
精确性低(杜荣骞 2005), 常常观察不出 2 组数据平
均数的本质差异。
(5)成组实验设计各处理的重复数一般要求不
得小于 5, 最好大于等于 10。每一个具体实验所要
求的最少重复数不同, 最少重复数在统计学上称为
“ 必要的抽样数目 ”, 可以用 “ 参数估计 ”的方法求
出。只有所测定的实验指标具有很高的一致性时,
才可用最少重复数 3。但在很多科技论文中每个
处理仅有 3个重复, 达不到统计分析的要求。重复
数太少会使实验统计结论的可靠性降低, 统计学上
可用 “ 效能检验 ” 对实验结论的可靠性进行分析。
未进行效能检验也是很多科技文献中存在的最常见
的问题之一(童新元 2006)。
1.2 配对设计 成组实验设计要求实验对象各方面
的性质都尽可能一致, 如果实验对象变异较大, 采
用成组设计就会使处理效应受到系统误差的影响而
降低实验的准确性与精确性。为了缩小实验对象
不一致对实验结果的影响, 正确地估计处理效应, 减
少系统误差, 降低实验误差, 提高实验的准确性与
精确性, 可以采用配对实验设计。
配对实验设计的方法是先根据配对的要求将
实验对象两两配对多个对子, 然后将配成对子的 2
个实验对象随机地分配到2个处理组中, 一个作为
对照, 另一个作为处理。配对时要求配成对子的 2
个实验对象的初始状况尽量一致, 不同对子间实验
对象的初始状况允许有差异, 每一个对子就是实验
处理的一个重复(吴占福 2005)。
2 两种实验设计举例
2.1 成组设计及其实验结果的统计分析 植物生理
学实验的一个基本要求是实验处理前要有生长比较
一致的植物材料, 但在实际工作中培育出生长一致
的植物幼苗是非常困难的。如研究玉米的抗盐性
时, 为使玉米幼苗生长一致, 首先选择籽粒饱满一
致的种子, 把它们放在适宜的条件下萌发; 然后从
中选择萌发一致的幼苗。但是在相同培养条件下
培养一段时间后会发现, 尽管选择了籽粒饱满一致
且萌发一致的玉米幼苗, 玉米个体之间仍呈现出很
大差异。表 1 中的数据是我们按照上述方法培养
得到的 16 株玉米的株高(每个培养盆中种植 1 株),
用来研究玉米的耐盐性。按照成组实验设计, 实验
处理前应将 16 株玉米随机分成 2组。对照组浇灌
Hoagland完全营养液, 处理组浇灌用Hoagland完全
营养液配制的100 mmol·L-1 NaCl, 其他培养条件完
全相同。
玉米经盐处理 7 d后, 玉米株高变化的实验结
果列于表 2。两组玉米平均株高的差异显著性检
验应用成组数据 t 检验。统计分析方法如下。
解: 已知 X-1=76.0 cm, s1=18.4; X-2=63.0 cm,
s2=14.2; n1=n2=8
①方差齐性检验: 两样本方差具齐性(两样本的
方差差异不显著), 检验过程从略。
②假设: 零假设 H0: μ1=μ2, 表示 2 组玉米的平
均株高无显著差异; 备择假设HA: μ1 > μ2, 表示对照
玉米的平均株高显著高于盐处理玉米。
③显著性水平: α 取 0.05。
④检验统计量: 用成组数据 t 检验。
1 2
2(8 1) 2 2 2 2
1 2
76 63 13
1.582
8.21718.4 +14.2
8
t
s s
n
X X
−
−
−
= = = =
+
表 1 成组实验设计的玉米实验处理前的株高(cm)
实验编号 1 2 3 4 5 6 7 8 平均数 标准差
对照组 X1 5 6 7 4 4 1 3 9 4 7 5 6 3 4 4 5 49.0 12.7
处理组 X2 5 3 3 8 6 7 3 6 6 6 5 5 4 2 4 3 50.0 12.1
表 2 成组实验设计的玉米实验处理1周后的株高(cm)
实验编号 1 2 3 4 5 6 7 8 平均数 标准差
对照组 X1 91 111 6 7 5 9 7 5 8 0 5 3 7 2 76.0 18.4
处理组 X2 6 5 4 8 8 4 4 7 8 2 6 7 5 5 5 6 63.0 14.2
植物生理学通讯 第 46 卷 第 2 期,2010 年 2 月 163
⑤拒绝域: t > t0.05
t14, 0.05=1.761, t14 < t14, 0.05, 落在接受域内, 接受零
假设。
⑥结论: 100 mmol·L-1 NaCl处理的玉米株高与
对照玉米相比没有显著差异。
2.2 配对设计及其实验结果的统计分析 配对的方
式有 2种: 同源配对与自身配对。本例属于同源配
对, 即将来源相同、性质相同的2个个体配成一对,
如将品种、性别、年龄、体重、高度等都相同
或相近的 2个实验植物或动物配成一对, 然后对配
对的 2 个实验对象分别施加不同的处理(吴占福
2005)。本文培养得到的 16 株玉米材料是按照株
高进行配对, 方法是从矮到高将玉米依次两两配成
一对, 如先从最矮的2株玉米开始配对(34 cm和36
cm高的 2 株玉米配成一对), 然后再将第三、第四
矮的 2 株玉米(38 cm 和 39 cm)配成一对, 依次类
推, 直到把 16 株玉米全部配成 8 对。配成对子的
两株玉米应随机分配到2个处理组中, 一组玉米作
为对照组, 浇灌 Hoagland完全营养液; 另一组玉米
为盐处理组, 浇灌用Hoagland完全营养液配制100
mmol·L-1 NaCl, 其他培养条件完全相同。配对和
分组结果列于表 3。
玉米经盐处理 7 d 后, 测定株高。实验结果
(表4)显示, 原来配成对子的两株玉米经处理后产生
了很大差异。如第 1 对玉米原来的株高分别为 34
cm和 36 cm, 配对数据差为 −2 cm; 处理 1 周后的
株高结果分别为 53 cm和 47 cm, 配对数据差为 +6
cm。盐处理玉米的株高显著低于对照, 说明盐处
理显著抑制了玉米的生长, 其他的盐处理玉米的株
高也都低于相应的对照植株。而从成组设计的实
验结果中不易直接观察出株高的这种变化规律(表
2)。表 4中的 2组玉米平均株高的差异显著性用配
对数据 t 检验, 统计分析方法如下。
解: ①数据运算: 求出配成对子的数据之差
di=X1i−X2i及所有di的平均值 d 和标准差sd, 计算结
果列于表 5。
②假设: 零假设H0: μd=0, 表示每对数据无显著
差异; 备择假设 HA: μd > 0, 表示对照玉米株高与相
对应的盐处理玉米的株高之差大于零, 即对照玉米
显著高于相对应的盐处理玉米。
③显著性水平: α 取 0.05。
④检验统计量: 用配对数据 t 检验。
7
d
13 13 5.5716.6 2.333
8
d
n
t s= = = =
其中n为配对数据的对子数, 本例为8对数据,
n=8, 所以自由度 df=n−1=8−1=7。
⑤拒绝域: t > t0.05
t7, 0.05=1.895, t7, 0.01=2.998, t7 > t7, 0.01, 落在拒绝域
内。
⑥结论: 100 mmol·L-1 NaCl处理的玉米的株高
极显著地低于对照组玉米。
2.3 配对实验设计的优点 从上面的例子可以看出,
用同样的16株玉米材料来研究玉米的耐盐性, 2种
实验设计方法却得出了2种截然不同的实验结论。
成组实验设计之所以得出“100 mmol·L-1 NaCl处理
的玉米株高与对照玉米相比没有显著差异”的错
误结论(P>0.05), 就是因为这种设计方案的系统误
差较大, 掩盖了盐处理效应。
用配对法设计的实验则不仅能判断出玉米幼
表 3 配对实验设计的玉米实验处理前的株高(cm)
实验编号 1 2 3 4 5 6 7 8 平均数
对照组 X1 3 4 3 9 4 1 4 5 4 7 5 6 5 6 7 4 49.0
处理组 X2 3 6 3 8 4 2 4 3 5 3 5 5 6 6 6 7 50.0
表 4 配对实验设计的玉米实验处理1周后的株高(cm)
实验编号 1 2 3 4 5 6 7 8 平均数
对照组 X1 5 3 5 9 6 7 7 2 7 5 8 0 91 111 76.0
处理组 X2 4 7 4 8 5 5 5 6 6 7 6 5 8 2 84 63.0
植物生理学通讯 第 46 卷 第 2 期,2010 年 2 月164
苗经100 mmol·L-1 NaCl处理后, 其株高显著地低于
对照组玉米, 而且还发现2组玉米株高差异达到极
显著水平(P<0.01)。这是因为配对设计减小了处
理前2个样本实验对象的个体差异对株高所造成的
影响, 降低了系统误差, 提高了实验的精确性, 比成
组法更容易检验出 2 组数据平均数之间的本质差
异, 结论更准确、更可靠。所以, 在条件允许的
情况下尽量把实验设计为配对比较法, 可以提高检
验效率, 达到事半功倍的效果(杜荣骞 2005)。
2.4 成组实验设计和配对实验设计实验结果的表
示方法
2.4.1 成组实验设计实验结果的表示方法 在科技
论文中, 对实验结果的描述一般要求给出平均值、
标准差和处理重复数, 有时还需要标出数据的相对
百分比及差异显著性, 玉米耐盐性实验的成组设计
实验结果表示方法列于表 6。
表 5 配对数据差(株高差 cm)的计算结果
实验编号 1 2 3 4 5 6 7 8 平均数 标准差
对照组 X1 5 3 5 9 6 7 7 2 7 5 8 0 91 111 76.0 18.4
处理组 X2 4 7 4 8 5 5 5 6 6 7 6 5 8 2 84 63.0 14.2
d = X1 - X2 6 1 1 1 2 1 6 8 1 5 9 27 1 3 6.6
2.5 配对设计及其检验的使用条件
(1)配对实验设计要求实验对象必须先按照选
定的配对方法严格进行配对, 然后进行分组, 2 组
实验对象的个数必须相等。但不必考虑 2 组数据
的方差是否具齐性(童新元 2006)。其平均数的差
异显著性检验方法用配对数据 t 检验。
(2)变异性比较大的实验指标, 不能用成组实验
设计, 但可以用配对实验设计。
(3)配对数据t检验也主要用于2个平均数的比
较, 一般不用于多个平均数的相互比较。其对应的
多个平均数的显著性检验可用随机化完全区组设计
(吴占福 2005)。
(4)配对实验设计的数据对子数(重复数)一般
也要求都不得小于 5, 最好大于等于 10。
总之, 植物生理学和许多生物学科一样, 在很
多方面都离不开统计学。我们在植物生理学教学
和科研工作中经常发现, 许多科研工作者和学生的
统计学基础很差, 经常由于实验设计错误或者统计
方法错误导致得出错误结论, 以致很多有意义的生
理现象不能被发现和正确解释。本文以最简单的
2种实验设计为例来说明统计学在植物生理学实验
中的重要性, 增强科研工作者在从事植物生理学教
学和科研中的统计学意识。掌握好统计学不仅可
为我们提供科学的分析方法, 还可以养成科学的思
维方式, 对科研工作者来说是十分重要的。
参考文献
杜荣骞主编(2005). 生物统计学(第 2 版). 北京: 高等教育出版社,
77~221
李春喜, 姜丽娜, 邵云, 王文林编著(2005). 生物统计学(第 3 版).
北京: 科学出版社, 101
陆建身, 赖霖主编(2006). 生物统计学(第 1 版). 北京: 高等教育
出版社, 101
曲均革, 张卫, 金美芳, 虞星炬(2006). 细胞均一性对葡萄细胞生
长和花青素合成的影响. 生物工程学报, 22 (5): 805~810
童新元主编(2006). 医学统计与 CHISS 应用(第 1 版). 北京: 人民
军医出版社, 17
吴占福主编(2005). 生物统计学(第 1 版). 北京: 科学出版社, 57
表 6 成组设计的玉米株高(cm)
对照 处理
76.0±18.4 (100%) 63.0±14.2ns (82.9%)
表中数据均为 8 个重复平均值±标准差, ns 表示差异不显著。
表 7 配对设计的玉米株高(cm)
对照 处理 配对数据差 d
76.0±18.4 (100%) 63.0±14.2** (82.9%) 13±6.6 (17.1%)
表中数据均为 8 个重复平均值±标准差, ** 表示差异极显著。
2.4.2 配对实验设计实验结果的表示方法 对于配
对数据, 仅列出平均值、标准差和样本含量不能详
细描述实验过程和实验结果, 还要列出所有配对数
据差(di)的平均值及其标准差, 并标明数据对数(重
复数), 玉米耐盐性实验的配对设计实验结果表示方
法列于表 7。