试验方法是生态学假说的主要验证方法之一,但也存在由原假说引发的质疑.Quinn和Dunham(1983)通过对Platt(1964)的假说演绎模型进行分析,主张生态学不可能存在可以严格被试验验证的原假说.Fisher的证伪主义与Neyman-Pearson(N-P)的非判决性使得统计学原假说不能被严格验证;而生态过程中存在的不同于经典物理学的原假说H0(α=1,β=0)与不同的备假说H1′(α′=1,β′=0)的情况,使得生态学原假说也很难得到严格的实验验证.通过降低P值、谨慎选择原假说、对非原假说采取非中心化和双侧验证可分别缓解上述的原假说困境.但统计学的原假说显著性验证(NHST)不应等同于生态学假说中有关因果关系的逻辑证明方法.因此,现有大量基于NHST的生态学假说的方法研究和试验验证的结果与结论都不是绝对的逻辑可靠的.
Experimental test is one of the major test methods of ecological hypothesis, though there are many arguments due to null hypothesis. Quinn and Dunham (1983) analyzed the hypothesis deduction model from Platt (1964) and thus stated that there is no null hypothesis in ecology that can be strictly tested by experiments. Fisher’s falsificationism and Neyman-Pearson (N-P)’s nondecisivity inhibit statistical null hypothesis from being strictly tested. Moreover, since the null hypothesis H0(α=1, β=0) and alternative hypothesis H1′(α′=1, β′=0) in ecological progresses are different from classic physics, the ecological null hypothesis can neither be strictly tested experimentally. These dilemmas of null hypothesis could be relieved via the reduction of P value, careful selection of null hypothesis, non-centralization of non-null hypothesis, and two-tailed test. However, the statistical null hypothesis significance testing (NHST) should not to be equivalent to the causality logistical test in ecological hypothesis. Hence, the findings and conclusions about methodological studies and experimental tests based on NHST are not always logically reliable.
全 文 :生态学假说试验验证的原假说困境
李 际1,2∗
( 1中国科学院大学博士后流动站, 北京 100049; 2 云南师范大学马克思主义学院, 昆明 650500)
摘 要 试验方法是生态学假说的主要验证方法之一,但也存在由原假说引发的质疑.Quinn
和 Dunham(1983)通过对 Platt(1964)的假说⁃演绎模型进行分析,主张生态学不可能存在可以
严格被试验验证的原假说.Fisher的证伪主义与 Neyman⁃Pearson(N⁃P)的非判决性使得统计学
原假说不能被严格验证;而生态过程中存在的不同于经典物理学的原假说 H0(α = 1,β = 0)与
不同的备假说 H1′(α′= 1,β′= 0)的情况,使得生态学原假说也很难得到严格的实验验证.通过
降低 P值、谨慎选择原假说、对非原假说采取非中心化和双侧验证可分别缓解上述的原假说
困境.但统计学的原假说显著性验证(NHST)不应等同于生态学假说中有关因果关系的逻辑
证明方法.因此,现有大量基于 NHST的生态学假说的方法研究和试验验证的结果与结论都不
是绝对的逻辑可靠的.
关键词 原假说; 备假说; 显著性验证; 判决性
Dilemma of null hypothesis in ecological hypothesis’ s experiment test. LI Ji1,2 ( 1 Station of
Post⁃doctorial Research, University of Chinese Academy of Sciences, Beijing 100049, China; 2School
of Marxism, Yunnan Normal University, Kunming 650500, China) .
Abstract: Experimental test is one of the major test methods of ecological hypothesis, though there
are many arguments due to null hypothesis. Quinn and Dunham (1983) analyzed the hypothesis de⁃
duction model from Platt (1964) and thus stated that there is no null hypothesis in ecology that can
be strictly tested by experiments. Fisher’s falsificationism and Neyman⁃Pearson (N⁃P)’s non⁃deci⁃
sivity inhibit statistical null hypothesis from being strictly tested. Moreover, since the null hypothesis
H0 (α= 1, β= 0) and alternative hypothesis H1′(α′= 1, β′ = 0) in ecological progresses are diffe⁃
rent from classic physics, the ecological null hypothesis can neither be strictly tested experimentally.
These dilemmas of null hypothesis could be relieved via the reduction of P value, careful selection
of null hypothesis, non⁃centralization of non⁃null hypothesis, and two⁃tailed test. However, the sta⁃
tistical null hypothesis significance testing (NHST) should not to be equivalent to the causality lo⁃
gistical test in ecological hypothesis. Hence, the findings and conclusions about methodological
studies and experimental tests based on NHST are not always logically reliable.
Key words: null hypothesis; alternative hypothesis; significance testing; decisivity.
本文由中国博士后科学基金项目(2015M571099)、教育部人文社科
研究基金项目(14YJCZH072,13YJA720019)和云南师范大学马克思
主义学院科研基金项目资助 This work was supported by the China
Postdoctoral Science Foundation (2015M571099), the Humanity and So⁃
cial Science Foundation of Ministry of Education, China (14YJCZH072,
13YJA720019) and the Research Foundation of School of Marxism, Yun⁃
nan Normal University, China.
2015⁃10⁃21 Received, 2016⁃03⁃10 Accepted.
∗通讯作者 Corresponding author. E⁃mail: liji@ ucas.ac.cn
1 生态学假说的验证方法
目前对生态过程的研究已成为研究热点[1-3] .因
为研究对象始终处于演化中的整个自然界,生态学
假说的验证一直比较困难. Roughgarden[4]感慨道:
“我欣赏将群落生态学理论作为一般理论框架的呼
吁.如果我们睁开双眼去搜寻一般理论,也许谨慎的
态度可以免于陷入提出错误的一般理论的危险.所
以,如今的群落生态学有一般理论吗? 没有.可能有
吗? 是的.应该有吗? 我不知道.”鉴于任何一般理
论都必须经过严格验证才能被接受,所以,Rough⁃
garden[4]的困惑反映了当前生态学假说缺乏严格的
验证方法的情况.
Jaeschke等[5]对 Web of Science 上 2003—2012
年内收录的关于气候变化对物种和生态系统影响的
应 用 生 态 学 报 2016年 6月 第 27卷 第 6期 http: / / www.cjae.net
Chinese Journal of Applied Ecology, Jun. 2016, 27(6): 2031-2038 DOI: 10.13287 / j.1001-9332.201606.025
全部 1189篇科学文献进行了分析,统计出“处于应
用主导地位的研究方法”,包括野外观察( field ob⁃
servation)、试验[即野外试验( field experiment)和实
验室试验(laboratory experiment)]、对未来趋势的模
型化(modeling)以及文献分析(meta analysis)或数
据挖掘(data mining).将野外观察、野外试验和实验
室试验归纳为试验方法后,Jaeschke 等[5]指出生态
学假说的验证方法可以分为试验法、建模法和文献
法 3类.
部分生态学家主张采用建模方法验证生态学理
论.比如,Sax等[6]认为生态学中最有研究价值的研
究选题是物种入侵,倾向于采用建模方法进行研究.
Brooker等[7]回顾了植物互惠作用( facilitation)研究
的发展现状后,提出了互惠作用中的相互作用( in⁃
teraction)是自然群落环境变化的重要影响因子之一
的假说,同时建议采取建模方法进行验证.这种方法
得到的结果比较精确,但主要适用于因果关系明确
且历史数据完备的问题.这对研究条件的要求较高,
在生态学研究中往往很难实现.例如,Jaeschke 等[5]
认为,建模经常忽略生态过程中微生境下的物种相
互作用及其对整个生态过程的影响,可见生态过程
的网络之错综复杂.
同时,尽管 Jaeschke 等[5]承认因为文献分析运
用了客观、定量的统计学方法,综合大量现有的研究
成果而获得最终的结论,具有研究数据易获得、结果
易于重复验证和容易达成共识的优点,使得这个方
法也获得不少研究者的青睐.但也有反对的声音,
Fraser等[8]主张文献分析不适合作为生态学假说的
验证方法的依据之一就是各种文献中采用的研究方
法不尽相同,没有统一的标准.
而试验是科学假说重要的验证手段,尤其在经
典物理学中成为验证假说的最终手段.这种方法也
受到了很多研究者的认可. Scheiner 和 Gurevitch[9]
指出,“生态学日益发展成为一门试验科学……生
态学家们越来越多的利用试验来验证自然理论”.
Fridley等[10]就物种入侵研究中的“本地物种⁃外来
物种丰度关系” ( native⁃exotic richness relationships,
NEERs)的假说,比较了试验、观察与建模 3 种验证
方法的研究结果发现,观察法是研究物种入侵的基
本策略,而试验法与观察法相结合才能更好地对关
于物种入侵的一般性假说进行验证. Jaeschke 等[5]
根据文献分析的结果指出,“试验是允许验证假说
的工具”.
无论是建模方法还是文献分析方法,都需要数
据支持.数据的获得离不开试验,所以,作为生态学
假说验证方法之一的试验成为最值得关注和研究的
方法.但对生态学假说的试验验证存在着关于原假
说(null hypothesis)的争鸣[国内对于“null hypothe⁃
sis”主要存在“原假说”、“虚假说”与“零假说”3 种
译法,鉴于 null hypothesis 与“ alternative hypothesis”
(“备假说”)是一对范畴,本文采用“原假说”的译
法]. Shrader⁃Frechette 和 Mccoy[11]认为生态学家经
常不能确定基于原假说的初始条件. Cohen 直接宣
称原假说在逻辑上是错误的[12] . Ellison[13]批判了
Shrader⁃Frechette和McCoy[11]的观点,认为生态学中
原假说很少存在,Shrader⁃Frechette 和 Mccoy[11]的研
究没有解决原假说的困境.Sexton 等[14]强调必须对
物种入侵的假说进行试验验证.他们把上述假说分
为 3类:1)没有环境异质性或演化的环境;2)有环
境异质性但没有演化的环境;3)有环境异质性和演
化的环境.从环境梯度变化角度重点针对第三类假
说阐明了物种相互作用的非线性变化导致了原假说
的物种入侵假说失效. Williams 等[15]报告了对解释
外来物种在新生境中高密度生长机制的两种假说的
野外试验验证的结果.这两种假说分别是“摆脱了
(原生境中的)食草昆虫”和“对新生境范围内的干
扰产生更大的响应”. 他们承认因为试验区组
(block)过少(3个),研究结论不适合作为一般假说
的验证结果.换言之,他们将两种竞争性理论(即假
说)互为原假说,但鉴于生态学的特性,有限的试验
不能严格地验证生态学假说. Jaeschke 等[5]总结性
地概括试验验证失败的原因在于“不能包括所有的
多样性和空间”.这是因为生态圈涉及从大气圈到地
表以下 1 km处的所有自然界事物,无论如何精心设
计和操作试验,都无法通过有限的经验去严格验证
具有普遍性的假说.所以,生态学假说可能不适合用
试验进行验证———生态学研究对象所处环境的开放
性,很难达到近代物理学试验中的严格控制和排除
表 1 生态学假说的 3种验证方法的优缺点
Table 1 Advantages and shortages of three test methods
for ecological hypothesis
方法
Methods
优点
Advantages
缺点
Shortage
建模
Modeling
结果精确 研究条件要求较高
文献分析
Data analysis
数据易获得,结果易重
复
标准不统一,缺乏试验
数据
试验
Experiment
验证假说的最终手段 原假说是否存在及如
何实现存在争鸣
2302 应 用 生 态 学 报 27卷
其他干扰项的试验效果,即使生态学试验结果支持
了假说,也无法确证假说中的因果关系一定成立,即
A原因并不一定导致 a结果或 a 结果并不一定是由
A原因导致.
2 生态学试验的科学说明模型与原假说困境
Quinn和 Dunham[16]从科学说明模型的角度探
讨了试验法中的原假说困境.他们认为,生态学试验
方法采用的是 Platt 的假说⁃演绎(hypothesis⁃deduc⁃
tion)的科学说明模型,是一种强推理逻辑.鉴于演绎
方法存在前件不充分[或“自明”(self⁃evidence)]的
弊病,Platt提出了逻辑上可以穷尽前者的试验研究
步骤:1)设想(device)各种候选假说;2)用候选假说
设计一个(或多个)判决性试验,且彼此尽可能的相
互独立;3)开展试验,获得清晰的试验结果;4)如果
结果不支持候选假说,则进一步提出并验证子假说
或提出新的假说.如此往复,直到最终确定的所有假
说都得到证实.
Quinn和 Dunham[16]的关键辩护在于以下 3 个
主要的论点:“1)形式化的假说通常不能允许一个
有限数量的、具有离散可能性的、有意义的反证,因
为多因子的模式原则上不可能形成能在同时发生的
进程中辨识‘真理’的‘判决性试验’;2)如果影响因
子之间存在强相互作用,多因子进程的行为不可能
被任何单因子假说的试验组合可靠的得出;3)在假
说⁃演绎形式体系中,只有当一个假说被拒绝了,(对
此问题的)理解才会增加”.
以上辩护说明,他们认为一般不存在原假说.因
为“通常,没有单因子能被证明可说明自然群落的
模式和进程中全部被观察的变量”,生态过程是一
个存在相互作用( interaction)的多因子之间协同演
化的过程.在这个过程中,不存在某种单一的主导因
子.因此,根据单一主导因子建立一个基于原假说的
假说并在试验中得到验证是不可能的.在试验失败
后,换一个单一主导因子继续进行验证只是在不断
重复着错误的思路,即使把所有的因子都逐一进行
试验验证,也不可能找到单一的主导因子.由此,在
近代物理学中把单一主导因子作为原假说进行试验
的假说验证方法对于理解生态过程毫无帮助.
所以,他们明确指出:“试图形成一个单因子因
果关系(即原假说)的单变量系列试验可能错误估
计它们的实际贡献……实践中,可靠的原假说经常
是不可构建的”.如果他们是对的,生态学假说参照
近代物理学试验方法,通过改变单一影响因子的初
始值并观察结果而验证假说预测的是否准确的方法
就是行不通的.他们把这种情况称之为“原假说困
境”.按照他们的观点,原假说是假说的试验验证的
演绎前提,若原假说不能成立,则试验方法就不能作
为假说的验证方法.其实,存在着两种情况:1)其他
影响因子不可控;2)其他影响因子可控且匀质.他们
所谓的困境仅存在于情况 1,本文仅针对情况 1
讨论.
因原假说在生态学假说的试验验证中的应用属
于统计学工具和生态学问题的交叉,为将此问题条
分缕析的进行探讨,以下分别从统计学范畴和生态
学范畴探讨原假说在假说试验验证中存在的争鸣与
困境.
3 统计学范畴中的原假说争鸣
统计学范式对生态学的影响很大.Keller 和 Gol⁃
ley[17]从数千篇论文中筛选出的生态学发展史上 22
篇最有影响力的文献,就涉及到了被 Simberloff[18]
看作是生态学新范式的概率论(probabilism).
统计学也有针对假说的验证方法,称为显著性
验证.它是对关于总体某个声明的验证[19] .原假说就
是统计学假说验证方法中的重要概念,最初是为了
寻找因果关系而提出假说,并用统计事件对其进行
验证而提出的概念.原假说最早由 Fisher 提出,后被
Neyman⁃Pearson(N⁃P)进一步发展.作为一种方法,
被称之为“原假说显著性验证(null hypothesis signi⁃
ficance testing,NHST)” [20] .
3 1 Fisher的证伪主义
在统计学中,面对大量的统计事件,需要找出其
中的因果关系.为了确定决定因素,会提出一个假说
并进行验证.这个假说就是原假说(H0),但统计学
处理会同时提出两个假说,另一个称之为备假说
(alternative hypothesis,H1).两者按照排中律构成一
对相互对立的范畴.在验证中,只有一个假说可能为
真,这样就可明确是否存在因果关系[18] .比如:按照
统计学规范,Williams 等[15]研究所涉及的“摆脱了
(原生境中的)食草昆虫”假说可以设定为原假说
“摆脱了原生境中的食草昆虫后,植物种在新生境
中的演替(succession)比原生境更加繁荣”.而对应
的备假说应该是“摆脱了原生境中的食草昆虫后,
植物种在新生境中的演替和原生境一样”.
但统计事件本身是随机的,逐一验证大量统计
事件的难度很大.而验证所有逻辑上与待验假说有
关的统计事件更加超出了一般研究者的能力范围.
33026期 李 际: 生态学假说试验验证的原假说困境
所以,统计学的原假说的显著性验证在实践中也仅
仅是针对有限的子集而言.对此,Fisher 明确提出了
NHST被滥用的反对意见.他认为,NHST 建立在存
在无限多的统计事件并从中随机抽取若干样本进行
验证的前提,并假定“这些数据都是从基于同一因
果条件背景(matrix of causal conditions)产生的所有
数据中抽取的随机样本”,是对大量统计事件的简
化处理.因为 NHST的前提是一种假说,所以他强调
“显著性验证中不包含任何‘接受’某一假说的标
准”、“总体而言,显著性验证的基础是基于原假说
而得出的假想概率,这些验证不能导出任何关于真
实世界的概率论断” [20] .Fisher 本意是 NHST仅仅能
确定假说暂时没有被证伪,但绝对不能说假说是被
证实的.这是典型的证伪主义.按照他的观点,NHST
不能作为任何科学理论的统计学验证方法.推理可
知,也不能用于生态学假说的试验验证.如果 NHST
可以作为生态学假说的试验验证规范,这个试验必
须在整个生态圈中进行,或者在生态圈的每个地方
进行———这是无法操作的.Fisher 的观点非常严谨,
但无法达成假说验证的直接目的———假说验证的直
接目的是通过严格验证后确定可以解释生态过程因
果关系的理论.生态学试验似乎的确存在原假说
困境.
3 2 N⁃P 的非判决性
N⁃P 试图解决这个难题,因而采取了激进的策
略.他们认为 NHST存在两类统计错误,第一类错误
是原假说本身的错误,第二类错误是与原假说对立
的统计事件.按照统计学的观点,两类错误都具有出
现的概率,分别是 α和 β.理想条件下,NHST应该追
求 α的 P值= 0时,β的概率就是验证的结果.如果 β
>0,假说就被证明是错的.但根据贝叶斯公式,α和 β
是互相关联的,当 α= 0 时,β 趋向于无穷.这就无法
对任何一个假说进行验证了.所以,必须把 α控制在
可接受的范围,再根据 β 得出结论.Fisher 规定了 P =
0.05,换言之,β 的结果有 0.95 的概率是错的.正因
为如此,N⁃P 具有可操作性,但也同时缺乏足够的严
谨性.通过 N⁃P 的 NHST 进行统计学的假说验证只
是权宜之计,得出的结论只能是 NHST 在 α = X 时,
假说成立的概率是 β.按照 N⁃P 的观点,Williams
等[15]的原假说应该修正为“当植物种在新生境中摆
脱原生境中的食草昆虫的概率是 α 时,它在新生境
中的演替比原生境更加繁荣的概率是 β”.这样的假
说就算验证成立,因为具体的某个生态过程结果是
确定的,无法对其进行解释和预测,因此也不符合假
说验证的最终目的———假说验证的最终目的是通过
严格验证后确定可以对所有相同的生态过程进行解
释和预测,N⁃P 得出的是非判决性的结论.所以,Co⁃
hen提出了对原假说的验证力(power)质疑,但并未
提出有效的处理建议[21] .
4 生态学范畴的原假说困境
4 1 H0(α= 1, β= 0)
孙根年等[22]引用 Nelson 和 Harison 的观点,认
为假说的提出与试验验证间存在严密的逻辑关联且
是具有“强置信度( strong inference)”的.随后,他以
被誉为“种群生态学及试验的开山鼻祖”的 Krebs的
食物假说( food hypothesis)中关于“由于食物短缺,
(导致)田鼠大部分被饿死,人工补充食物将会阻止
田鼠种群的崩溃”的原假说的试验验证为例,论证
了他的观点.他主张,试验是生态学假说的有效验证
方法.但“一个‘好’的试验, 统计验证的显著差异可
证明处理效应的存在;而一个‘坏’的试验, 统计验
证的显著差异本身并不能证明处理效应的真实存
在” [23] .生态学试验验证即使是针对特定假说设计
的,也不能确保假说所蕴含的因果关系是绝对的,自
然得出的结论未必比归纳方法可靠.无论是 Fisher
还是 N⁃P,基本的假说都是“小概率事件实际不可能
发生”.这种假说认为只要概率足够低,则在真实存
在的、无限多的统计事件中就不存在反例.生态学假
说的试验验证也是一样的思路———把假说针对的生
态过程在真实的生态演化中的总次数看作 X,而试
验次数仅仅是 x,则试验次数在 X 中的随机概率是
α,只要试验结果没有出现反例,则 β = 0,假说成立.
但生态学和近代物理学是不同的.近代物理学的研
究对象的自然规律是确定的,因果关系应该是永恒
不变的.而生态过程是始终演化的,过去存在的因果
关系现在可能不存在了,现在存在的因果关系未来
可能不存在了,现在不存在的因果关系未来可能出
现了.所以,不同于 Fisher主张的假说逻辑存在的统
计事件总数趋向于无穷多,生态学假说在生态过程
中出现 α 的逻辑可能趋向于最大值 1 时,则生态学
中的 β逻辑上应该是 0.因此,生态学的所有试验验
证逻辑上应该倾向于“证实”假说(H0)成立.在还未
试验时,Krebs 提出的假说在逻辑上为真的概率远
大于为假的概率.似乎,生态学的特点决定了原假说
困境比在一般的统计学研究中表现得更加明显.
4 2 H1′(α′= 1, β′= 0).
Krebs尤其忽略了生态过程的开放性和系统性
4302 应 用 生 态 学 报 27卷
导致的和 α无关的 β的变化.在假说的试验验证中,
逻辑上所有的统计事件(穷尽的试验结果)被认为
由两个子集构成:符合被验证的原假说 H0的试验结
果集 S1和符合被验证的备假说 H1的试验结果集 S2 .
根据“命题的逆否命题和原命题等价” 的逻辑学原
理,当发现试验结果值在 S2中时, 就可以拒绝原假
说从而接受备假说.因为生态过程的开放性和系统
性,其实存在着第 3个试验结果集 S3 .S3是由和原假
说无关的由假说 H1′的因果关系形成的.比如,为了
验证“食物假说”,人工补充食物后,发现田鼠没有
大规模死亡.其中,原假说 P = 0,“人工补充食物后,
田鼠没有大规模死亡”是 H0,“人工补充食物后,田
鼠大规模死亡”是 H1 .按照 N⁃P,如果观察到 H0出
现,即 β= 1,则“食物假说”成立,如果观察到 H1出
现,则“食物假说”不成立.但逻辑上还存在“人工补
充食物后,冬季温度明显高于常年,田鼠没有(在冬
季)大规模死亡”之类的 H1′.这是因为相对于 P = 0
的 α′出现了 P = 1 的 α′,β′永远只可能是 0.当存在
此类 H1′时,Krebs 在还未试验时,他提出的假说为
真的概率已经是 1.这种情况叫做多因子关系.在生
态学中,这种情况层出不穷.这也是生态学中对生态
过程的因果关系的假说特别多的原因,甚至引起了
Roughgarden[4]对生态学中存在可被严格验证的假
说(理论)的质疑.由于假说提出和试验设计阶段忽
略了可能存在的 H1′和 α′,生态学假说的试验验证
似乎根本无法避免原假说困境(多因子关系导致试
验者无法判断主导因子,但可通过多因子控制试验
分析有效因子的具体影响率或贡献率,因为这种处
理不属于本文关注的原假说困境,不予讨论).当前
的生态学知识的积累远远未达到可以事先注意到所
有可能存在的 H1′和 α′.
5 原假说困境的处理方法
前文分析中,将生态学假说的试验验证中存在
图 1 原假说困境的 2类范畴与 4种具体情境
Fig.1 Two categories and four detail senarios of dilemma of
null hypothesis.
的原假说困境分为统计学范畴和生态学范畴两类,
并说明了 4种具体的困境情形.对于 4 种情形,虽然
目前未必有彻底的解决方法,但也可有合适的处理
方法减少其对试验验证结论的影响.
5 1 Fisher的证伪主义
按照 Fisher的证伪主义,不存在可以被一劳永
逸证实的原假说,只存在逻辑上可以被证明是错误
的原假说.如果这种原假说在试验验证后可能还没
有被证明是错误的,则这种原假说就是得到试验验
证而暂时没有被否定的科学假说.例如,把“食物匮
乏是导致田鼠大规模死亡的原因”作为原假说,逻
辑上也可能存在诸如疾病、饮水、空气等其他原因导
致原假说被证伪.虽然截止到最新的数据,所有证据
都表明食物匮乏是原因.但逻辑上,总是存在这个原
假说被证伪的可能.这种情况下,只能确认(confirm)
这个原假说暂时没有被证伪,或者说,它目前具有较
大概率为真.
原假说具有多大概率为真的关键是 P 值,不同
于事先给定的 α.它是基于假说和数据计算出来的.
作为人为确定的证伪标准,Fisher主张以 P= 0.05 为
阈值.Fisher反对 N⁃P 的频率学派思路,按照他的观
点,P= 0.05仅仅是作为在原假说被证实的前提下,
出现反例的小概率统计事件的标准,而并非平均
100次试验就有 5次试验否定原假说.他把前者称为
“归纳的推论”(inductive inference),后者叫做“归纳
的行动”( inductive behavior),并认为统计学只能做
归纳推论[20] .也就是说,即使试验结果达到 P =
0.05,也不意味着生态学试验完全证实了假说,更不
能说备假说就一定是错的.
就逻辑而言,Fisher 的理论非常严谨.但 Fisher
没有详细说明为何规定 P = 0.05.从逻辑上而言,如
果 P无限接近于 0,则归纳推论的结果也就无限接
近于归纳行动.虽然这在现实中是非常占用科研资
源的方法,但至少在逻辑上给出了化解 Fisher 的原
假说困境的方法.Williams 等[15]的研究就存在 P 值
太大的问题,他们必须经过更多的试验对假说进行
验证.有学者提出 P<0.001[23] .
5 2 N⁃P 的非判决性
N⁃P 的关键是首先限定 α 不变,谋求 β 概率最
小化.这称之为“行为法则”(rule of behavior),即“为
确定是否拒绝某一假说 H,计算一个由观测得出的
特征值 X;如果 X >X0,拒绝 H,如果 X≤X0,接受
H” [20] .不同于 Fisher假说逻辑上统计事件是无穷多
的,N⁃P 假说记录到的统计结果是无穷多的,但很多
53026期 李 际: 生态学假说试验验证的原假说困境
假说的试验验证仅有极少的次数,这导致 N⁃P 在现
实中并没有实现构想的严格验证.但 N⁃P 也要求限
制 α值,这意味着原假说被验证的主要目的不是为
了证实它,而是与 Fisher 一样是证伪它———当原假
说没有被证伪时,只能采纳“暂不否定”的结论,而
不是采纳“证实”的结论.
因此,处理 N⁃P 的非判决性的原假说困境的方
法是合理地选择原假说.只有原假说和备假说的选
择合理,才可能使得 α 值得到更多的限制(即原假
说被证伪的概率更小,α 的 P 值尽可能接近 0,提高
N⁃P 的判决性) [24] .综合各种观点,一般可以通过把
早已存在的、一旦成立后果更加严重的或逻辑上似
乎更不太可靠的假说作为原假说[24-30] .在 Krebs 的
试验中,“人工补充食物后,田鼠大规模死亡”的后
果明显比“人工补充食物后,田鼠没有大规模死亡”
不可靠,因此,应该以“人工补充食物后,田鼠大规
模死亡”为 H0,得出的试验结果对于假说的验证力
更大,一旦原假说没有被证伪,则原假说为真的可能
性大于以“人工补充食物后,田鼠没有大规模死亡”
为原假说为真的可能性.由此对假说进行试验验证
更具有判决性.
5 3 H0(α= 1, β= 0)
这种情况涉及了原假说的基本概念. Fisher 和
N⁃P 都设定了原假说的存在,并认为原假说符合非
此即彼的排中律,与备假说是完全对立的.但在统计
学中,存在着很多非原假说(non⁃null hypothesis)的
情况[31] .生态学中也是如此.因为生态过程中连因果
关系本身也处于演化之中.这导致了生态学中存在
着大量的非原假说.
借鉴同为生命科学阵营的医学统计学的研究成
果,至少可以采取对非原假说采取非中心化的处理.
经典的非中心法也是基于原假说的,针对非原假说
的情况,可以采取数列计算的方法.具体而言,若提
出了多种原假说,则相对于其他原假说而言,彼此都
是非原假说(而非备假说),展开同样条件的多个试
验 i,每个试验中随机验证其中一个原假说,设第 i
个试验 P值为 πp.这可组成一个数列联表 1.设验证
结果是 μ,再设验证结果的差量为 Δi,再设非原假说
为 H: μi =Δi , 其对立假说为 H1: μi≠Δi.这可组成
一个数列联表 2.将数列联表 1 的核心元素看作实际
频数 (O), 数列联表 2 的为理论频数 ( E), 按
∑(O⁃E)2 / E得 λ( i-1,α,β),而 λ 值通过 Haynam
表即可查出.非原假说非中心化的处理方法引入了
Δ,具体的数值需要根据历史试验或经验记录来确
定,当 Δ= 0时,非原假说非中心的处理结果与原假
说的处理结果一致[28] .Williams 等[15]的研究是对两
种竞争性理论(假说)进行试验验证,目的是确定哪
种假说是真.所以,他们其实是在处理非原假说的情
况,可以采用这种方法.当然,试验次数越多,两种假
说被随机试验的次数也越多.其中,特别需要谨慎的
是 Δ的取值.
5 4 H1′(α′= 1, β′= 0)
这种情况也是由非原假说造成的.导致此类情
况的原假说困境的原因是采取了单侧验证,若采用
双侧验证则可以消解此类困境的出现.具体而言,原
假说的 μ与 Δ只有两种情况,即> = 0 和<0;非原假
说 H的 μ与 Δ有 3种情况,即>0、<0和= 0.将= 0的
情况单独验证就可以精确的切割 H0与 H1,并寻找可
能的非原假说[32] . “冬季到来,田鼠大规模死亡”就
是 Krebs的研究中 = 0 时的非原假说.Krebs 考虑导
致田鼠大规模死亡的非原假说越多,并进行相应的
试验,找到引发田鼠大规模死亡的原因的可能性就
越大.
6 结论与讨论
根据 Platt 的假说⁃演绎模式, Quinn 和 Dun⁃
ham[16]主张生态学试验陷入原假说困境,似乎不存
在可以获得严格验证的假说.通过分析可知,各原假
说困境都可以通过合适的处理得到缓解,生态学的
假说逻辑上似乎经得起较为严格的试验验证.
但在统计学上,Fisher 最初提出原假设的概念
就是为了证伪它的.任何一个具体的原假设被严谨
地提出时,就被认为极有可能是错的.就这个意义而
言,只有备假设才是有待证实的假设.之所以要针对
原假设进行验证,本意是为了通过获得的数据与原
假设进行比对,以概率的形式表达两者不相符的程
度.就统计学原理而言,整个验证过程都是试图推翻
原假设的过程,原假设自始至终处于被证伪的状态,
如果原假设还存在,仅仅是因为还没有获得证伪的
足够数据.因此,通过原假说显著性验证(NHST)来
验证生态学假说并不是一个严格的方法,只能说通
过现有的验证,某假说还未被证伪.
进一步地,NHST 作为确保统计结论不被抽样
误差影响的处理方法,本意是用于抽样合理性的逻
辑论证,并不是用于假说本身的逻辑论证.统计学的
NHST和生态学假说验证,前者是统计假说,后者是
研究假说,不能把统计假说研究的概率大小问题来
直接等同 /替换研究假说的命题真伪问题,即 NHST
6302 应 用 生 态 学 报 27卷
的概率逻辑不能作为证明逻辑用来研究生态学中的
因果关系假说.采用 NHST 进行统计假说验证的前
提是生态学假说(研究假说)的逻辑成立.否则,用统
计假说验证替代研究假说验证可能存在方法误用的
风险.所以,假说验证的逻辑并不能直接套用到因果
论证的逻辑中去.生态学假说的验证应该依靠试验
设计的严密性而非统计方法进行保障.由此,Quinn
和 Dunham[16]以原假说验证作为质疑生态学假说验
证可能性的逻辑本身就不成立.这导致了前文围绕
NHST所展开的论述也失去了逻辑前提.现有大量基
于 NHST的生态学假说的方法研究和试验验证的结
果与结论都变得不可能绝对的逻辑可靠.但本文仅
希望对生态学假说的验证方法研究向前推动一小
步,应该如何才能获得绝对严格的逻辑可靠的方法
将另文讨论.
参考文献
[1] Li G (李 刚), Wang L⁃J (王丽娟), Li Y⁃J (李玉
洁), et al. Effects of different vegetation restoration pat⁃
terns on the diversity of soil nitrogen⁃fixing microbes in
Hulunbeier sandy land, Inner Mongolia of North China.
Chinese Journal of Applied Ecology (应用生态学报),
2013, 24(6): 1639-1646 (in Chinese)
[2] Sun J⁃W (孙金伟), Yuan F⁃H (袁凤辉), Guan D⁃X
(关德新), et al. Dark respiration of terrestrial vegeta⁃
tions: A review. Chinese Journal of Applied Ecology (应
用生态学报), 2013, 24 (6): 1739- 1746 ( in Chi⁃
nese)
[3] Wang D⁃S (王大尚), Zheng H (郑 华), Ouyang Z⁃
Y (欧阳志云). Ecosystem services supply and con⁃
sumption and their relationships with human well⁃being.
Chinese Journal of Applied Ecology (应用生态学报),
2013, 24(6): 1747-1753 (in Chinese)
[4] Roughgarden J. Is there a general theory of community
ecology? Biology and Philosophy, 2009, 24: 521-529
[5] Jaeschke A, Bittner T, Jentsch A, et al. The last dec⁃
ade in ecological climate change impact research: Where
are we now? Naturwissenschaften, 2014, 101: 1-9
[6] Sax F, Stachowicz J, Brown H, et al. Ecological and
evolutionary insights from species invasions. Trends in
Ecology and Evolution, 2007, 22: 445-470
[7] Brooker R, Maestre T, Callaway RM, et al. Facilitation
in plant communities: The past, the present, and the
future. Journal of Ecology, 2008, 96: 18-34
[8] Fraser L, Henry H, Carlyle C, et al. Coordinated dis⁃
tributed experiments: An emerging tool for testing global
hypotheses in ecology and environmental science. Fron⁃
tiers in Ecology and the Environment, 2013, 11: 147-
155
[9] Scheiner S, Gurevitch J. Trans: Mou F⁃Z (牟傅主).
Design and Analysis of Ecological Experiment. 2nd Ed.
Beijing: Higher Education Press, 2000 (in Chinese)
[10] Fridley J, Stachowicz J, Naeem S, et al. The invasion
paradox: Reconciling pattern and process in species in⁃
vasions. Ecology, 2007, 88: 3-17
[11] Shrader⁃Frechette K, Mccoy D. Applied ecology and the
logic of case studies. Philosophy of Science, 1994, 61:
228-249
[12] Zhong X⁃B (仲晓波). Logical connection between null
hypothesis test and meta⁃analysis. Psychology Science
(心理科学), 2010, 33(6): 1477-1480 (in Chinese)
[13] Ellison M. An introduction to bayesian inference for eco⁃
logical research and environmental decision⁃making.
Ecological Applications, 1996, 6: 1036-1046
[14] Sexton P, McIntyre J, Angert L, et al. Evolution and
ecology of species range limits. Annual Review of Ecolo⁃
gy, Evolution, and Systematics, 2009, 40: 415-36
[15] Williams L, Auge H, Maron L. Testing hypotheses for
exotic plant success: Parallel experiments in the native
and introduced ranges. Ecology, 2010, 91: 1355-1366
[16] Quinn F, Dunham E. On hypothesis testing in ecology
and evolution. American Naturalist, 1983, 122: 602 -
617
[17] Keller D, Golley F. The Philosophy of Ecology from Sci⁃
ence to Synthesis. Athens: University of Georgia Press,
2000
[18] Simberloff D. A succession of paradigms in ecology: Es⁃
sentialism to materialism and probabilism. Synthese,
1980, 43: 3-39
[19] Wei H⁃Y (卫海英). Thinking to null hypothesis’ s
building correctly. Statistics and Forecasting (统计与预
测), 2001(3): 29-31 (in Chinese)
[20] Lv X⁃K (吕小康). Differences between fisher & ney⁃
man⁃pearson and argument of hypothesis test in psycho⁃
logical statistic. Psychological Science (心理科学),
2012, 35(6): 1502-1506 (in Chinese)
[21] Yang S⁃H (杨少华), Tang L⁃T (杨林涛). Exchange
problems of null and alternative hypothesis in parameter
hypothesis test. Statistics and Decision (统计与决策),
2009(5): 148-149 (in Chinese)
[22] Sun G⁃N (孙根年), Li J⁃C (李婧超). Method of hy⁃
pothesis test in ecological environment study. Higher
Education of Sciences (高等理科教育), 2009(5): 152-
155 (in Chinese)
[23] Wu Y (吴 艳), Wen Z⁃L (温忠麟). Statistical
analysis process which relates to null hypothesis test. Psy⁃
chological Science (心理科学), 2011, 34(1): 230-234
(in Chinese)
[24] Song Z⁃X (宋子兴). Discussion of null and alternative
hypothesis in ‘ hypothesis test ’ . Journal of Binzhou
Teachers College (滨州师专学报), 2002, 18(4): 32-
34 (in Chinese)
[25] Chen G⁃R (陈光蓉).About selection of null hypothesis
in parameter hypothesis test. Journal of Chongqing Insti⁃
tute of Technology (重庆工学院学报), 2006, 20(5):
122-125 (in Chinese)
[26] Hu J⁃H (胡菊华). Problems of selection of null hypothe⁃
sis in hypothesis test. College Mathematics (大学数学),
2013, 29(5): 140-143 (in Chinese)
73026期 李 际: 生态学假说试验验证的原假说困境
[27] Wang J (王 健), Sun D⁃N (孙丹娜). Problem of se⁃
lection of null hypothesis in hypothesis test. Journal of
Shandong University of Science and Technology (Natural
Science) (山东理工大学学报:自然科学版), 2005,
19(3): 89-91 (in Chinese)
[28] Wang J (王 静), Shi J⁃Z (史济洲). Dialectical
analysis in building of null hypothesis. Study of Statistics
(统计研究), 2010, 27(6): 95-99 (in Chinese)
[29] Zhang Y⁃H (张玉环). Building of null and alternative
hypothesis in hypothesis test. College Mathematics (大
学数学), 2012, 28(2): 117-120 (in Chinese)
[30] Zhang J⁃J (张军舰), Li H⁃F (李海锋). Nature of ap⁃
proaching of non⁃parameter likelihood ratio test with
complex null hypothesis. Journal of Guangxi Normal
University (Natural Science) (广西师范大学学报:自
然科学版), 2009, 27(1): 36-39 (in Chinese)
[31] Zhao G⁃L (赵国龙), Chen H⁃T (陈洪涛). Method of
non⁃null⁃hypothesis non⁃center and its application. Chi⁃
nese Journal of Health Statistics (中国卫生统计),
2004(8): 251-218 (in Chinese)
[32] Sun A⁃M (孙爱民), Yang H⁃Y (杨荟玉), Chen H⁃W
(程豪为). Synthesis approaching normal method with
non⁃null hypothesis. Journal of Mathematical Medicine
(数理医药学杂志), 2012(2): 137 - 140 ( in Chi⁃
nese)
作者简介 李 际,男,1976年出生,博士, 中国科学院大学
在站博士后. 主要从事生态学哲学、原理与方法研究.
E⁃mail: liji@ ucas.ac.cn
责任编辑 肖 红
李际. 生态学假说试验验证的原假说困境. 应用生态学报, 2016, 27(6): 2031-2038
LI J. Dilemma of null hypothesis in ecological hypothesis’s experiment test. Chinese Journal of Applied Ecology, 2016, 27(6): 2031-
2038 (in Chinese)
8302 应 用 生 态 学 报 27卷