全 文 :园 艺 学 报 2014,41(12):2531–2534 http: // www. ahs. ac. cn
Acta Horticulturae Sinica E-mail: yuanyixuebao@126.com
收稿日期:2014–10–25;修回日期:2014–12–08
基金项目:中国科协精品科技期刊工程项目
* E-mail:zhaohua01@caas.cn
关于论文来稿中试验重复与数据分析等问题的
探讨
赵 华*,韩 旭,姚 蔚,陈 洁,杜 敏,刘丽丽,王 燕
(中国农业科学院蔬菜花卉研究所,中国园艺学会《园艺学报》编辑部,北京 100081)
摘 要:在《园艺学报》论文来稿中时常发现在试验过程中和数据分析方面存在一些问题,包括试
验重复取样不合理、对照数据测定不全、不重视实物照片证据的取得、未能及时验证异常数据、数据分
析中未考虑统计差异显著性及结果分析不深入或结论片面等问题。对这些问题进行了分析讨论,并提出
一些改进建议。
关键词:科技论文;生物学重复;数据分析;差异显著性
中图分类号:S 6;N 3 文献标志码:A 文章编号:0513-353X(2014)12-2531-04
Discussion on Some Problems of Experimental Operation and Data
Analysis in Manuscripts
ZHAO Hua*,HAN Xu,YAO Wei,CHEN Jie,DU Min,LIU Li-li,and WANG Yan
(Editorial Office of Acta Horticulturae Sinica,Chinese Society of Horticultural Science,Institute of Vegetables and
Flowers,Chinese Academy of Agricultural Sciences,Beijing 100081,China)
Abstract:In this paper some problems of experimental operation and data analysis in manuscripts
submitted to Acta Horticulturae Sinica are discussed. Such as incorrect mixed sampling,incomplete test
data of control,lack of physical evidence photos,abnormal test data without the timely verification,
unconsidering statistical significant difference,not in-depth result analysis and partial conclusion and so on.
Some suggestions for improvement are also provided.
Key words:scientific paper;biological replicates;data analysis;significance of difference
《园艺学报》每年都收到超过 1 000 篇论文来稿(赵华 等,2012),在对这些来稿进行审阅和
编辑加工过程中时常发现一些具有共性的需要注意的问题。前文就研究选题与试验设计问题进行了
探讨(赵华 等,2010),本文就试验过程中以及数据分析方面几个较为突出的问题进行分析讨论,
以供作者参考。
1 试验重复与取样问题
在有些论文来稿中发现,试验中正确地设置了若干次处理重复(生物学重复),但在取样操作
2532 园 艺 学 报 41 卷
图 1 对照数据不全的示意图
中却将几次重复的样品混合在一起,然后做若干次重复测定(技术重复)。
例如有的稿件中写道:“设 3 个处理,每个处理 6 株(单株重复)。……分两个时期取样,每次
各处理均取 3 株,分根、茎、叶解析后,混合取样。”
还有的写道:“每个对照和遮光处理均设置 3 个重复,……取样时 3 个重复混合,测定×××,重
复测定 3 次。”
又如,“采用盆栽方法做 4 个处理,3 次重复,……分别取样提取 DNA,然后将每处理 DNA 混
匀,做 3 次定量 PCR。”
上述这种“混合取样”、“重复测定”的做法是错误的。
生物学研究中通常要求有生物学重复。所谓生物学重复是指在同一试验处理中用相互独立的生
物样本进行若干次重复。设置重复的主要目的是为了降低试验误差,提高试验结果的准确性,同时
又是为了估计试验误差(南京农学院,1979)。因为某一处理单一重复所得的数据易受试验材料个体
差异或试验条件偶然变化的影响,通过多次重复所得到的数据比单个重复得到的更为可靠;另一方
面试验误差是客观存在的,而试验误差只能由同一处理的几次重复间的差异进行估算。如果将几次
重复的样品混合在一起,就使得同一个处理只有一个样品数值,无从求得差异,也就无法估计误差
和判断结果的准确性。
另一方面,将几次生物学重复的样品混合在一起,做几次平行测定,以此结果作为重复数据进
行统计分析的做法也是错误的,这样的重复不是生物学重复,而是技术重复。所谓技术重复是指在
对同一个生物样本的某一项指标测定时,进行若干次重复。通过技术重复只能分析测定过程中操作
或仪器的误差,而无法说明试验过程中各处理间的误差,也就无法说明处理效果的可靠性。
2 对照数据测定不全问题
对照数据测定不全的例子并不鲜见,往往是设置了对照,但只是测定了最初始时的对照数据,
之后则只测定处理的变化,将其与最初的对照数据相比较。这样做实际违背了设置对照的用意。
例如有的来稿中写道:“选择长势一致的幼苗,分别喷施×××、×××和×××,以清水为对照,每
处理 3 个小区(3 次重复),……处理后 0、1、
2、4、6、12 和 24 d 采集叶片,液氮中速冻后
保存于–80 ℃备用于分析。”
上述试验中设置了对照,但遗憾的是,试
验结果中的对照数据不全,只有未处理起始的
数据,而缺少其他取样时间同期的对照数据(图
1 为示意图)。这样的对照形同虚设,丧失了设
置对照的意义。因为随着时间的变化,对照植
株的生长状态和内在代谢不会只停留在最初始
的水平,有时还受处理期间一些其它因素如昼夜温度和光照等影响,因此需要对于各处理结果参照
同期对照的数据加以分析。
3 未能取得充分实物照片证据问题
从有些来稿中看到,为了说明某种处理的效果,列举了诸多的生理生化指标,但缺少反映实物
状态的照片,让人看不到直观的证据。
12 期 赵 华等:关于论文来稿中试验重复与数据分析等问题的探讨 2533
图 3 个别数据异常的示意图
图 2 数据高低变化较大的示意图
例如,描述某处理对果实颜色变化的影响,用色差计测定了明度 L*,红绿色品指数 a*,黄蓝色
品指数 b*,色饱和度 C*,色调角 H°等一系列指标,各处理数据曲线互相交错,差异和规律性不够
直观。如果用实物照片反映处理效果或差异,则说服力增强。
又如,研究切花保鲜处理的效果,只注意取得了许多生理指标数据,却没有留下实际效果的照
片,显得证据不足,造成缺憾。
再如,在某些授粉受精过程及种子发育、果实发育相关研究论文中,有的照片不清楚。细胞学
观察的结论完全靠图片证明,重要的细胞学现象均应在图片中用箭头或符号标出,且位置要准确,
图片不清晰,则没有证据支持结论。这些缺陷常常导致论文来稿难以录用。
4 未能及时验证异常数据问题
如图 2 所示,试验数据高低起伏变化很大且从专业角度难以判断其规律或作出合理解释的情
况,在来稿中时有见到。
例如,“……酶活性的变化呈升高—降
低—再升高—再降低的变化趋势,……”。
这样的变化到底是客观情况的真实反映,
如日周期变化,还是由于试验数据量太少,或
试验条件控制得不好(试验误差),或指标测定
中存在的系统误差造成的,较难断定,应该重
复试验,对数据变化动态曲线加以验证。
又如,“测定果实颜色的变化,代表色彩
鲜艳度的饱和度如图 3 所示,……”。
从图 3 看到,几个处理的数据基本呈逐渐
升高的趋势,说明果色的饱和度越来越高,即
越来越鲜艳,但其中一个处理一个时间点的数
值变化剧烈,这应该引起注意。按一般自然规
律,果实的色彩不大可能在短时间内由鲜艳变
得灰暗而后又变得鲜艳,是否由于取样误差所
致,值得探究。对于这样的异常数据,应该尽
快查找原因,重复取样,再次测定后加以确认。
对于数据的整理分析应该从试验之初即开始,并贯穿整个试验过程之中,数据测定与数据分析
不能脱节,不能等到所有试验测定完成之后再对数据进行整理,要及时记录、整理、分析,发现问
题时及时补充试验,修正操作错误,保证数据的真实可靠性。
5 数据分析未考虑差异显著性问题
在对试验数据进行比较分析时,不能仅凭直观的数据差异就作出结论,而要进行统计学分析,
对数据进行差异显著性检验,数据差异达到显著水平时(一般定为 P ≤ 0.05 或 P ≤ 0.01)可以认为
处理间数据差异真实存在,即试验处理有效,否则可认为这种差异是由误差引起的。
但是在论文来稿中时常发现,试验结论缺少数据统计分析的支持,或者即使进行了统计分析,
但在描述试验结果时却没有考虑其差异显著性,或者没有正确地依据差异显著性作出相应结论。
2534 园 艺 学 报 41 卷
图 4 数据差异显著性的示意图
例如有一篇来稿中写到:“株高在较低浓度药剂处理下增加,而随着处理浓度的增加而下降,
说明低浓度药剂能促进生长,高浓度抑制生长;株高在不同浓度处理之间差异不显著。”
这样的描述是不科学的,是自相矛盾的,既然“差异不显著”,就不能确认“低浓度药剂能促
进生长,高浓度抑制生长”。
又如一篇稿件中对图 4 的数据分析道:“几
个处理中以处理Ⅳ的根系表面积最大,分别比
处理Ⅰ、Ⅱ和Ⅲ大 10.9%、5.89%和 20.06%。”
但从图 4 看,处理Ⅳ与Ⅱ和Ⅲ的差异未达
到显著水平,所以上述结论不妥。
还有的稿件中写道:“在叶片中,A、B 基
因表达量与玉米黄质含量之间,C 基因与类胡
萝卜素含量之间呈正相关外,其它基因与类胡
萝卜素含量之间均呈负相关,其中 A 与玉米黄
质之间达到显著水平”。
这样的结论也是不恰当的,因为显著和不显著描述的是相关关系是否存在,也就是说未达到显
著水平的不能确定存在相关关系。
另一方面应当说明的是,“差异不显著”是指统计学意义上的“不显著”,并不代表试验处理间
一定没有差异,有可能本质上的差异或被试验误差所掩盖,这就需要通过减少试验误差或增加样本
含量(重复)来求证。但是论文中不可在没有统计分析作依据的情况下主观作出结论,或作出与统
计分析结果不相符的结论。
6 数据分析片面不深入问题
不少来稿在进行试验结果描述时,只是单纯地叙述处理间数据的差异及其变化,而且面面俱到,
缺乏深入分析,未能很好地总结提炼出规律性的结论。
有的试验结果分析逻辑性不强,有的以点概面,有的结论缺乏直接的数据支持,推测的成分较
多,结论较为牵强。
对试验结果进行分析总结,是获得研究成果的重要环节,应根据研究选题与设计思路按照一定
的逻辑顺序展开,以试验数据为依据,通过客观可靠和全面深入的分析,归纳总结出新的发现或结
论,在此基础上提出新的观点或见解。
References
Nanjing Agricultural University. 1979. Statistics analysis and field experiment. Beijing:China Agriculture Press. (in Chinese)
南京农学院. 1979. 田间试验和统计方法. 北京:农业出版社.
Zhao Hua,Fang Zhi-yuan,Han Xu,Yao Wei,Chen Jie,Wang Yan,Cao Lei,Du Min. 2010. Problems with topic selection and experimental design
in manuscripts submitted to Acta Horticulturae Sinica. Acta Horticulturae Sinica,37 (12):2025–2028. (in Chinese)
赵 华,方智远,韩 旭,姚 蔚,陈 洁,王 燕,曹 蕾,杜 敏. 2010. 从《园艺学报》来稿中看论文选题与试验设计中存在的
问题. 园艺学报,37 (12):2025–2028.
Zhao Hua,Han Xu,Yao Wei,Chen Jie,Du Min,Cui Xin-li,Fang Zhi-yuan,Du Yong-chen. 2012. Development and improvement of Acta
Horticulturae Sinica in nearly 10 years. Acta Horticulturae Sinica,39 (9):1634–1638. (in Chinese)
赵 华,韩 旭,姚 蔚,陈 洁,杜 敏,崔新利,方智远,杜永臣. 2012.《园艺学报》近 10 年来的发展与提高. 园艺学报,39 (9):
1634–1638.