免费文献传递   相关文献

Test and improvement of model reliability for predicting insecticide residue

农药残留预测模型可靠性的检验与改良



全 文 :农药残留预测模型可靠性的检验与改良*
王玉杰* *  张大克  (吉林农业大学基础科学系,长春 130118)
摘要  对农药残留预测模型可靠性问题进行了分析.根据矩阵的条件数理论,提供了检验预测模型可靠性的
方法, 基于岭回归和广义岭回归估计理论,建立了对不可靠预测模型改良的方法. 最后通过氰戊菊酯在甘篮上
的残留动态预测, 对所建改良方法进行了检验,结果表明,预测模型的精度得到了大幅度提高.
关键词  农药残留预测模型  可靠性  检验方法  改良方法
Test and improvement of model reliability for predicting insecticide residue. Wang Yujie and Zhang Dake ( Depar t
ment of Basic Science, Jilin Agr icultural University , Changchun 130118) . Chin. J . A pp l . Ecol . , 1999, 10( 5) : 599
~ 602.
According to the theory of condition number of matrix , this paper provided a method for testing the r eliability o f pre
dicting model, and on the basis of ridg e regression theory , the method for improving unreliable predicting model was
built, w hich was tested by predicting the residue dynamics of fenvalerate in cabbages. The results showed the pr ecision
of predicting model w as increased by a big range.
Key words  Model for predicting insect icide residue, Reliability, T esting method, Improvement method.
  * 吉林省科委资助项目( 951196) .
  * * 通讯联系人.
  1997- 10- 10收稿, 1997- 12- 10接受.
1  引   言
随着各种各样进口农药和国产农药的广泛使用,
农药在土壤、植株上的残留已给农业生态环境造成了
严重影响,尤其是那些长时期高浓度残留的农药已严
重地破坏了植物生长的生态平衡. 因此,建立起各种农
药残留预测模型,对农药在土壤、植株上的残留动态作
出准确的预测, 禁止那些对农业生态环境有严重影响
农药的进口和生产, 减轻残留农药对农业生态环境的
影响,是一个非常值得研究的问题.本文从这一目的出
发,为保证所建农药残留预测模型的可靠性, 构建了对
农药残留预测模型的可靠性进行检验和改良的方法,
供人们参考和使用.
2  农药残留预测模型的可靠性
  根据试验观测结果, 运用回归分析的统计方法建
立各种各样的农药残留预测模型, 对农药在土壤、植株
上的残留动态进行预测[ 1, 4] , 是目前人们进行农药残
留动态研究的主要手段. 而建立农药残留预测模型,其
主要参数估计手段是最小二乘法, 根据参数估计的可
靠性理论,在运用最小二乘法对预测模型中的参数进
行估计时,常常由于模型中变量的观测值之间存在着
多重共线性, 而使最小二乘估计变劣[ 5, 10] . 变劣的最
小二乘估计,其估计结果是不稳定的, 甚至是错误的,
因此在变劣的最小二乘估计下建立的预测模型是不可
靠的,失去了对农药残留动态进行预测的价值.并且这
种预测模型的不可靠性通过模型回归效果的显著性检
验是检验不出来的, 这就给农药残留动态的预测带来
了更大的危害. 因此,在依据试验观测结果建立农药残
留预测模型时, 必须对预测模型的可靠性进行检验,以
保证预测模型的预测价值.
3  预测模型的可靠性检验
  对农药残留预测模型的可靠性进行检验,就是对
参数估计过程中的最小二乘估计的优劣性进行检验.
设根据试验观测结果的散点图所确定的预测函数模型
可线性化为!
y= b0+ b1 x (1)
根据最小二乘法原理,模型(1)中未知参数 b0 和 b1 的
估计值 b^ 0 和 b^1 应为正规方程组[ 7]
n ∀n
i= 1
x i
∀n
i= 1
x i ∀n
i= 1
x
2
i
b^0
b^1
=
∀n
i = 1
y i
∀n
i = 1
x iy i
(2)
的解.在方程组(2)中 x i 和y i依次为模型(1)中变量 x
和 y 的试验观测值, i= 1, 2, #, n; n 为试验观测的次
数.这就是运用最小二乘法原理对预测模型( 1)中的未
知参数 b0 和 b1 进行估计的过程, 在这一估计过程中
其最小二乘估计是优还是劣,可根据矩阵的条件数理
论用下述方法进行检验[ 2] .
应 用 生 态 学 报  1999 年 10 月  第 10 卷  第 5 期                                
CH INESE JOURNAL OF APPLIED ECOLOGY , Oct. 1999, 10( 5)!599~ 602
  用 A 表示方程组(2)的系数矩阵,即
A =
n ∀n
i= 1
x i
∀n
i= 1
x i ∀n
i= 1
x
2
i
若系数矩阵 A 的条件数 cond ( A )远远大于 1, 则模型
(1)参数估计过程中的最小二乘估计是劣的, 此时所建
的预测模型是不可靠的, 不具有预测的价值; 若系数矩
阵 A 的条件数 cond ( A )接近于 1, 则模型(1)参数估计
过程中的最小二乘估计是优的, 此时若所建预测模型
的回归效果是显著的,则该预测模型是可靠的,可作为
对农药残留动态进行预测和分析的依据.
方程组(2)的系数矩阵 A 的条件数 cond ( A )可采
用下述两种方法来确定.
(1) cond ( A ) ∃ = %A % ∃ &%A - 1 % ∃ .符号%&% ∃
表示矩阵的行范数,如设 B= ( bij ) m ∋ n, 则 % B % ∃ =
max
i
{ ∀n
j = 1
| bij | }
(2) cond ( A ) 2= %A %2&%A - 1 %2=
  max( A TA )min( A TA ) . 其中 max( A
T
A )和 min ( A TA )依
次为矩阵 A TA 的最大特征值和最小特征值; 符号
%&%2表示矩阵的谱范数.
若矩阵 A 为对称矩阵,则
cond( A ) = % A %2& % A - 1 %2= | 1|| 2| . 其中, 1
和 2 依次为矩阵 A 按模最大和最小的特征值.
4  不可靠预测模型的改良
若经检验所建预测模型是不可靠的, 参数估计过
程中的最小二乘估计已经变劣, 此时可采用岭回归估
计和广义岭回归估计两种方法[ 3, 8, 9] ,对不可靠的预测
模型进行改良, 以保证所建预测模型的可靠性.
4. 1  运用岭回归估计进行改良
根据岭回归估计的基本思想和方法, 运用岭回归
估计对参数估计结果进行改良,就是用方程组
n+ k ∀n
i= 1
x i
∀n
i= 1
x i ∀n
i = 1
x
2
i+ k
b^ 0
b^ 1
=
∀n
i = 1
y i
∀n
i = 1
x iy i
(3)
重新估计模型(1)中的未知参数 b 0和 b 1, 其中 x i 和yi
依次为模型(1)中变量 x 和 y 的试验观测值, i = 1, 2,
#, n ; n 为试验观测的次数. 选择适当的 k 值使其估
计结果比最小二乘估计有更小的残差平方和 Q ,有更
大的相关系数 R ,使原参数估计结果得到改良.
4. 2  方程组(3)中 k 值的确定
由方程组( 3)确定出参数 b 0和 b 1的估计值,此估
计值中含有参数 k, 记此时 b0 和 b1 的估计值依次为
b^ 0( k )和 b^1( k ) . 由式(1) b^ 0 ( k )、bi
^
( k )建立回归残差
平方和计算公式[ 6] :
Q( k )= ∀n
i= 1
[ y i- ( b^ 0( k )+ b^ 1( k ) x i ) ]
2
(4)
用无约束最优化方法确定出使 Q ( k )取最小值的 k,
此 k 值即为所要确定的方程组(3)中 k 的取值.将此 k
值代入 b^ 0( k )和 b^ 1( k)中,即得到改良后参数 b0 和 b 1
的估计值,而此时的 Q ( k )值即为改良后模型的回归
残差平方和.
4. 3  运用广义岭回归估计进行改良
根据广义岭回归估计的基本思想和方法,运用广
义岭回归估计对参数估计结果进行改良,用方程组
n+ k1 ∀n
i = 1
x i
∀n
i= 1
x i ∀n
i= 1
x
2
i+ k 2
b^ 0
b^ 1
=
∀n
i= 1
yi
∀n
i= 1
x iy i
(5)
对模型(1)中的未知参数 b 0和 b 1进行重新估计,其中
x i 和 yi 依次为模型(1)中变量 x 和 y 的试验观测值, i
= 1, 2, #, n; n 为试验观测的次数.选择适当的 k1 和
k 2值使它的估计结果比最小二乘估计有更小的残差
平方和 Q, 有更大的相关系数 R ,使原参数估计结果
得到改良.
4. 4方程组( 5)中 k 1和 k 2值的确定
由方程组( 5)确定出参数 b 0和 b 1的估计值,此估
计值中含有参数 k1 和 k 2, 记此时 b 0 和 b1 的估计值
依次为 b^ 0 ( k 1, k2 )和 b^ 1 ( k 1, k2 ) . 由式( 1)和 b^0 ( k1,
k 2)、^b 1( k 1, k2)建立回归残差平方和计算公式:
Q( k 1, k 2)= ∀n
i= 1
[ yi - ( b^ 0( k1, k 2)+ b^1( k 1, k 2) x i ) ]
2
(6)
用无约束最优化方法确定出使 Q ( k 1, k2)取最小值的
k 1 和 k2, 此 k 1 和 k2 值即为所要确定的方程组( 5)中
k 1和 k 2 的取值. 将 k 1 和 k 2 值代入 b^0 ( k1, k2)和 b^1
( k 1, k2)中,即可以得到改良后参数 b0和 b1 的估计值,
而此时的 Q( k1, k2)值即为改良后模型的回归残差平方
和.
45  改良方法的有关问题
改良参数估计方程组(3)和(5)中变量 x 的观测
值 x i ( i= 1, 2, #, n) , 可以是原始观测值,也可以是中
心标准化变换后的数值. 根据经验, 对 x i ( i = 1, 2, #
n)采用上述两种不同的取值进行参数估计, 其改良效
600 应  用  生  态  学  报                    10卷
果不是同的,不一定哪种改良效果更好. 因此,应对 x i
的两种不同取值的改良效果进行比较, 选最好的.
若对变量 x 的观测值 x i ( i= 1, 2, #, n)进行中心
标准化变换,其变换公式为:
x i(= ( x i- x ) / S   i= 1, 2, #, n (7)
其中  x = 1
n
∀n
i= 1
x i , S =
1
n - 1 ∀
n
i= 1
( x i- x ) 2
x i 为原始观测值, x i(为变换后数值.
若方程组( 3)和(5)中的 x i ( i= 1, 2, #, n)为中心
标准化变换后的数值, 则相应的预测模型 (1)应更改
为: y= b 0+ b 1( x- x ) / S (8)
同时式(4)和式(6)中的 x i 也应为中心标准化变换后
的数值.
根据岭回归估计理论,在最小二乘估计变劣的情
况下,无论岭回归估计还是广义岭回归估计都可使参
数估计结果或多或少地得到改良. 一般情况下,广义岭
回归估计的改良效果要优于岭回归估计. 但广义岭回
归估计中 k1 和 k2 值的确定要较困难些, 因为它们的
确定属于二元优化问题, 其优化方法要较一元优化问
题计算复杂.
在岭回归估计和广义岭回归估计中, 要求 k、k1、
k 2 的取值均大于零, 但据我们的经验,有时当 k、k1、
k 2 取负值时,可使参数估计的改良效果变得更好.
5  应用实例
氰戊菊酯在甘蓝上的残留动态实测数据见表 1,
根据表 1中观测值绘制的散点图, 我们采用指数函数
模型:
P= AeBt (9)
对氰戊菊酯在甘蓝上的残留动态进行数学模拟,建立
其残留量预测模型. 在模型(9)中 A 和B 为待估参数,
t 为用药后时间(d) , P 为氰戊菊酯在甘蓝上的残留量
( g&g - 1) .
模型(9)线性化为:
ln P= lnA+ Bt ( 10)表 1  氰戊菊酯在甘蓝上的残留动态观测值
Table 1 Observed values for residual dynamic of fenvalerate on cabbage
时间 T im e t ( d)
12 15 18 23 28 36 46 56
残留 P 1. 0848 0. 7382 0. 4339 0. 2451 0. 2245 0. 1003 0. 0645 0. 0393
Residual quant ity P(g&g- 1)
51  运用最小二乘法进行参数估计
记表 1中变量 t 和P 的观测值依次为 t i和P i , i=
1, 2, #, 8. 根据模型( 10)和模型( 1)之间的关系,在方
程组( 2)中取 x i= t i , y i= ln p i , n = 8,并将表 1中变量
t和P 的观测值代入方程组( 2)得对模型( 9)中的未知
参数 A 和B 进行最小二乘估计的方程组:
  8 234
234 8554
lnA
B
=
- 12. 234266
- 482. 895104
( 11)
解方程组( 11)对模型( 9)中的未知参数 A 和B 进行估
计,建立起氰戊菊酯在甘蓝上残留动态的预测模型:
P= 1. 840860e- 0. 07314584t ( 12)
对预测模型( 12)的回归效果进行显著性检验)6∗,
计算出检验 F 值 F = 37874814 > F001 ( 1, 6 ) =
1375, 残差平方和 Q = 0. 13165, 相关系数 R =
0. 92911, 回归效果极显著.
从上述参数估计的过程和模型( 12)回归效果的显
著性检验结果来看, 预测模型( 12)是可靠的. 若用 H
表示方程组( 11)的系数矩阵, 即 H= 8 234
234 8554
,经
计算方程组 ( 11)系数矩阵 H 的条件数 cond( H ) ∃ =
5647041825, 远远大于 1. 这说明上述参数估计过程
的最小二乘估计是劣的, 预测模型( 12)不可靠.
52  运用岭回归估计进行改良
根据本文 41和 42中方法, 记表 1 中变量 t 和
P 的观测值依次为 ti 和 p i , i= 1, 2, #, 8,在方程组( 3)
中取 x i= ti , y i= lnp i , n = 8, 并将表 1中数据代入方
程组( 3)得对模型(9)中未知参数 A 和B 进行重新估
计的岭回归估计方程组:
8+ k 234
234 8554+ k
lnA
B
=
- 12. 234266
- 482. 895104
( 13)
通过优化确定取 k= - 0. 57928对参数 A 和B 进行重
新估计, 估计结果为: ( A , B ) T = ( 260713161, -
0. 08267169) T , 相应的预测模型为:
p = 2. 60713161e- 0. 08267169t ( 14)
该模型回归效果检验 F 值 F= 88. 12590906> F001
(1, 6) = 1375, 残差平方和 Q = 006136588, 相关系
数 R = 0. 967603015,由此可见模型( 14)已相对模型
( 12)得到了改良.
53  运用广义岭回归估计进行改良
记表 1中变量 t和 p 的观测值依次为 t i 和p i , i=
1, 2, #, 8.根据本文 45中方法,对表 1中 t 变量的观
测值 ti 进行中心标准化变换,并记变换后的数值为 t i(
( i = 1, 2, #, 8) . 根据本文 43和 44中方法,在方程
组( 5)中取 x i = t i(, yi = lnp i , n = 8, 并将表 1中数据
6015 期                王玉杰等:农药残留预测模型可靠性的检验与改良       
代入方程组( 5)得对模型( 9)中未知参数 A 和 B 进行
重新估计的广义岭回归估计方程组:
 8+ ki     - 3. 576279 ∋ 10
- 7
- 3. 576279 ∋ 10- 7 7+ k 2
ln A
B
  = - 12. 23426606
- 8. 00153354
( 15)
通过优化确定取 kj = - 2. 1259, k 2= - 28801对参数
A 和 B 进行重新估计, 估计结果为 ( A , B ) T =
( 01245874, - 1. 942167) T ,相应的预测模型为:
P= 0. 1245874e- 1. 942167( t- 29. 25) / 15. 62736
可转化为预测模型: p = 4. 72297909e- 0. 12427992t ( 16)
该模型回归效果的检验 F 值F= 312. 4626357> F0. 01
(1, 6) = 1375, 残差平方和 Q = 001813751, 相关系
数 R = 09905350, 由此可见模型 ( 16) 已相对模型
(12)得到了大幅度的改良,并且其改良效果优于模型
(14) . 模型(12)、(14)和( 16)改良效果的检验 F 值、残
差平方和 Q 和相关系数 R 的比较见表 2.
表 2  模型改良效果的比较
Table 2 Comparison of improvement effect of model
模型
Model
F值
F value
残差平方和
RSS
相关系数
R
( 12) 37. 874814 0. 13165 0. 929111
( 14) 88. 125909 0. 06137 0. 967603
( 16) 312. 462636 0. 01814 0. 990535
6  结   论
61  对农药残留预测模型的可靠性进行分析和检验
是非常必要的, 这样可避免那些不可靠的预测模型给
农药残留预测带来的危害.更好地保护人类的生态环
境.
62  应用结果表明,本文所提供的可靠性检验方法是
可行的,运用岭回归估计和广义岭回归估计对农药残
留预测模型的可靠性进行改良是有效的, 并且广义岭
回归估计的改良效果要优于岭回归估计.
参考文献
1  马庆立、戚澄九. 1989. 数学模式在农业环境保护中的应用 + + + 土
壤中农药降解的定量预测.国外农业环保, 6(4) : 18~ 22.
2  方保容. 1993.矩阵论基础.南京:河海大学出版社. 220~ 238.
3  陈希孺、王松桂. 1987.近代回归分析.合肥:安徽教育出版社. 226
~ 256.
4  胡庆永、朱  建、李庆孝. 1988.农药残留动态的计算机预测初探.
农业环境保护, 7( 2) : 16~ 18.
5  夏结来、郭祖超、胡  琳. 1988. 回归系数的根方有偏估计及其应
用.数理统计与应用概率, 3( 1) : 21~ 30.
6  裴鑫德. 1991.多元统计分析及其应用. 北京: 北京农业大学出版
社. 465~ 469.
7  蔡贤如. 1993.概率论及其应用.沈阳:辽宁科学技术出版社. 166~
179.
8  Hoerl, A . E. and Kennard, R. W. 1970. Ridge regression: biased esti
mat ion for nonorthogonal problems. Technometr ics, 12: 55~ 68.
9  Hoerl, A. E. and Kennard, R. W . 1970. Ridge regression: applicat ion
for nonorthogonal problems. Technometri cs, 12: 69~ 73.
10  Mullet , G . M . 1976. Why regression coef ficients have the w rong sign .
J . Qual ity Techn . , 8: 121~ 126.
作者简介  王玉杰,女, 37 岁,硕士, 副教授,主要从事生物数学
理论研究,已发表学术论文 36 篇. Email: dkw ang@ 990. net
602 应  用  生  态  学  报                    10卷