全 文 : 1996—05—08收稿。
葛宏立工程师,项小强,何时珍(林业部华东设计院 浙江金华 321001) ;方陆明(浙江林学院计算中心)。
* 本文为联合国援助项目 CPR/ 91/ 151“建立国家森林资源监测系统”的部分内容。
年龄隐含的生长模型在森林资源
连续清查中的应用*
葛宏立 项小强 何时珍 方陆明
摘要 根据森林资源监测体系的特点,将年龄隐含的生长模型应用于森林资源连续清查。这种
模型不需要年龄, 其误差与预测年限 A 有关,当 A = O 时,误差为零。用 Johnson-Schumacher 模
型作为以年龄为自变量的模型 ,以此模型为基础模型导出的年龄隐含模型为例进行了试验,数据为
浙江省的一类连续清查数据中的1989~1994年的马尾松复位样木数据。计算例子表明, 5 a定期生
长量的总和估计精度在 95%的概率保证下可达 80%以上。文章给出了模型的推导, 模型的性质分
析, 误差及精度估计方法等。这种模型用复位样木建模, 应用方便。可以以省为建模单元,一个树种
(组)建一个模型, 而不区分人工林、天然林, 异龄林、同龄林 ,优势树种、组成树种,林木或散生木。
关键词 生长模型 Johnosn-Schumacher 模型 年龄隐含模型 森林资源连续清查
对于任何模型都应有两个必备条件:建立模型的条件与应用模型的条件。建模的条件是建
什么样的模型,就应有什么样的建模数据, 应用的条件就是对于自变量精度的要求至少不低于
建模时对自变量的精度要求。如果应用时无法提供某些自变量,或是自变量精度不能保证,这
时,宁可应用自变量少,对自变量要求低的较简单的模型。
森林资源监测体系,有其自身的很多特点。其一,它通常不能提供满足年龄显示模型要求
的主要自变量,即年龄。其二,建模应考虑到所有树种(组) ,所有林相。其三,具有复测的成对
数据。其四,定期复查,所以模型预测的年限一般不超过一个复查间隔期, 目前为5 a,属于短期
预测(或更新)。其五, 数据多。一、二两点是不利因素,三、四、五是有利因素。为扬长避短,我
们提出不含年龄的生长模型,即以前期观测值作为自变量。下面称年龄隐含的模型为年龄隐含
模型,以年龄为自变量的模型为年龄模型。
1 模型推导
设 y + = f ( A ) ( 1)
y 可以是直径、材积、树高等因子, A 为年龄, 这是通常的年龄模型的形式。设前期观测值为
( y 1 , A 1 ) ,后期观测值为( y 2 , A 2) , A 2= A 1+ A , 则
y 1 + y
1
= f ( A 1 ) ( 2a)
y2 + y
2
= f ( A 1 + ) ( 2b)
从式( 2a)中解出A 1 , A 1= f - 1( y 1+ y1 ) ,将 A 1代入式( 2b) ,有
林业科学研究 1997, 10( 4) : 420~424
Forest Research
y 2 + y2 = f ( f - 1( y 1 + y 1) + A ) ( 3)
此式即为以前期观测值 y 1为自变量的模型, 它不含实际年龄,我们也可将 A 1= f - 1( y 1+ y
1
)称
为名义年龄( nom inal age)。应用时的形式为:
y 2
∧
= f ( f
- 1
( y 1) + A ) ( 4)
若式( 1)为 Johnson-Schumacher 模型,即:
y + = ae- b/ A ( 5)
则相应地式( 3)为:
y 2 + y
2
= aexp(
- b
A - bln( y 1 + y
1
) - lna
) ( 6)
2 模型的性质
模型( 3)具有以下性质:
模型左边含有误差 y
2
,右边含有误差 y
1
, 即除了因变量 y 2有误差外,自变量 y1 也有误
差。对这种模型,一般不能用普通最小二乘法估计参数,而应用专门的方法, 算法可参考文献
[ 1~3]。
对于预测形式( 4) ,令 = y 2∧ - y2 ,显然, 与 A 有关,当 A 增大时, 的绝对值也增大,
当 A= 0时, ≡0,即误差为零。设 A 0为检验或建模时的间隔期, S ( A 0 )为 的检验或建模
时的标准差, 则预测 A 时, 对其标准差S ( A )可作线性假设
S( A ) = AA 0S( A 0) ( 7)
由于 与 A 有关,所以在建模时, A 应是一个常数,如果不是常数,则在拟合时, 应根据不同
的 A 而给不同的权。
设 n为样地数, mi 为第 i块样地的样木数,若 相互独立,则
Var ( y 2) = miVar( ) ≈ S2( A ) mi ( 8)
即 S 2( A ) mi 可作为总量 y 2的方差,这时, 以 y 2∧作为 y 2的估计值,其误差限为
= uS( A ) mi ( 9)
u为标准正态分布时与概率为 相对应的双侧分位数。
但因模型中没有立地质量, 竞争等指标,所以对样地来说,估计值可能存在系统偏差,对于
立地质量好的来说,估计值可能系统偏低, 对于立地质量差的来说,可能系统偏高。所以,在样
地内, 可能不相互独立,这时, 上面的误差限的算法不一定正确。为此,令 -= y2∧ - y 2 , y 2∧和y 2为
样地的后期的估计值的平均数和观测值的平均数。可以认为, 是相互独立的。令:
S ( A 0) = mi2i / mi ( 10)
S( A ) = AA 0S ( A 0 ) ( 11)
这时, y 2的方差为
Var ( y 2) = Var( miy 2 ) = S2( A ) m2i ( 12)
4214 期 葛宏立等: 年龄隐含的生长模型在森林资源连续清查中的应用
这时,误差限为
= uS ( A ) m2i ( 13)
当 相互独立时, 式( 9)与式( 13)是近似相等的,令 uS ( A ) mi= uS ( A ) m2i
可解得
S ( A ) = S ( A ) mi / m2i ( 14)
当 不相互独立时,式( 14)并不成立, 且总有
S ( A ) > S ( A ) mi / m2i ( 15)
所以,当 不相互独立时,用式( 13)算得的误差限要比用式( 9)算得的误差限大,一般应该用式
( 13)计算误差限, 因为,即使立地质量等因子都考虑了, 也不可能完全相互独立。上面的推导
是对单木模型而言的, 如是平均因子模型, 则不涉及( 9)式的算法, 只用( 13)式。
这里要指出, Var ( )与 Var( y 2)是不一样的,且总有 Var( ) > Var( y 2)。因为 y2是在考虑
y
1
的情况下计算的,而 是在模型建立后,认为 y
1
为零的情况下计算的, 所以, 的绝对值要比
y2大。
3 计算例子
数据取自浙江省监测体系的 1989、1994两期数据的马尾松复测样木数据, A 0= 5,模型
分人工林、天然林、人工林和天然林合并的年
龄隐含的单木模型,变量为材积,共提取复位
样木 3 755 株, 剔除了严重异常的样木 72
株,参加建模的 3 683株。株数、样地数及计
算精度的株数见表 1, 计算精度的株数及
m2i 均包括建模时被剔除的株数,年龄隐含
模型为( 6)式,拟合的结果见表 2。
表 1 样木株数、样地数
森林类型 建模株数 样地数
计算精
度株数 m2i
人工林+ 天然林 3 683 384 3 755 75 123
人工林 728 71 738 15 538
天然林 2 955 313 3 017 59 585
表 2 年龄隐含模型的拟合结果
森林类型 a b Q1 Q2 Q S r Q S
人工林+ 天然林 13. 636 1 366. 553 9. 717 2×10- 2 0. 156 567 1. 302 32
1. 862 32
×10- 2 0. 984 14 0. 598 159
1. 262 13
×10- 2 0. 620 873
人工林 342. 566 926. 668 1. 566 85×10- 2
2. 939 57
×10- 2 0. 155 888
1. 453 38
×10- 2 0. 956 35
6. 504 14
×10- 2
9. 387 86
×10- 3 0. 530 584
天然林 13. 183 6 363. 431 8. 043 93×10- 2 0. 127 525 1. 137 80
1. 941 99
×10- 2 0. 985 451 0. 533 467
1. 329 74
×10- 2 0. 630 911
表 2中的 Q 1和 Q 2为( 6)式中的 y1 (即 v89 )和 y2(即 v94)的平方和, Q为 = V∧94- V 94的平
方和, S 和 r 为根据 Q算得的标准差和相关指数, Q-= mi-i2 = mi ( V∧94 - V 94 ) 2i , S -=
Q-/ mi , ∧为前期方差与后期方差的比值的估计值, ∧= S 2y
1
/ S2y
2
= Q 1/ Q 2。计算 Q、S 、r 、Q-、S -
时都用到了被剔除的数据。这些值都是 A 0= 5时的值,为简便起见,这里未加注明。
精度分析情况见表 3,被剔除的数据也参加计算。蓄积的单位为 m 3。M 为实际 5 a生长
422 林 业 科 学 研 究 10 卷
量, M = V 94- V 89; M∧为模型 5 a 生长量, M∧ = V∧ 94- V∧ 89; 理 为理论误差限, 根据
( 13)式计算, u为 1. 96,保证概率为 95%, m2i 见表 1, S -( A )见表 2中的 S-; E理生为生长量的
理论相对误差, E理生= 理 / M∧×100%, E理总为总生长量的理论相对误差, E理总= 理 / V∧ 94×
100%; P理生为生长量的理论相对精度, P理生= 1- E理生, P理总为总生长量的理论相对精度, P理总
= 1- E理总; 实为实际误差, 实= V 94- V∧ 94= M - M∧ ; E实生、E实总、P实生和 P实总为实际的相
对误差和相对精度。表中没有* 的栏目为用对应的数据建模, 用对应的数据(包括被剔除样
木)计算精度,有* 的为用人工林+ 天然林的模型单独用人工林或天然林数据的精度。精度特
别分定期生长量及总生长量,而且重要的还是定期生长量的精度, 因为预测的年限一般不超过
一个复查间隔期,如果估计的误差还大于间隔期内的生长量, 那么这种预测就没有什么意义
了,从表 3中可以看出,生长量的理论相对精度大多在 80%以上,总生长量的理论精度在 93%
以上。
表 3 精度分析
森林类型 V 89 V 94 V∧94 M M∧ 理 E理生 E理总 P理生 P理总 实 E实生 E实总 P实生 P实总
人工林
+ 天然
林
154. 907 220. 465 219. 799 65. 558 64. 892 6. 780 10. 45 3. 08 89. 55 96. 92 0. 666 1. 02 0. 30 98. 98 99. 70
人工林 21. 681 33. 409 32. 778 11. 728 11. 097 2. 294 20. 67 7. 00 79. 33 93. 00 0. 631 5. 38 1. 89 94. 62 98. 11
人工林* 21. 681 33. 409 33. 109 11. 728 11. 428 2. 265 19. 82 6. 84 80. 18 93. 16 0. 30 2. 56 0. 90 97. 44 99. 10
天然林 133. 226 187. 056 186. 423 53. 830 53. 197 6. 362 11. 96 3. 41 88. 04 96. 59 0. 633 1. 18 0. 34 98. 82 99. 66
天然林* 133. 226 187. 056 186. 690 53. 830 53. 464 6. 370 11. 91 3. 41 88. 09 96. 59 0. 366 0. 68 0. 20 99. 32 99. 80
年龄隐含模型精度高的主要原因是误差只从调查年份(设这时树木的年龄为 A 1 )开始积
累,在开始( A = 0)时不存在误差,随着 A 的增大,误差逐渐增大,只要 A 不是太大,总能
有较高的精度。当 y 1= 0, 即 A 1= 0时, A 2= A 1+ A = A ,这时,年龄隐含模型退化为年龄模
型,从理论上讲, 只有在这种情况下, 年龄隐含模型的精度才会和年龄模型同样低。当A 很大
时,会接近这种情况。
对于精度分析, 最好是用连续三期的复位样木数据,前二期数据用来建模,第三期的数据
用来检验, 但目前尚找不到连续三期的复位样木数据,用建模的数据来作精度估计, 还是能基
本说明问题的。
4 结论与建议
( 1)年龄隐含的生长模型具有较高的精度; 使用时只要知道上次的调查值 y 1 和 A 就行,
使用方便, y 1 是实测值,除了量测错误等异常情况外, 误差较小, 而 A 则不存在误差,所以模
型的使用精度能得到保证; 森林资源连续清查体系能提供建模所需的成对复测的样木资料。所
以,年龄隐含的生长模型可以在连续清查体系中推广应用。
( 2)本文建议用单木模型,因为单木模型适用范围广。以省为建模单元,不区分人工林和天
然林, 同龄林和异龄林, 纯林和混交林;不区分优势树种和组成树种; 也可不区分林木和散生
木。在应用时,根据样木的树种用对应的模型, 这样可减少建模数量,扩大建模样本容量。
4234 期 葛宏立等: 年龄隐含的生长模型在森林资源连续清查中的应用
( 3)年龄隐含模型是以年龄模型为基础的, 而前者在结构及建模上比后者复杂, 加上连续
清查中 A 一般不大的实际情况,建议用简单的年龄模型作为基础模型,而且这个基础模型要
便于写成年龄的反函数形式。
参 考 文 献
1 葛宏立.自变量也含误差的非线性模型拟合.北京林业大学学报, 1996, ( 2) : 73~77.
2 王柱.最小平方距离法介绍.数理统计与管理, 1986, ( 4) : 34~36.
3 唐守正.利用对偶回归和结构关系建立林分优势高和平均高模型.林业科学研究, 1991, 4(增刊) : 57~62.
Application of the Age-implicit Growth Model
to Continuous Forest Inventory
Ge H ongli X iang X iaoqiang H e Shiz hen Fang L um ing
Abstract This paper discusses the applicat ion of an age-implicit growth model to the
Nat ional Cont inuous Forest Inventor y ( NCFI) . The error of the model is related to the pro-
ject ion inter val A and w ill be zero w hen A is zer o. An example taken fr om that age-explic-
it Johnosn-Schumacher model is used as a base model from which an age-implicit fo rm is de-
rived. The experimental data are Masson pine′s f rom Zhejiang Province′s NCFI. T he est ima-
tion precision of 5 year s′to tal incr ement is g reater than 80% for 95% conf idence. T he
derivat ion, proper ties and erro r est imat ion o f the model are presented. Data to be used for
building age-implicit models must be tho se of being remeasured and matched. It is easy to
use the model. Age-impl icit models could be built at pr ovince level by t ree species or g roup
w ithout considering the differ ences of plantat ion and natural, even-aged and uneven-aged,
pure and mixed, dominant and nondominant , as w ell as stand trees and scat tered t rees.
Key words grow th model age-implicit model Johnson-Schumacher model cont inu-
ous for est inv entory
Ge Hon gli, Engin eer, Xiang Xiaoqiang, He Shizhen ( East Chin a Forest Inventor y Inst itute J inhua, Zhejiang 321001) ;
Fan g Luming ( Th e computer center of Zh ejiang For est ry College) .
424 林 业 科 学 研 究 10 卷