Based on the whole stand model of Daqingshan, using simulation method, the impact of measurement error of number of trees per hectare, average diameter, dominant height, average height and form height on the whole stand model were studied. The result indicated that, beting estimated by least square method, basal area model, average diameter model, number of trees per hectare model had obvious biases, but dominant height model, average height model and form height model had no clear biases.
全 文 :第 wt卷 第 y期
u s s x年 tt 月
林 业 科 学
≥≤∞× ≥∂ ∞ ≥≤∞
∂²¯1wt o²1y
²√ qou s s x
度量误差对全林整体模型的影响研究
李永慈t 唐守正u
kt1 北京林业大学基础学院 北京 tsss{v ~u1中国林业科学研究院资源信息研究所 北京 tsss|tl
关键词 } 度量误差 ~全林整体模型 ~最小二乘估计
中图分类号 }≥zx{1x 文献标识码 } 文章编号 }tsst p zw{{kussxlsy p styy p sw
收稿日期 }ussw p sy p tw ∀
基金项目 }/数字林业0关键技术引进 o|w{项目kusst p tvl ∀
Α Στυδψ ον Ιµ παχτ οφ Μεασυρεµεντ Ερρορ ον Ωηολε Στανδ Μοδελ
¬≠²±ª¦¬t פ±ª≥«²∏½«¨ ±ªu
kt1 Βασε ∆επαρτµεντo Βειϕινγ Φορεστρψ Υνιϖερσιτψ Βειϕινγtsss{v ~
u1 Ρεσεαρχη Ινστιτυτε οφ Φορεστρψ Ρεσουρχε Ινφορµατιον Τεχηνιθυεσo ΧΑΦ Βειϕινγtsss|tl
Αβστραχτ}
¤¶¨§²± ·«¨ º«²¯¨¶·¤±§ °²§¨¯ ²© ⁄¤´¬±ª¶«¤±o∏¶¬±ª¶¬°∏¯¤·¬²± °¨ ·«²§o·«¨ ¬°³¤¦·²© °¨ ¤¶∏µ¨°¨ ±· µ¨µ²µ²©
±∏°¥¨µ²©·µ¨ ¶¨³¨µ«¨¦·¤µ¨ o¤√¨ µ¤ª¨ §¬¤°¨ ·¨µo§²°¬±¤±·«¨¬ª«·o¤√¨ µ¤ª¨ «¨¬ª«·¤±§©²µ° «¨¬ª«·²±·«¨ º«²¯¨¶·¤±§°²§¨¯ º¨ µ¨
¶·∏§¬¨§q׫¨ µ¨¶∏¯·¬±§¬¦¤·¨§·«¤·o¥¨·¬±ª ¶¨·¬°¤·¨§¥¼¯¨ ¤¶·¶´∏¤µ¨ °¨ ·«²§o¥¤¶¤¯ ¤µ¨¤ °²§¨¯o¤√¨ µ¤ª¨ §¬¤°¨ ·¨µ°²§¨¯o±∏°¥¨µ
²©·µ¨ ¶¨³¨µ«¨¦·¤µ¨ °²§¨¯«¤§²¥√¬²∏¶¥¬¤¶¨¶o¥∏·§²°¬±¤±·«¨¬ª«·°²§¨¯o¤√¨ µ¤ª¨ «¨¬ª«·°²§¨¯¤±§©²µ° «¨¬ª«·°²§¨¯«¤§±²
¦¯¨ ¤µ¥¬¤¶¨¶q
Κεψ ωορδσ} °¨ ¤¶∏µ¨°¨ ±·¨µµ²µ~º«²¯¨¶·¤±§°²§¨¯~¯¨ ¤¶·¶´∏¤µ¨ ¶¨·¬°¤·¬²±
唐守正kt||tl提出的全林整体模型 o是一项将生长收获模型作为系统来进行研究的重要成果 o在此基础
上展开了一系列的应用研究 ∀李希菲kt||tl年建立了大青山主要树种的全林整体模型并进行了精度验证 o
洪玲霞kt||vl给出了由全林整体生长模型推导林分密度控制图的方法 o唐守正等kt||xl对用全林整体模型
计算林分纯生长量的方法及精度分析进行了研究 ∀建立全林整体模型时 o首先对林分每公顷株数 !平均直
径 !林分优势高 !林分平均高和形高 x个因子进行观测 o然后利用最小二乘法 o由自稀疏方程估计出自稀疏指
数 Χ!自稀疏率 Β!完满立木度林分的密度指数 Σφ≈这 v个参数也可以通过其他方法进行估计k唐守正 o
t||tl o由优势高方程估计出立地指数 o最后分别估计全林整体模型的基础模型 o根据函数关系 o得到派生模
型 ∀
然而在生物数学模型中 o描述生物体或生物系统的变量之间很少存在严格的数学关系 o大多数研究的是
/平均关系0 ∀用统计学语言说 o研究的是/随机变量数学期望0之间的关系 o但是我们观测的量 o都是这个随
机变量的一次或几次实现 o因而与它的期望值有较大的误差 ∀这种误差不仅是观测误差 o往往也包含抽样误
差 o甚至模型误差等 o这些统称为度量误差 ∀ ¨ µ·¨±µkt||sl就度量误差对林分蓄积方程的灵敏性进行了研
究 o¤±ª¤¶kt||{l研究了度量误差对生长模型系数和生长预测的影响 ∀我们国家在这方面的研究起步较早 o
唐守正kt||tl利用对偶回归和结构关系建立了林分优势高和平均高模型 o唐守正等kt||yl给出了一种多元
非线性度量误差模型的参数估计及算法 oפ±ªkusstl等用非线性度量误差联立方程组进行生态系统的模型
整合 ∀
在建立全林整体模型时 o林分每公顷株数 !平均直径 !林分优势高 !林分平均高和形高 x个观测因子 o不
可避免地存在度量误差 o然而它们的度量误差对全林整体模型产生怎样的影响 o至今未见相关报道 ∀本文通
过模拟试验 o研究这 x个林分因子的度量误差对全林整体模型的影响 ∀
1 模拟试验设计和模拟观测数据构造
t1t 全林整体模型简述
基本模型 }
tl断面积模型 }Γ βt ≅ Λβu ≅ ¾t p ¬¨³≈ p βw ≅ k ΣφΠt ssslβx ≅ k Τp τsl Àβv
ul林分优势高模型 }ΗΛ Λ¨ ¬³k p ΒΠΤn ΒΠτtl
vl林分平均高模型 }Ηα k Ηδ p ααlΠβα
wl形高 Ηφ模型 }Ηφ ≈ αΗφ n βΗφΠk Ηα n ul Ηα
xl自稀疏模型 }¯±Ν ±¯Σφ p ktΠΧl¯ ±≈k ∆Π∆slΒΧ n kΣφΠΝtlΧ p k ∆tΠ∆slΒΧ
基本函数式 }
tl Σφ Νk ∆Π∆slΒ
ul Γ ΠΝ∆uΠws sss
vl Μ Γ ≅ Ηφ
派生模型 }
tl ∆ χt ≅ Λχu ≅ ¾t p ¬¨³≈ p βw ≅ kΣφΠt ssslβx ≅ k Τp τsl Àχv Σχw
ul Ν αt ≅ Λαu ≅ ¾t p ¬¨³≈ p βw ≅ k ΣφΠt ssslβx ≅ k Τp τsl Àαv Σαw
上述方程中 oΓ为公顷断面积 oΛ为立地指数 !Τ为年龄 oτs 为平均树高达到胸高时的年龄 oΗΛ 为林分优
势高 oΗα 为林分平均高 oΗφ 为形高 oΝ为每公顷株数 o∆为平均直径 o∆s 为基准直径 o每公顷初始株数 Νt o
初始的平均直径 ∆t oΜ为公顷蓄积量 o其他为参数 ∀
t1u 模拟试验设计 当观测变量有度量误差时 o以大青山马尾松k Πινυσ µασσονιαναl全林整体模型k唐守正 o
t||tl为基础模型 o研究用通常采用的方法建立全林整体模型时出现的问题 ∀
大青山马尾松全林整体模型的参数 }τs u1x oβt vs1tus w oβu s1tzz tv{ oβv s1t|| |zy oβw
s1ssx uw| wz oβx w1|xz wwx o τt us oΒ z1ztx y oΛ ty ot{ ous o αΗα s1|z oβΗα t1syv o αΗφ s1vyw wx oβΗφ
t1|wu zu o ∆s us oΣφ t yyx株#«°pu oΧ u1x oΒ t1zv oχt ≈wsβtΠkΠ∆Βsl tΠku p Βl tz1ttt xuv {yx {s| x| o
χu βuΠku p Βl s1yxy syy yyy yyy yz o χv βvΠk u p Βl s1zws yxt {xt {xt {x o χw
p tΠku p Βl p v1zsv zsv zsv zsv z oαt t sssχp Βt ∆Βs t vs|1zyu uvv syt tyoαu p Βχu p t1tvw ||x vvv vvv vvo
αv p Βχv pt1u{t vuz zsv zsv zoαw tp Βχw z1wsz wsz wsz wsz wt∀
模拟试验具体设计如下 }v个不同的初始密度kΣt uss !Σu vss !Σv wssl和 v个不同的立地指数kΛt
ty !Λu t{ !Λv usl共 |种不同的组合 ∀将年龄 Τ ≈x ots otx ous oux ovs ovx !初始密度和立地指数代入大青
山马尾松全林整体模型 o得到断面积 !株数 !直径 !优势高 !平均高和形高数据的/真值0 ∀容易看出断面积 !株
数和直径/真值0都包括 yv个值 ∀优势高 !平均高和形高的/真值0都包括 ut个值 o因为 v个初始密度下它们
的/真值0数据是相同的 ∀
t1v 模拟试验数据构造 模拟观测数据的构造是通过为/真值0加上一个随机变量来实现 ∀随机变量的不
同取值代表了度量误差的随机性 o假定随机变量的均值为 s oΡu 方差为 ∀构造满足这种条件的随机变量方法
很多 o比如可以取服从 Νks oΡul的随机变量 o也可以取≈ p v Ρ o v Ρ 上服从均匀分布的随机变量 ∀服从 Ν
ks oΡul的随机变量可能更接近于实际问题中的度量误差 o然而模拟试验中如果取这种随机变量模拟度量误
差 o有可能造成模拟观测数据取负值 o而实际问题中不可能出现这种情况 ∀因此我们取服从均匀分布的随机
变量来模拟度量误差 o随机变量的取值区间参照真值的取值来确定 ∀因为我们要研究的是 }当观测变量有度
量误差时 o用通常采用的方法建立全林整体模型时出现的问题 o模拟度量误差究竟是服从 Νks oΡul分布 !还
是服从≈ p vΡ ovΡ 上的均匀分布 o还是服从其他什么分布 o不会对研究结果产生本质的影响 ∀
依据上述原则 o为直径/真值0 δ加上随机变量 Ν∆ 得模拟直径观测数据 o∆ δ n Ν∆kΝ∆ 是区间≈ p t ot
上服从均匀分布的随机数l oΕkΝ∆l s oςαρkΝ∆l s1vvv v ~为株数/真值0 ν加上随机变量 ΝΝ 得模拟株数观
测数据 oΝ ν n ΝΝkΝΝ 是区间≈ p xs oxs 上服从均匀分布的随机数l oΕkΝΝl s oςαρkΝΝl {vv1vvv ~为优势
高数据/真值0加入≈ p t ot 区间上服从均匀分布的随机变量 ΝΗδ作为度量误差 oΗδ ηδ n ΝΗδ oΕkΝΗδ l s.
ςαρkΝΗδ l s1vvv vkηδ 是优势高/真值0l ~为平均高数据/真值0加入≈ p t ot 区间的均匀分布的随机变量 ΝΗα
zyt 第 y期 李永慈等 }度量误差对全林整体模型的影响研究
作为度量误差 oΗα ηα n ΝΗα oΕkΝΗαl s oςαρkΝΗαl s1vvv vk ηα 是平均高/真值0l ~为形高数据/真值0加入
≈ p t ot 区间的均匀分布的随机变量 ΝΗφ作为度量误差 oΗφ ηφ n ΕΗφ oΕkΕΗφl s oςαρkΝΗφl s1s{v vvk ηφ 是形
高/真值0l ∀
上述构造模拟观测数据的过程重复 ts次 o将 ts次得到的所有模拟观测数据组合在一起构成一个大样
本 o这样最终得到的模拟观测数据有 yvs个样本 ∀
2 参数估计值
本节所有计算均在 ¤·¯¤¥中进行 ∀用非线性回归函数 o对上面构造的模拟观测数据 o依次估计全林整体
模型的参数 ∀估计自稀疏模型的参数和优势高模型的参数见表 t o估计断面积模型 !直径模型和株数模型的
参数见表 u o由直径模型参数 !株数模型参数与断面积模型参数的关系得表 v o平均高模型和形高模型的参数
见表 w ∀
表 1 自稀疏模型和优势高模型参数估计值
Ταβ . 1 Παραµετερ εστιµ ατεσ οφ σελφ2τηινγ µ οδελ
ανδ δοµιναντ ηειγητ µ δελ
参数名 ¤°¨ 参数真值 ×µ∏·«√¤¯∏¨ 估计值 ∞¶·¬°¤·¨
Σφ t yyx t zut1sv| ust
Χ u1x u1vxv vwt
Β t1zv t1zst wyy
Λt ty ty1sv{ x|{
Λu t{ t{1sxx tvx
Λv us t|1|{s ssy
z1ztx y z1{zy vvw
表 2 断面积模型参数估计值
Ταβ . 2 Παραµετερ εστιµ ατεσ οφ βασαλ αρεα µ οδελ
参数名 ¤°¨ 参数真值 ×µ∏·«√¤¯∏¨ 估计值 ∞¶·¬°¤·¨
βt vs1tus w vu1w{t szz
βu s1tzz tv{ s1tzv tux
βv s1t|| |zy s1tvu y|v
βw s1ssx uw| s1sss yuu
βx w1|xz wwx z1{ws stx
表 3 直径模型和株数模型的参数估计值
Ταβ .3 Παραµετερ εστιµατεσ οφ αϖεραγε διαµετερ µ οδελ
ανδ νυµ βερ οφ τρεεσ περ ηεχταρε µ οδελ
参数名 ¤°¨ 参数真值 ×µ∏·«√¤¯∏¨ 估计值 ∞¶·¬°¤·¨
χt tz1ttt xuw uu1vyv ts|
χu s1yxy syz s1xz| |t|
χv s1zws yxu s1www w{w
χw p v1zsv zsw p v1vw| zsz
αt t vs|1zyu uvv {uy1|wu ut{
αu p t1tvw ||x p s1|{y ztw
αv p t1u{t vu{ p s1zxy uzw
αw z1wsz wsz y1y|| wtw
表 4 平均高模型和形高模型的参数估计值
Ταβ . 4 Παραµετερ εστιµατεσ οφ αϖεραγε ηειγητ µ οδελ
ανδ φορµ ηειγητ µ οδελ
参数名 ¤°¨ 参数真值 ×µ∏·«√¤¯∏¨ 估计值 ∞¶·¬°¤·¨
αΗα s1|z t1sss u|
βΗα t1syv t1sys ysv
αΗφ s1vyw wx s1vy{ wx|
βΗφ t1|wu zu t1{|s uuv
3 模型估计值曲线与模型真值曲线的比较
图 t分别列出在立地指数为 Λt 时 o断面积模型 !直径模型 !株数模型 !优势高模型 !平均高模型和形高模
型在 v种不同的密度下真值曲线与估计值曲线 ∀
4 结论与讨论
以上的研究表明 }对于全林整体模型 o当株数 !直径 !优势高 !平均高和形高 x个观测因子有度量误差时 o
用通常最小二乘方法估计模型参数时 o断面积模型 !直径模型和株数模型出现明显的系统偏差 o但是优势高
模型 !平均高模型和形高模型没有明显的系统偏差 ∀因此 o有必要探讨其他的参数估计方法 o以减少或消除
用通常最小二乘方法估计带度量误差的全林整体模型的参数时造成的系统偏差 ∀
ƒ∏¯¯ µ¨kt|{zl的 ¤¨¶∏µ¨°¨ ±·∞µµ²µ²§¨ ¶¯介绍了线性度量误差模型的理论和应用成果 o≤¤µµ²¯¯等kt||xl的
¤¨¶∏µ¨°¨ ±·∞µµ²µ¬± ²±¯¬±¨ ¤µ²§¨ ¶¯介绍了非线性度量误差模型的理论和应用成果 o唐守正kussul的生物数
学模型的统计学基础发展了线性和非线性度量误差模型的理论 o并将它们引入林业领域 o为我们研究和解决
{yt 林 业 科 学 wt卷
度量误差对林分生长收获模型的影响提供了理论依据 ∀
图 t 模型估计值曲线与真值曲线的对比
ƒ¬ªqt ≤²°³¤µ¬¶²± ²©·«¨ ·µ¤·«√¤¯∏¨ ¦∏µ√¨º¬·«·«¨ ¶¨·¬°¤·¨§√¤¯∏¨ ¦∏µ√¨
参 考 文 献
洪玲霞 qt||v1 由全林整体生长模型推导林分密度控制图的方法 q林业科学研究 oxkyl }xts p xty1
李希菲 qt||t1大青山实验局主要树种k组l全林整体模型及精度验证 q林业科学研究 owk增刊l }tw p ut
唐守正 o李 勇 qt||y1 一类多元非线性度量误差模型的参数估计及算法 q生物数学学报 ott }uu p uz
唐守正 qt||t1广西大青山马尾松全林整体生长模型及应用 q林业科学研究 owk增刊l }{ p tv
唐守正 o李希菲 qt||x1 用全林整体模型计算林分纯生长量的方法及精度分析 q林业科学研究 o{kxl }wzt p wzy
唐守正 o李 勇 qussu1 生物数学模型的统计学基础 q北京 q科学出版社
≤¤µµ²¯¯ o∏³³¨µ·⁄o≥·¨©¤±¶®¬ qt||x q ¤¨¶∏µ¨° ±¨·¨ µµ²µ¬± ±²±¯¬±¨ ¤µ°²§¨ ¶¯q¨ º ≠²µ®}≤«¤³°¤± i ¤¯ Π¯≤ ≤
ƒ∏¯¯¨µ • qt|{z1 ¤¨¶∏µ¨° ±¨·¨ µµ²µ°²§¨ ¶¯q¨ º ≠²µ®
¨ µ·±¨ µ qt||s1 ׫¨ ¶¨±¶¬·¬√¬·¼ ²© ° ¤¨¶∏µ¨°¨ ±·¨µµ²µ¬±¶·¤±§√²¯∏°¨ ¶¨·¬°¤·¬²±q≤¤± ƒ²µ ¶¨ous }{ss p {sw
¤±ª¤¶ ≥ qt||{1∞©©¨¦·²© µ¨µ²µ¶p¬±p√¤µ¬¤¥¯ ¶¨²± ¦²¨©©¬¦¬¨±·¶²©¤ªµ²º·« °²§¨¯¤±§²± ³µ¨§¬¦·¬²± ²©ªµ²º·«qƒ²µ¨¶·∞¦²¯²ª¼ ¤±§ ¤±¤ª¨ °¨ ±·otsu }usv p utu
פ±ª≥ o¬≠ ≤ o• ¤±ª ≠ qusst1 ≥¬°∏¯·¤±¨ ²∏¶¨´ ∏¤·¬²±¶o¨µµ²µp¬±p√¤µ¬¤¥¯¨ °²§¨ ¶¯o¤±§°²§¨¯¬±·¨ªµ¤·¬²±¬±¶¼¶·¨°¶∞¦²¯²ª¼q∞¦²¯²ª¬¦¤¯ ²§¨ ¬¯±ªotwukvl }
u{x p u|w
|yt 第 y期 李永慈等 }度量误差对全林整体模型的影响研究