免费文献传递   相关文献

Model Integration Using the Method of Two-stage Error-in-variable and the Soft of ForStat

用两阶段度量误差模型方法和ForStat软件进行模型整合


以同龄林分的年龄X、平均单株胸径Y1(cm)和平均单株材积Y2(m3)的关系模型为例,应用ForStat软件,分别用常规方法和两阶段度量误差模型方法对模型进行整合。结果表明,应用常规方法得到的Y2 估计值明显有偏,而应用度量误差模型方法得到的Y2估计值明显优于应用常规方法得到的估计结果。事实证明:度量误差模型方法和ForStat软件为模型整合提供了有效的途径和工具

In this study, The models of stand age, stand mean diameter at breast height and stand volume are integrated by using the method of two-stage error-in-variable and the ordinary method separately with the soft of ForStat. The result indicates that the estimation of stand volume obtained by ordinary method has bias while the estimation of two-stage error-in-variable is obviously more accurate and has no bias. It is proved that the method of the two-stage error-in-variable and the soft of ForStat are useful method of integrating models.


全 文 :第 ws卷 第 u期
u s s w年 v 月
林 业 科 学
≥≤Œ∞‘׌„ ≥Œ∂ „∞ ≥Œ‘Œ≤„∞
∂²¯ qws o‘²qu
¤µqou s s w
用两阶段度量误差模型方法和 ƒ²µ≥·¤·软件
进行模型整合
李永慈 唐守正 李海奎
k北京林业大学资源环境学院 北京 tsss{vl k中国林业科学研究院资源信息研究所 北京 tsss|tl
摘 要 } 以同龄林分的年龄 Ξ !平均单株胸径 Ψtk¦°l和平均单株材积 Ψuk°vl的关系模型为例 o应用 ƒ²µ≥·¤·软件 o
分别用常规方法和两阶段度量误差模型方法对模型进行整合 ∀结果表明 o应用常规方法得到的 Ψu 估计值明显有
偏 o而应用度量误差模型方法得到的 Ψu 估计值明显优于应用常规方法得到的估计结果 ∀事实证明 }度量误差模型
方法和 ƒ²µ≥·¤·软件为模型整合提供了有效的途径和工具 ∀
关键词 } 模型整合 o两阶段度量误差模型 o数值算法
中图分类号 }≥zx{1x 文献标识码 }„ 文章编号 }tsst p zw{{kusswlsu p sszx p sw
收稿日期 }ussu p s{ p uy ∀
基金项目 }国家自然基金项目/混交林生长规律及其模型的研究0kvsszsyusl的资助 ∀
ΜοδελΙντεγρατιον Υσινγ τηε Μετηοδ οφ Τωο2σταγε Ερρορ2ιν2ϖαριαβλε ανδ τηε Σοφτ οφ ΦορΣτατ
¬≠²±ª¦¬
k Χολλεγε οφ Ρεσουρχε ανδ Ενϖιρονµεντo Βειϕινγ Φορεστρψ Υνιϖερσιτψ Βειϕινγtsss{vl
פ±ª≥«²∏½«¨ ±ª ¬‹¤¬®∏¬
kΤηε Ινστιτυτε οφ Φορεστ Ινφορµατιον Ρεσεαρχηo Χηινεσε Αχαδεµψοφ Φορεστρψ Βειϕινγtsss|tl
Αβστραχτ } Œ±·«¬¶¶·∏§¼o׫¨ °²§¨ ¶¯²©¶·¤±§¤ª¨ o¶·¤±§°¨ ¤±§¬¤°¨ ·¨µ¤·¥µ¨¤¶·«¨¬ª«·¤±§¶·¤±§√²¯∏°¨ ¤µ¨¬±·¨ªµ¤·¨§¥¼∏¶2
¬±ª·«¨ °¨ ·«²§²©·º²p¶·¤ª¨ µ¨µ²µp¬±p√¤µ¬¤¥¯¨¤±§·«¨ ²µ§¬±¤µ¼ °¨ ·«²§¶¨³¤µ¤·¨¯¼ º¬·«·«¨ ¶²©·²©ƒ²µ≥·¤·q׫¨ µ¨¶∏¯·¬±§¬¦¤·¨¶·«¤·
·«¨ ¶¨·¬°¤·¬²±²©¶·¤±§√²¯∏°¨ ²¥·¤¬±¨ §¥¼²µ§¬±¤µ¼ °¨ ·«²§«¤¶¥¬¤¶º«¬¯¨ ·«¨ ¶¨·¬°¤·¬²±²©·º²p¶·¤ª¨ µ¨µ²µp¬±p√¤µ¬¤¥¯¨¬¶²¥√¬²∏¶2
¼¯ °²µ¨ ¤¦¦∏µ¤·¨ ¤±§«¤¶±²¥¬¤¶qŒ·¬¶³µ²√¨ §·«¤··«¨ °¨ ·«²§²©·«¨ ·º²p¶·¤ª¨ µ¨µ²µp¬±p√¤µ¬¤¥¯¨¤±§·«¨ ¶²©·²©ƒ²µ≥·¤·¤µ¨ ∏¶¨©∏¯
°¨ ·«²§²©¬±·¨ªµ¤·¬±ª °²§¨ ¶¯q
Κεψ ωορδσ} ²§¨¯¬±·¨ªµ¤·¬²±o׺²p¶·¤ª¨ µ¨µ²µp¬±p√¤µ¬¤¥¯¨o‘∏°¨ µ¬¦¤¯ ¤¯ª²µ¬·«°
在系统生态学中 o存在大量不同时空尺度上的动态生态模型 ∀一般小尺度模型比较精细 o更能反映局部
生态过程的细微变化 o对外界影响的反映更敏感 ∀大尺度上的模型比较综合 o更能反映生态系统的/平均0性
质 ∀如何将小尺度的精细模型编入大尺度的综合模型正在越来越多地引起研究者的兴趣 ∀已有大量文献报
道不同尺度模型或模型不同组分关系的研究 ∀此类问题在不同文献中被称为/变尺度0 !/联接0 !/累积0 !/拆
分0或/整体性0 ∀这样做的问题是用常规方法得到的参数往往是不相容的 o也就是说 o从大尺度的综合模型
得到的参数与从小尺度的精细模型得到的参数是不同的 ∀ פ±ª等kussul给出了进行模型整合的两阶段度量
误差模型方法 !它的数值算法以及 ¤·¯¤¥程序 o利用这种方法得到的参数是相容的 o有效解决了模型整合中
参数相容性问题 ∀本文利用文献kפ±ª ετ αλqoussul表 t的实验数据 o研究了同龄林分的年龄 Ξ !平均单株胸
径 Ψtk¦°l和平均单株材积 Ψuk°vl的关系模型的整合问题 ∀所有计算和绘图都是利用中国林科院资源信息
研究所森林经理和林业统计研究室开发的 ƒ²µ≥·¤·统计之林软件进行的 ∀
t 选择模型原形和变量变换
为了研究同龄林分的年龄 Ξ !平均单株胸径 Ψtk¦°l和平均单株材积 Ψuk°vl的关系模型的整合问题 o首
先进行模型选择 ∀对于胸径k ∆l和年龄k Ξl的关系 !材积kςl和胸径的关系分别选择广泛应用的里查德模型
和幂函数模型 }
∆ € Αtkt p εp Αv ΞlΑu n Εt ktl
ς € Αw ∆Αx n Εu kul
这里 Αt !Αu !Αv !Αw !Αx是参数 oΕt和 Εu是随机误差 ∀从模型可以看出 oΞ是没有误差的变量 o∆和 ς是有误差
的变量 ∀我们知道参数估计是在随机误差服从独立同分布的条件下进行的 o根据林业测量的经验 o可以认为
随机误差满足独立性条件 ∀为了保证同分布的条件 o分别将模型ktl和kul做对数变换得模型kvl和kwl
±¯ ∆ € ±¯Αt n Αu ±¯kt p εp Αv Ξl n Εv kvl
±¯ς € ±¯Αw n Αx ±¯ ∆ n Εw kwl
图 t 模型ktl的残差图
ƒ¬ªqt • ¶¨¬§∏¤¯ ²© °²§¨¯ ktl
图 u 模型kvl的残差图
ƒ¬ªqu • ¶¨¬§∏¤¯ ²© °²§¨¯ kvl
将模型ktl和kvl的残差进行比较 o两者差异不显著 o我们取模型kvl作为直径和年龄的关系模型 ∀比较模型
kul和模型kwl的残差图可见模型kwl优于模型kul o因此我们选择模型kwl作为材积和直径的关系模型 ∀
图 v 模型kul的残差图
ƒ¬ªqv • ¶¨¬§∏¤¯ ²© °²§¨¯ kul
图 w 模型kwl的残差图
ƒ¬ªqw • ¶¨¬§∏¤¯ ²© °²§¨¯ kwl
在模型kvl和kwl中引进 Ψt € ±¯ ∆ oΨu € ±¯ς o¯±kΑtl仍记为 Αt o¯±kΑwl仍记为 Αw ∀最终模型形式为 }
Ψt € Αt n Αu ±¯kt p εp Αv Ξl n Εx kxl
Ψu € Αw n Αx Ψt n Εy kyl
u 用常规方法进行模型整合
两种常用的模型参数的估计方法分别为 }第一种方法是用两个方程分别估计参数 o第二种方法是将方程
kxl代入方程kyl o合并常数后得
Ψu € Αy n Αz ±¯kt p εp Α{ Ξl n Εz kzl
然后再由方程kzl估计参数 ∀
第一种方法的参数估计结果为 }模型kxl }相关指数 € s1zwt y oΑt € v1xsu v oΑu € t1uz| | oΑv € s1sw{
u ∀模型kyl }相关指数 € s1zwx u oΑw € s1xw{ v oΑx € t1{ty x ∀做 Ψu 的实测值与预测值对比图k图 x !yl o其中
Ψu Ψt表示用 Ψt估计 Ψu 得到的 Ψu 的估计值 oΨu Ψt Ξ表示用 Ξ估计 Ψt后再用 Ψt估计 Ψu 得到的 Ψu 的
估计值 ∀可以看出 Ψu Ψt Ξ是明显有偏的 ∀
yz 林 业 科 学 ws卷
图 x Ψu 估计值k Ψu Ψtl与观测值的对比图
ƒ¬ªqx ≤²°³¤µ¬¶²± ²©²¥¶¨µ√¤·¬²± Ψu ¤±§ ¶¨·¬°¤·¬²± k Ψu Ψtl
图 y Ψu 估计值kΨu Ψt Ξl与观测值的对比图
ƒ¬ªqy ≤²°³¤µ¬¶²± ²©²¥¶¨µ√¤·¬²± Ψu ¤±§ ¶¨·¬°¤·¬²± kΨu Ψt Ξl
图 z Ψu 估计值kΨu Ξl与观测值的对比图
ƒ¬ªqz ≤²°³¤µ¬¶²± ²©²¥¶¨µ√¤·¬²± Ψu ¤±§ ¶¨·¬°¤·¬²± Ψu Ξ
第二种方法的参数估计结果为 }相关指数 € s1||{ u oΑy
€ {1yzu | oΑz € u1vst x oΑ{ € s1sty | ∀做 Ψu 的实测值与预
测值对比图k图zl o其中 Ψu Ξ表示用 Ξ估计 Ψu得到的 Ψu的
估计值 ∀可以看出 Ψu Ξ估计精度很高 ∀
这两种方法估计的参数 o并且用方程kzl进行预测比用
方程kxl和kyl进行预测更精确 ∀事实上 o当前一阶段子模型
的输出作为后一阶段子模型的输入时 o变量是内生的 o因而
导致估计结果是有偏的 ∀当模型的链很长时 o这种偏差不断
积累 o致使最终的估计结果难以置信 ∀
v 用两阶段度量误差模型方法进行模型整合
用方程kxl和kyl分别估计出的参数是局部优化的结果 o
与将这些子系统整合为一个系统后估计出的参数是不相同的 ∀针对这个问题 o唐守正等kt||yl提出了一种
称为两阶段度量误差模型k×≥∞l的新方法 o并给出了数值算法kפ±ª ετ αλqousstl ∀它与以上两种方法有本
质的区别 ∀用这种方法估计参数时 o各个子系统参数的估计是同时进行而不是分别进行的 o此方法同样适用
于非线性联立方程组 ∀ פ±ª等kussul给出了这种方法的 ¤·¯¤¥程序 o并用实例介绍了程序的使用方法 ∀但
是 ¤·¯¤¥程序要求用户有使用 ¤·¯¤¥的经验 o限制了这种方法的广泛应用 ∀
ƒ²µ≥·¤·是中国林业科学院资源信息所森林经理和林业统计研究室在 Œ… p °≤ 系列程序集的基础上 o增
加了许多近代统计方法 o采用面向对象的程序设计方法和 ≤’k组件对象模型l技术 o使用可视化的集成开
发环境 o研制开发的一个统计分析软件 ∀非线性度量误差模型方法是近几年统计领域的研究热点之一 o为了
促进两阶段度量误差模型方法的广泛应用 o我们在 ƒ²µ≥·¤·统计之林软件中开发了一个应用程序模块 o来进
行非线性度量误差模型的参数估计 ∀此模块友好的输入输出界面极大地方便了用户 ∀有关非线性度量误差
模型的理论及参数估计的数值算法 o这里不再赘述 ∀下面介绍如何用 ƒ²µ≥·¤·统计之林软件的两阶段度量误
差模型方法对模型kxl和kyl进行整合并给出计算结果 ∀在数据窗口输入数据 o然后选择统计分析菜单下的
非线性度量误差模型 o调出非线性度量误差模型的方程和参数输入窗体输入方程和参数 ∀两阶段度量误差
模型参数估计结果见表 t ∀
表 1 参数估计结果
Ταβ . 1 Τηε εστιµ ατεδ παραµετερσφορ τηε εθυατιονσ (5)ανδ (6)
参数名 °¤µ¤°¨ ·¨µ±¤°¨ Αt Αu Αv Αw Αx
第一阶段估计值 ƒ¬µ¶·¶·¤ª¨ √¨¤¯∏¤·¬²± v1|su v s1|{y y s1sut { p t1uut u u1wwv y
第二阶段估计值 ≥¨ ¦²±§¶·¤ª¨ √¨¤¯∏¤·¬²± w1sxw | s1|vz v s1sty z p t1uvz | u1ww| x
zz 第 u期 李永慈等 }用两阶段度量误差模型方法和 ƒ²µ≥·¤·软件进行模型整合
图 { 模型和参数输入窗体
ƒ¬ªq{ ׫¨ ©²µ° ²© °²§¨ ¶¯¤±§³¤µ¤°¨ ·¨µ¶¬±³∏·
误差结构矩阵为 } s1suy x s1sss {s1sss { s1sss { oΡ
u € s1|{v t o误差矩阵为 } s1suy t s1sss {s1sss { s1sss { ∀
做 Ψu的实测值与预测值对比图k图| !tsl ∀可以看出用度量误差模型方法得到的 Ψu Ψt Ξ精度非常高 o
并且是无偏的 o估计结果明显优于常规估计方法 ∀
图 | Ψu 估计值k Ψu Ψtl与观测值的对比图
ƒ¬ªq| ≤²°³¤µ¬¶²± ²©²¥¶¨µ√¤·¬²± Ψu ¤±§ ¶¨·¬°¤·¬²± Ψu Ψt
图 ts Ψu 估计值kΨu Ψt Ξl与观测值的对比图
ƒ¬ªqts ≤²°³¤µ¬¶²± ²©²¥¶¨µ√¤·¬²± Ψu ¤±§ ¶¨·¬°¤·¬²± Ψu Ψt Ξ
w 结论
两阶段度量误差模型理论和 ƒ²µ≥·¤·软件是进行模型整合的有效方法和工具 ∀像其它算法一样 o参数初
始值选择很重要 o如果初始值选在最优解附近算法一定能够收敛 o并且收敛速度很快 o否则算法很可能不收
敛 o或收敛速度很慢 ∀用户可以参照通常方法得到的参数估计值来选择参数初始值 ∀
参 考 文 献
唐守正 o李 勇 q生物数学模型的统计学基础 o北京 }科学出版社 oussu
唐守正 o李 勇 q一种多元非线性度量误差模型的参数估计及算法 o生物数学学报 ot||y ottkvl }uv p uz
פ±ª≥«²∏½«¨ ±ªo• ¤±ª ≠²±ª«¨ q „ ³¤µ¤° ·¨¨µ ¶¨·¬°¤·¬²± ³µ²ªµ¤° ©²µ·«¨ µ¨µ²µp¬± √¤µ¬¤¥¯¨ °²§¨¯o∞¦²¯²ª¬¦¤¯ ²§¨¯¯¬±ªoussu otxyku p vl }uux p uvy
פ±ª≥«²∏½«¨ ±ªo¬≠²±ªo• ¤±ª≠²±ª«¨ q≥¬°∏¯·¤±¨ ²∏¶¨´ ∏¤·¬²±¶o µ¨µ²µ2¬± √¤µ¬¤¥¯¨°²§¨ ¶¯o¤±§°²§¨¯¬±·¨ªµ¤·¬²±¬±¶¼¶·¨°¶ ¦¨²¯²ª¼o∞¦²¯²ª¬¦¤¯ ²§¨¯¯¬±ªousst o
twu kvl }u{x p u|w
{z 林 业 科 学 ws卷