免费文献传递   相关文献

最优组合模型在凹叶厚朴树皮产量预测中的应用研究



全 文 :第 29卷第 3期 江 西 农 业 大 学 学 报 Vo.l 29, No. 3
2007年 6月 Acta Ag ricu lturae Unive rsitatis Jiangx iensis June, 2007
文章编号:1000 - 2286(2007)03 - 0393 -05
最优组合模型在凹叶厚朴树皮
产量预测中的应用研究
刘素青 1 ,李际平 2* ,周元满 1
(1. 广东海洋大学 农学院 , 广东 湛江 524088;2. 中南林业科技大学 , 湖南 长沙 412100)
摘要:提出无约束最优组合模型和有约束最优组合模型 ,这两种模型均可以极大地改善凹叶厚朴树皮产量预测
效果。在这两种模型中 ,其中约束模型的残差平方和为 64. 251 7,无约束模型的残差平方为 0,无约束模型远
远优于有约束模型。在模型应用中 ,提出了这两种模型效率和预测效果的检验方法。两种模型的效率显著提
高 ,显著性水平均在 0. 01以上。
关键词:最优组合模型;预测;树皮产量;凹叶厚朴
中图分类号:O141. 4  文献标识码:A
Build ing of theOptmi alComb inationM odel and Its
App lication to the Prediction ofM agnoliaO fficinalis Bark Y ield
LIU Su - qing
1 , L I Ji - p ing2* , ZHOU Yuan -man1
  (1. C ollege o fAg ronomy, Guangdong Ocean Un iversity, Zhanjiang 524088, Ch ina;2. South C enter Uni-
ve rsity of Forest Science and Technology, Changsha 412100, Ch ina )
  Abstract:This pape r dealsw ith the building o f the op timal combina tionmodels. .i e. the restriction mode l
and the restriction - freemode.l The residua l erro r of the restrictionmode l is 64. 252 7 and that of the restric-
tion - freemode l is 0. 000 0. The restriction model exce ls the restriction - free model in pred icting the bark
yie ld ofmagno lia o f o fficinalis. The predic ting e fficiency and its te stingmethod in their app lication are put for-
ward. The e fficiency o f the models is ove r 0. 01 on average.
Key words:optima l comb ination model;pred ict;bark y ield;magno lia officinalis
组合预测方法是由 Bates JM和 G range rC W J于 1969年提出的一种综合模型方法。根据同一研
究对象所采用不同类型单项模型所提供的预测信息 ,在一定的准则下取得相应的最优化加权系数 ,在此
基础上得出组合预测模型 。这种方法充分利用单项预测模型所提供的有效信息 ,减少单个模型中随机
因素的影响 ,达到提高精度的目的。自组合预测模型提出 ,因它能有效地提高预测精度 ,受到国内外预
测工作者的关注 。
凹叶厚朴(Magnolia officina lis var. b iloba)是我国重要的材药两用经济林树种 ,分布于陕西 、甘肃 、
湖北 、四川 、秦岭 、淮河以南各省区。厚朴是良好的药材树种 ,以树皮作为主要收获对象 ,其产量直接影
响栽培经济效益 。过去对树皮产量研究的所采用模型是一般回归模型 (刘强 , 2001)[ 1] ,也有的在参数
收稿日期:2007 - 03 - 03  修回日期:2007 - 04 -05
基金项目:湖南省教育厅重点课题资助(05A027)
作者简介:刘素青 , 男 , 博士生 , 主要从事森林生态系统经营研究;通讯作者:李际平 , 教授 , 博士生导师 , E -m ail:li-
usuq ing2001@ yahoo. com. cn。
 江 西 农 业 大 学 学 报 第 29卷
求解时方法有所改进 (涂育合等 , 2003)[ 2] ,但这些均属于常规回归模型的范畴 ,没有从根本上有效提高
模型的预测精度 。树皮生长受诸多方面的影响 ,因此树皮生长模型很难用唯一的数学模型来描述。本
文采用组合模型技术对凹叶厚朴树皮产量进行研究 ,为凹叶厚朴树皮产量预测提供理论依据。
1 最优模型构建
设凹叶厚朴树皮的生长系统为:
U =f(x1 , x2 , … , xp)。 (1)
式 (1)中 , f为树生长系统的结构;x1 , x2 , … , xp为凹叶厚朴树皮生长系统的影响因子 ,U为在 x1 , x2 ,
… , xp因子影响下的树皮生长。 f(x1 , x2 , …, xp)为树皮生长的系统模型。
树皮生长的系统模型 f(x1 , x2 , …, xp)一般是非线性模型 ,很难找到一种数学模型能准确地描述它。
为了定量地研究它的变化规律 ,习惯上采用比较简单的模型近似地刻画它。这样必然存在两个问题:①
由于所选的模型不能确切地描述系统即所选模型提供的信息有限造成的偏差。 ②调查数据随机性产生
的偏差 。
基于以上的问题 ,无论采用何种模型 ,均会产生偏差。为了提高预测精度 ,只有采取多模型的组合
预测模型 ,充分利用单个模型提供的有效信息 ,才能改善预测结果 。
设树皮生长预测中 ,采用了 m 种单项预测模型 ,在时刻 t时的预测值分别是:
U^ 1i =f1i(x1i , x2i , … , xpi)
U^ 2i =f2i(x1i , x2i , … , xpi)

U^mi =fm i(x1i , x2 i , …, xp i)
在上述 m 个单测模型的基础上 ,构建综合预测值为:
U^ i =w iU^1 i +w iU^2i +… +wmU^m i (2)
预测精度可以表现为:
Δi =U^i -U i =(w 1U^ 1i +w2U^2 i +… +wmU^mi) -U i(w1 +w2 +… +wm )
=΢w j(U^ ji -U ji)
Δ2i =(΢
j
w j(U^ ji -U ji))2
Q =΢
i
Δ2i
把上式展开后 ,交叉项之和为零 ,只剩下平方项 。
Q =΢
i
Δ2i=΢
i
΢
j
w
2
j (U^ij -U i)2 (3)
最优的预测模型是保证预测偏差最小值 ,换言之即精度最高。由于模型中对 w i的要求不同 ,所以
最优预测模型可分为两种类型 。
1. 1 无约束最优组合模型
这种模型对权重 wi无约束条件限制 ,可以在实数域范围内搜索最优解 。
M inQ =΢
i
Δ2i=΢
i
΢
j
w
2
j (U^ ij -Ui)2
w i R
(4)
1. 2 有约束最优组合模型
为了说明单个模型对综合模型的影响和单个模型提供的信息量 ,有时用 w i的大小来说明 。为了便
于比较 ,进行归一化 ,此时便对 w i更多的约束 ,当然 ,这时最优解的搜索空变小了 ,最优值的优化程度也
随之降低。此时模型表示为:
m inQ =΢Δ2i=΢(U i -U^i )2
s. .t   ΢w i =1
0≤w i≤1
(5)
394
第 3期 刘素青等:最优组合模型在凹叶厚朴树皮产量预测中的应用研究
2 结果与分析
2. 1 数据来源
数据来自福建大田桃源林场一片生长正常的凹叶厚朴人工同龄林内 ,林年龄为 27年。凹叶厚朴林
造于残次林清杂后的采伐迹地上 。其海拔 585 ~ 625m ,坡度 24°,全坡 ,腐殖质层厚 5 cm ,土壤厚度
60 cm。林分面积 1. 6 hm2 ,初始密度 3 600株 /hm2 ,现保留密度 2 400株 /hm2。结合林分皆伐 ,在该片
林分内随机抽取样木 61株 ,齐地伐倒后测定样木树高 、胸径 ,剥下树皮测其鲜重产量 ,烘干折成干重 , 61
株样本经级分布如表 1[ 2] 。
表 1 样木基本情况表
Tab. 1 The Forma t for Sam pling Trees basic cond ition
径级 /cm 株数 /株 百分比 /% 平均胸径 /cm 平均树高 /m 平均皮重 /kg
4 5 8. 20 4. 68 6. 62 1. 43
6 7 11. 48 6. 17 8. 13 2. 83
8 8 13. 11 7. 87 11. 12 4. 34
10 18 29. 51 9. 80 12. 50 7. 71
12 10 16. 39 11. 87 13. 72 10. 70
14 8 13. 11 13. 92 15. 78 14. 45
16 3 4. 83 15. 60 15. 95 15. 16
18 2 3. 28 17. 63 17. 40 25. 84
2. 2 模型选择与评价标准
在系统中独立候选模型繁多 ,究竟选择哪些模型进入组合模型 ,需要做出决断。单个模型时的表现
和在组合模型中的表现是不同的 ,单独表现好的模型不一定在组合模型就好 ,组合模型追求的整体协
调 ,利用独立模型提供的有效信息相互补充 ,以期改善系统的预测 。
模型评价指标一般主要采用残差平方和 Q和调整相关系数 R两种 。建立模型的目的是为了生产
中的应用 ,其中模型预测就是一个很好的应用实例 。所以模型的评价仅用前面的两个指标是远远不够
的 。因此 ,本研究中除这两个指标外 ,还采用参数变动系数 C% =|Sc /C|, Sc为参数标准差 , C为参数估
计值;总相对误差 RS =΢yi - y^i΢^yi ;平均相对误差 EE =
1
n
΢(yi - y^i
y^i
)×100%;平均相对误差绝对值 RMA =
1
n
΢|yi - y^i
y^i
|×100%;预估精度 P =(1 - tα ΢(yi - y^i)
2
y^ n(n -T) ×100%,其中 y^ =f(–x)。这些指标中 , C%反映
了模型的稳健性 ,RS和 EE用来检验模型是否存在系统偏差 。指标 RMA是检验模型与样本点的吻合程
度的一个重要指标。而指标 P则是检验模型用来预测时效果好坏的一个重要指标 [ 3] 。
2. 3 模型的筛选
为了考察单个独立模型对凹叶厚朴树皮预测的效果 ,表 1的原始数据 ,采用改进的单纯形法 (吴承
祯 )[ 4] ,以线性模型 、指数模型及幂函数模型拟合为基础 ,确定最适合该树种树皮产量模型 (涂育合等 )。
结果见表 2。
组合模型是由单个模型按一定的法则组成的综合模型 。在模型估计和选型时 ,采用模型逐步筛选
法 ,以减少回归参数 ,提高模型的效率 。每加权回归一次 ,都要观察其参数的变动系数和评价指标的变
化 ,决定取舍的模型 ,直至组合模型和参数达到最优 。
从表 2可以看出 ,单个模型估计中 ,以模型 (11)Y 11 =0. 943 864 3+0. 024 078 96D2. 040018H0. 364630效
果最好 ,因此 ,以该模型为标准 ,对两类最优组合模型进行检验。
表 5中 F =
RSS -RSS′
d f -d f′
RSS′
df′
,参考模型 (11)有 4个参数 ,无约束模型共有 20个参数 ,有约束模型 9个参
395
 江 西 农 业 大 学 学 报 第 29卷
数 。从表 5可以看出 ,尽管两种组合模型参数个数增加 ,牺牲一些自由度 ,换取残差平方和的降低。从
表中分析结果可以得到 ,两个模型的残差平方和都得到了显著改善 ,模型的效率显著提高 ,显著性水平
均在 0. 01以上。
表 2 凹叶厚朴树皮产量单个模型
Tab. 2 The S ing le P roductM ode ls of Bark forM agno lia officinalis var. B iloba
序号 模型 残差平方和 /RSS 相关系数 /R
1 Y i =-8. 193 352+1. 671 054D 263. 19 0. 938 3
2 Y 2 =-6. 689 009+1. 295 663H 907. 84 0. 766 4
3 Y 3 =-8. 424 582+1. 633 468D +0. 514 794 1H 261. 99 0. 938 6
4 Y 4 =1. 430 346×1. 178 722D 197. 73 0. 954 0
5 Y 5 =1. 465 466×1. 150 058H 905. 28 0. 767 1
6 Y 6 =0. 066 069 68D2. 059 642 179. 62 0. 958 3
7 Y 7 =0. 093 531 78H1. 807 032 902. 25 0. 768 0
8 Y 8 =0. 034 626 56(D2H)0. 759 944 197. 76 0. 954 0
9 Y 9 =0. 048 555 28D1. 859 789H0. 308 441 7 164. 07 0. 962 0
10 Y 10=1. 022 038 0+0. 015 433 77(D 2H)0. 850 929 7 193. 11 0. 955 1
11 Y 11=0. 943 864 3+0. 024 078 96D2. 040 018H0. 364 630 162. 74 0. 962 3
表 3 无约束最优组合模型参数
Tab. 3 The param eter for them ode l of restr iction - free
参数 W 1 W2 W3 W 4 W5 W6 W 7 W8 RSS R
估计值 - 104. 951 0 -5. 134 4 106. 215 4 6. 650 3 -64. 711 7 - 151. 396 4 - 51. 189 5 195. 720 9 0. 000 0 1. 00
变动系数
/% 5. 12 10. 32 4. 16 8. 02 6. 66 4. 32 12. 60 3. 26
表 4 有约束最优组合模型参数
Tab. 4 The parameter for the m ode l re stricted
W 1
估计值 变动系数 /%
W4
估计值 变动系数 /%
W5
估计值 变动系数 /%
残差平方和
RSS
相关系数
R
0. 276 3 10. 88 0. 695 6 5. 22 0. 028 1 15. 3 64. 251 7 0. 985 3
表 5 模型效率检验
Tab. 5 Exam ination e ffic iency for the models
模型 残差平方和 RSS 自由度 df 均方比 F 临界值 Fα
模型(11) 162. 74 57
无约束组合模型 0 41 ∞
有约束组合模型 64. 251 7 52 15. 821 9 F(0. 01 , 5 , 52) =3. 40
2. 4 模型预测检验
根据 Boo tstrap原理 [ 5, 6] ,用再抽样技术 ,在观测数据中每一径阶抽取检验数据 ,代入检验模型中。
本次只对有约束模型的预测效果进行检验 ,其结果见表 6。
根据表 6的实测值和预测值 ,建立一元线性方程 :^y =b0 +b1yi ,并对 H0:b0 =0, b1 =1的假设检验 ,结
果见表 7。
396
第 3期 刘素青等:最优组合模型在凹叶厚朴树皮产量预测中的应用研究
图 1 预测值与实测值回归直线
Fab. 1 The reg ression line about obse rved value and predic ted value
表 6 模型预测检验
Tab. 6 The test form ode l pred iction
直径 /cm 4. 7 6. 7 8. 4 10. 3 12. 3 14. 4 15. 6 18. 63
树高 /m 6. 1 8. 6 11. 7 13. 0 14. 1 16. 3 16. 0 18. 4
树皮 /kg 1. 28 3. 10 4. 61 8. 11 11. 00 14. 95 15. 16 25. 94
树皮理论值 /kg 2. 157 8 3. 960 7 5. 785 6 8. 157 1 11. 229 9 15. 407 0 18. 261 1 28. 168 2
表 7 模型预测效果分析
Tab. 7 Analyz ing e ffects of the m ode l on pred icting bark w e igh t
b0
估计值 置信区间
b1
估计值 置信区间 RSS R
tb0 tb1 tα
0. 451 8 ( - 1. 002, 1. 905) 1. 064 (0. 951 6, 1. 176) 5. 795 0. 993 5 0. 726 5 1. 334 6 t0. 01 , 6 =3. 142 7
从分析表中可以得
出 , b0 =0, b1 =1成立 ,显
著水平为 0. 01。即在模
型中 y^ =b0 +b1yi可得到 y^
=yi。所以有约束模型用
于预测可以获得理想的结
果 。
3 讨 论
(1)最优组合模型是
一种充分利用各模型所提
供的有效信息 ,改善模型
预测效果的有效手段之一 。
(2)在众多单个候选模型时 ,为了提高模型的效率 ,减少模型的参数 ,避免损失过多的自由度 ,在建
立组合模型时 ,采用逐步筛选法 。
(3)在模型求解过程中 ,在无约束模型中 ,由于受最优搜索空间的限制 ,无约束模型的效果远远优
于约束模型的效果。所以在实际应用中 ,如中无特殊要求 ,最好使用无约束模型 ,以提高模型的效果 。
参考文献:
[ 1]刘强. 凹叶厚朴树皮量及影响因子的研究 [ J] . 经济林研究 , 2001, 19(2):29 -42.
[ 2]涂育合 , 叶功富 ,林照授 , 等.凹叶厚朴树皮产量预测模型的研究 [ J] . 安徽农业大学学报 , 2003, 30(3):312 -315.
[ 3]吴承帧 , 洪伟.运用改进单纯形法拟合 Logistic曲线的研究 [ J] .生物数学学报 , 1999, 14(1):117 - 121.
[ 4]唐守正 , 张会儒 ,胥辉. 相容性生物量模型的建立及其估计方法研究 [ J] .林业科学 , 2000, 36(S1):19 - 27.
[ 5] Efron B. Bootstrap m ethods:ano ther look a t the jackkn ife[ J] . Ann S ta tist, 1979, 7(1):1 - 26.
[ 6] E fron B. The jackknife, the bootstrap and re sam pling plans[M ] . Ph ilade lph ia:Soc ie ty for Industria l and AppliedM a them a t-
ics, 1982:33 - 34.
397