全 文 :收稿日期: 20030618
基金项目: 948项目 数字林业关键技术引进,项目编号: 200113
作者简介: 李永慈( 1965 ) ,女,北京林业大学资源与环境学院在读博士,副教授.
林业科学研究 ! 2004, 17( 3) : 279~ 283
Forest Research
! ! 文章编号: 10011498( 2004) 03027905
用Mixed和Nlmixed过程建立混合生长模型
李永慈1 , 唐守正2
( 1 北京林业大学资源与环境学院,北京 ! 100083; 2 中国林业科学研究院资源信息研究所,北京 ! 100091)
摘要: 本文用 5块不同密度样地的树高生长资料,根据线性和非线性混合模型理论,利用 SAS的 Mixed
过程和 Nlmixed 过程,分别拟合线性混合模型和非线性混合树高生长模型。根据预测值和固定效应同
时绘制出不同密度下的高生长曲线和平均高生长曲线,充分显示了混合模型的优势,即它可以同时反
映总体的平均变化趋势和个体之间的差异。
关键词: 混合模型;随机效应 ;固定效应; 生长模型
中图分类号: S7585 ! ! ! 文献标识码: A
混合模型是近代发展起来的新的统计方法,很多通常的统计模型可以看作混合模型的特
例。在混合模型中, 固定效应是描述总体平均变化趋势, 随机效应是描述从总体中抽取的个
体。混合模型主要用来研究分组数据中因变量和自变量的关系,它的优势在于它的灵活性,它
既可以反映总体的平均变化趋势,又可以反映个体之间的差异。目前国外统计分析软件 SAS
系统和 SPLUS的最新版已经先后推出线性和非线性混合模型模块 , SPSS 系统的最新版也提
供了线性混合模型的功能,但是还没有提供非线性混合模型的功能。混合模型在农业、生态、
经济、制造等行业有着广泛的应用,早在 20世纪 70年代国外就有人开始用混合模型研究生长
模型,然而国内介绍混合模型理论和软件应用的文献较少, 用混合模型研究生长模型在国内还
是一个空白。本文的目的在于介绍如何应用 SAS的 Mixed和Nlmixed过程建立混合生长模型。
1 ! 混合模型
混合模型分为线性混合模型和非线性混合模型。线性混合模型比广义一元线性模型多了
随机参数部分, 当随机参数的设计矩阵恒等于零时,它就退化为广义一元线性模型。非线性混
合模型中,部分或全部的固定效应和随机效应在模型中与因变量呈非线性关系,因此它可以看
成线性混合模型的推广; 同时它又可以看成非线性回归模型的推广, 因为它可以看成是将随机
效应引入非线性回归模型而得到的。
11 ! 线性混合模型
给出两水平的线性混合模型, 这个模型很容易推广到多水平的情形。
因变量 yij是一个n ij维的向量,可以表示为 yij = X ij+ Z i, jbi + Zijbij + ij , i= 1, ∀,M , j= 1,
∀, MiM 是第一水平的组数,M i 是第一水平的第 i 组中第二水平的组数。 bi ~ N ( 0, G1 ( G
1
) ) ,
bij ~ N ( 0, G2 ( G
2
) ) , ij ~ N ( 0, !2I )。是p 维的固定效应向量, bi 是q 1维的随机效应向量, bij
是 q 2 维的随机效应向量, X ij ( nij # p )和 Zi, j ( n ij # q1 )、Z i, j ( nij # q2 )是固定效应和随机效应的
设计矩阵, ij是nij维的组内误差向量。
对于不同的 i , bi 是相互独立的;对于不同的 i或j , bij是相互独立的并且独立于 bi , ij是相
互独立的并且独立于 bi 和 bij。因此 yij ~ N ( X ij , Vij ( ) ) , Vij ( ) = Z i, jG1 ( G
1
) Z
T
i, j + Zij G2
( G
2
) Z
T
ij + !2I。两水平线性混合模型的扩展将对 ij ~ N ( 0, !2 I )的限制放松为 ij ~ N ( 0,
!2 ∀ij )。
12 ! 非线性混合模型
给出两水平的非线性混合模型,这个模型很容易推广到多水平的情形。
yij k= f ( #ij k , vij k ) + ij k , i= 1, ∀, M , j= 1, ∀,M i , k= 1, ∀, n ij , M 是第一水平下的组数, Mi
是第一水平下的第 i 组中第二水平的组数, nij是第一水平下的第 i 组中第二水平下第j 组的观
测数。f 是分组参数 #ijk和v ij k的实值可微函数, f 至少是 #ijk中一个参数的非线性函数。其中,
#ijk= A ij k+ B i, j kbi + Bijkbij , bi~ N ( 0, G 1 ( G ) ) , bij ~ N ( 0, G 2 ( G ) ) , ij k~ N ( 0, !2 )。用矩阵形式
可以表示为: y ij = f ij ( #ij , v ij ) + ij , #ij= Aij+ Bi , j bi + B ij bij , i= 1, ∀, M , j= 1, ∀, M i ,这里 yij=
y ij1
∃
y ijn
ij
, #ij =
#ij1
∃
#ij n
ij
, f ij ( #ij , v ij ) =
f ( #ij , v ij1 )
∃
f ( #ij n
ij
, v ij n
ij
)
, v ij =
v ij1
∃
v ij n
ij
, A ij =
A ij1
∃
A ij n
ij
, B ij =
B ij1
∃
B ijn
ij
。两水
平非线性混合模型的扩展将对 ij~ N ( 0, !2 )的限制放松为 ij~ N ( 0, !2 ∀ij )。
2 ! 实例
21 ! 数据来源
江西省大岗山实验局 5块初植密度不同的杉木( Cunninghamia lanceolata ( Lamb. ) Hook. ) ,
每个密度下选择 3块样地, 分别在 5、6、7、8、9、10、11、12、14、16年生测量优势树高。
表 1 ! 同密度下杉木优势高
年龄a 样 ! ! 地
11 12 13 21 22 23 31 32 33 41 42 43 51 52 53
5 58 54 52 56 55 55 55 51 55 50 50 52 53 48 55
6 72 67 69 70 66 66 68 61 64 58 59 60 60 60 63
7 81 76 84 81 73 76 83 71 72 67 65 69 71 69 78
8 94 86 97 90 80 90 89 82 88 75 75 77 83 80 84
9 106 94 107 100 90 102 101 87 98 82 83 85 90 91 93
10 118 99 119 112 98 114 110 95 103 88 88 94 99 98 98
11 128 108 131 116 104 120 116 102 112 94 95 100 104 104 107
12 127 110 133 122 108 130 120 107 113 96 98 102 107 108 109
14 140 117 144 134 116 140 126 116 122 104 107 112 114 122 122
16 150 123 157 143 125 152 136 130 128 120 118 118 118 128 128
280 林 ! 业 ! 科 ! 学 ! 研 ! 究 第17卷
22 ! 线性混合树高生长模型
林业上常用的苏玛克模型 y= 1exp( 2 ( 120- 1x ) )的对数形式是线性的, ln( y ) = ln( 1 )
+ 2 ( 120- 1x ) ,用 y 来记 ln( y ) ,用 1 来记 ln( 1 ) ,用 x 来记120- 1x ,得 y= 1+ 2 x。初
植密度是要考虑的一个水平,因此这是一个单水平的线性混合模型。yi = ( 1+ b 1i ) + ( 2+
b2i) x i + i , i = 1, ∀, 5。其中 b1i、b2 i 是随机效应, 记 bi = b1i
b2i
, 假定 bi ~ N ( 0
0
,
sb1 s12
s 12 sb2
) , i ~ N ( 0, !2 I ) 对于每个组的 X i ( 30 # 2 ) 与 Zi ( 30 # 2 ) 相同, 都等于
1 - 015
1 - 015
1 - 015
1 - 0116 7
∃ !
1 - 0012 5
。用SAS的Mixed过程拟合这个线性混合模型。
proc mixed data= sumake1;
class plot;
model y= xs outp= a;
random intercept xtype= un subject= plot s;
run;
估计结果为: 1 = 2645 2, 2 = 6655 8, b 11 = 0079 21, b21 = - 0085 03, b 12 - 0072 61,
b22= 0436 8, b13 = 0077 51, b23 = 1196 8, b14= - 0119 9, b24= - 0221 5, b15= - 0109 4, b25
= - 1327 1, sb 1= 0008 364, sb2= 0040 32, s12= 0025 21, !2= 0003 053。由预测结果做出的
5种不同密度下的高生长曲线和由固定效应所得的平均生长曲线如图 1。
23 ! 非线性混合树高生长模型
非线性树高生长模型选择林业上常用的 Logist ic模型 y= 1( 1+ 2exp( - 3x ) )。初植密
度是需要考虑的一个水平,因此这是一个单水平的非线性混合模型。yij = ( 1+ b1i )( 1+ ( 2
+ b2i ) exp( - ( 3+ b3 i ) xij ) ) + ij , i= 1, ∀, 5, j= 1, ∀, 10,其中 b1i、b2i、b3i是随机效应, 记 bi=
b1i
b2i
b3i
,假定 bi ~ N (
0
0
0
,
sb1 s12 s13
s12 sb2 s23
s13 s23 sb3
) ,ij~ N( 0, s)。用 SAS的Nlmixed过程拟合这个非线
性混合模型。
proc nlmixed data= modellyc;
parms beta1= 138 ! beta2= 67 ! beta3= 03 ! sb1= 0926 4 ! sb2= 1268 4 !
sb3= 0000 966 ! s12= 0 ! s13= 0 ! s23= 0 ! s= 082;
fm1= exp( - ( beta3+ b3) # x) ;
fm2= 1+ ( beta2+ b2) # fm1;
mea= ( beta1+ b1)fm2;
281第 3 期 李永慈等: 用Mixed 和Nlmixed 过程建立混合生长模型
model Ho2~ normal(mea, s) ;
random b1 b2 b3~ normal( [ 0, 0, 0] , [ sb1, s12, sb2, s13, s23, sb3] ) subject= plot ;
predict mea out= p;
估计结果为: 1= 13794 2, 2 = 6715 5, 3 = 0297 8, sb1 = 0914 6, sb2 = 1178 9, sb 3=
0000 273, sb12= 0071 12, s13= 0012 70, s23= 0011 66, s= 0339 5。由预测结果做出的 5种不
同密度下的高生长曲线和由固定效应所得的平均生长曲线如图 2。
图 2 ! 非线性 Logistic 混合模图 型的拟合图1 ! 变换后苏马克混合模型的拟合图
3 ! 结论
非线性Logistic 混合模型很好地拟合了原始树高生长过程,变换后的苏马克混合模型很好
地拟合了变换后的树高生长过程。线性混合模型允许数据之间是相关的和不等方差的, 非线
性混合模型允许用户为数据指定多种分布形式, 因此混合模型有着以往其它模型不可比拟的
优势, 就是它既可以反映总体的平均变化趋势, 又可以提供数据方差、协方差等多种信息来反
映个体之间的差异。
参考文献:
[ 1] Tang S Z,Meng F R. Analyzing parameters of grouth and yield models for Chinese f ir provenanceswith a linear mixed approach[ J] . Silvae
Genetica, 2001, 50: 140~ 145
[ 2] Jos Pinheiro,DouglasM Bates. M ixedEffects Models in S and SPLUS[ M] . SpringerVerlag New York, Inc, 2000
[ 3] SAS Institute Inc. SASSTAT User∃ s Guide Version 8[M ] . SAS Institute Inc, Cary, NC,USA, 1999
[ 4] Daniel BH, Robert L B. Modeling and prediction of forest growth variables based on mult il evel nonlinear mixed models[ J] . Forest Sci
ence, 2001, 47( 3) : 311~ 321
[ 5] 唐守正,李勇.生物数学模型的统计学基础[M ] .北京:科学出版社, 2002
282 林 ! 业 ! 科 ! 学 ! 研 ! 究 第17卷
Establishment of Tree Height Growth Model Based on
Mixed and Nlmixed of SAS
LI Yongci1 , TANG Shouzheng2
( 1College of Forest Resources and Environment, Beijing Forestry University, Beijing! 100083,China;
2Research Inst itute of Forest Resource InformationTechniques, CAF, Beijing! 100091, China)
Abstract: Based on the data of height growth in 5 plots with different densities,mixed and nlmixed of SAS were
used to fit the linear and nonlinear mixed models of tree height growth respectively. The height growth curve and
mean height growth curve under different densities were drawn according to calculated value and fixed effect val
ue, which showed the advantages of the mixed model, i. e. it could reflect the mean variation trend on the 5 plots
and the differences among individuals at the same time.
Key words: mixed model; random effect; fixed effect; growth model
283第 3 期 李永慈等: 用Mixed 和Nlmixed 过程建立混合生长模型