两阶段自适应群团抽样(two-stage ACS)是一种新兴自适应群团抽样(ACS)设计,它能在一定程度上解决自适应群团抽样最终样本量不确定的缺陷。概述两阶段自适应群团抽样方法的技术思路和原理。以实地调查的花棒数据为研究对象,进行4种两阶段自适应群团抽样方法的比较和分析,指出不跨越边界的基于Horvitz-Thompson估计量的两阶段自适应群团抽样的效果最佳。
Two-stage ACS (adaptive cluster sampling) is an extended method of ACS,and it can to a certain degree control the final sample size of ACS.The procedure and principle of two-stage ACS are presented in this paper.Based on the survey data of <i>Hedysarum scoparium</i> in the western China,the simulation results of four different two-stage adaptive cluster samplings are compared and analyzed.It is showed that the Two-stage ACS,that is based on the modified Horvitz-Thompson estimator,is most effective,in which the clusters are not allowed to overlap primary unit.
全 文 :第 !" 卷 第 " 期
# $ % $ 年 " 月
林 业 科 学
&’()*+(, &(-.,) &(*(’,)
./01!"!*/1"
2345!# $ % $
两阶段自适应群团抽样在沙漠边缘
植被调查中的比较!
朱光玉%!#6雷渊才%
"%1中国林业科学研究院资源信息研究所6北京 %$$$7%#
#1中南林业科技大学林业遥感信息工程研究中心6长沙 !%$$$!$
摘6要!6两阶段自适应群团抽样"WZ/]KWEFM,’&$是一种新兴自适应群团抽样",’&$设计!它能在一定程度上解决
自适应群团抽样最终样本量不确定的缺陷% 概述两阶段自适应群团抽样方法的技术思路和原理% 以实地调查的
花棒数据为研究对象!进行 ! 种两阶段自适应群团抽样方法的比较和分析!指出不跨越边界的基于 P/U[HWa]
+L/O\K/4估计量的两阶段自适应群团抽样的效果最佳%
关键词&6自适应群团抽样# 两阶段自适应群团抽样# P/U[HWa]+L/O\K/4估计量# PE4KM4]P3UZHWa估计量
中图分类号! &8<71#666文献标识码!,666文章编号!%$$% A8!99"#$%$#$" A$$8% A$8
收稿日期& #$$9 A%# A$!# 修回日期$%$ A$! A$"%
基金项目& 国家自然基金项目"=$<%$%$=%7<$’科技部社会公益研究专项"#$$
! 感谢第 % 作者导师中国林业科学研究院资源信息研究所唐守正研究员对本文的精心指导%
!(J2#1,’($#J($% Q,)&1&$*Q&’,%$’()9@(5+*#%&=4#2*,<&!-7’*&1
+#J2-,$% ,$T&%&*#*,($+71<&/ ,$Q&’&1*N4%&
fL3 I3E4FX3%!#6-MHG3E4YEH%
"%1*+%,-,.,$/01/’$%,#$%/.’($%*+0/’=&,-/+ I$()+-e.$%! 7816?$-@-+4 %$$$7%#
#1#$%$&’() 7$+,$’/01/’$%,’5#$=/,$>$+%-+4 *+0/’=&,-/+ 2+4-+$$’-+4 !7$+,’&3>/.,) J+-<$’%-,5/0
1/’$%,’5&+6 I$()+/3/4567)&+4%)& !%$$$!$
=>’*1#0*&6+Z/]KWEFM,’& "EVE\WH[MY03KWMUKEO\0H4F$ HKE4 M_WM4VMV OMWL/V /T,’&! E4V HWYE4 W/EYMUWEH4 VMFUMM
Y/4WU/0WLMTH4E0KEO\0MKHaM/T,’&5+LM\U/YMV3UME4V \UH4YH\0M/TWZ/]KWEFM,’& EUM\UMKM4WMV H4 WLHK\E\MU5BEKMV /4
WLMK3U[MXVEWE/TH$65%&’.=%(/E&’-.=H4 WLMZMKWMU4 ’LH4E! WLMKHO30EWH/4 UMK30WK/TT/3UVHTMUM4WWZ/]KWEFMEVE\WH[M
Y03KWMUKEO\0H4FKEUMY/O\EUMV E4V E4E0XaMV5(WHKKL/ZMV WLEWWLM+Z/]KWEFM,’&! WLEWHK^EKMV /4 WLMO/VHTHMV P/U[HWa]
+L/O\K/4 MKWHOEW/U! HKO/KWMTMYWH[M! H4 ZLHYL WLMY03KWMUKEUM4/WE0/ZMV W//[MU0E\ \UHOEUX34HW5
?&/ @(14’&6EVE\WH[MY03KWMUKEO\0H4F# WZ/]KWEFMEVE\WH[MY03KWMUKEO\0H4F# P/U[HWa]+L/O\K/4 MKWHOEW/U# PE4KM4]
P3UZHWaMKWHOEW/U
66对于稀少’积聚群团状总体!+L/O\K/4 "%77$$
提出了一种新的抽样设计!自适应群团抽样
"EVE\WH[MY03KWMUKEO\0H4F!,’&$% 随后!出现了多种
自适应群团抽样设计!如分层自适应群团抽样
"+L/O\K/4! %77%$’两阶段自适应群团抽样"&E0MLH
$,&35!%778E$’两相自适应群团抽样"gM0H_]QMVH4E$,
&35!#$$!$等!并且被广泛用于各种领域"+3U‘ $,&35!
#$$<$%
两阶段抽样有着悠久的历史和广泛的应用领域
"&E0MLH$,&35!%778^$% 但是两阶段自适应群团抽样
的研究却比较少% &E0MLH等"%778^$描述了两阶段
自适应群团抽样设计!初级单元采用不放回简单随
机抽样!然后!在每个初级单元中!对次级单元进行
适应性群团抽样% 设计中提出了 # 种适应性抽样计
划& %$ 群团允许横跨初级单元边界的设计# #$ 群
团不允许横跨初级单元边界设计%
Q3W0E‘ 等"#$$#$提出了调整的两阶段自适应
群团抽样设计!将总体中的网络分成两大类& 大网
络和小网络!如果网络单元个数大于临界值 7&%!则
为大网络!反之则为小网络% 对小网络进行一阶段
适应性抽样!对大网络进行两阶段抽样%
&E0MLH等 "#$$<$阐述了不考虑邻域的两阶段
序贯抽样!初级单元采用不放回简单随机抽样!然
后!在每个初级单元中!对次级单元也采用不放回简
林 业 科 学 !" 卷6
单随机抽样!如果抽取的次级单元至少有 % 个单元
满足某一条件"如大于临界值 7&$!则对该初级单
元!再进行不放回简单随机抽样%
为了探讨两阶段自适应群团抽样设计的适用
性!本文以内蒙古磴口县巴彦高勒镇西南约 9 ‘O!
乌兰布和沙漠边缘地区为研究区!该地区的珍稀植
物花棒"H$65%&’.=%(/E&’-.=$!分布稀少且呈群团
状!所以选取花棒为具体对象!利用 .B"1$ 编制的
抽样程序!对调查的花棒数据进行了多次模拟试验!
并对这 ! 种两阶段自适应群团抽样种设计的效率做
了比较! 寻求最佳的’ 适用于花棒调查的抽
样设计% 66
%6两阶段自适应群团抽样的原理与方法
对于稀少’集聚总体的参数估计!自适应群团抽
样",’&$是一种非常有效的抽样方法% 然而!也存
在的一些问题& %$ 最终样本的不确定性!因此对于
给定效率的情况!适应性抽样有其局限性# #$ 当临
界值选取不当时!可能导致最终样本量过大或过小#
=$ 样本单元调查时!可能会因为单元之间的距离!
耗时太多% 而两阶段自适应群团抽样!可以合理的
解决上述问题%
两阶段自适应群团抽样是对次级"二阶$单元
进行适应性群团抽样计划!它包括 # 种适应性抽样
方式!一种是不可以跨越初级"一阶$单元的适应性
群团抽样!另一种是可以跨越初级"一阶$单元的适
应性群团抽样% 针对这 # 种抽样设计! &E0MLH等
"%778^$设计了 # 种相应的无偏估计量& 一种是修
正的 P+"P/U[HWaE4V +L/O\K/4$两阶段 ,’& 估计
量!另一种是修正的 PP"PE4KM4 E4V P3UZHWa$两阶
段,’&估计量%
CBCD相关概念
邻域或邻近"4MHFL^/UL//V$’网络"4MWZ/U‘$’边
缘单元’群团’自适应群团抽样的概念和自适应群团
抽样的相关估计量公式见 +L/O\K/4"%77$$’雷渊才
等"#$$8$!本文采用一阶邻域%
由群团和网络的定义可以知道!总体可以划分
为网络之并!各网络相互独立# 而群团则并一定相
互独立!因为不同的群团可能有共同的边缘单元%
所以!当样本量一定时!群团的包含概率是未知的或
边缘单元的交叉包含概率是未知的!而最初样本单
元与网络交叉的包含概率是可以确定的% 正是因为
网络之并构成总体!网络的相互独立性!+L/O\K/4
" %77$ $ 将 部 分 包 含 概 率 " \EUWHE0H4Y03KH/4
\U/^E^H0HWHMK$ 引入了 P/U[HWa]+L/O\K/4 估计量和
PE4KM4]P3UZHWa估计量!得到了基于网络的修正的
P+估计量和PP估计量!因此网络相互独立’同分
布是这 # 种方法的应用前提%
图 %6两阶段自适应群团抽样
gHF5%6+Z/]KWEFMEVE\WH[MY03KWMUKEO\0H4F
两阶段自适应群团抽样& 假定总体中有 AI个
单元!依据需要将总体划分成 F 个初级单元
"\UHOEUX34HWK$!这样每个初级单元包括 A-个次级
单元"KMY/4V 34HWK$ "如图 % 所演!总体单元 AI k
#<"!初级单元F O9!每个初级单元所包含的次级
单元个数相等!A-O=# $% 首先采用等概率或不等
概率抽取=个初级单元"图中标记,所在的单元即
为最初抽取的样本单元$!然后!在所抽取的 =个初
级单元中!分别抽取 +-个次级单元!依据适应性抽
样原则!当抽取的次级单元的观测值满足条件 7
"如大于临界值 7&$时!其相邻"预先定义$的额外
单元也应入样% 按照这种运行规则!如果额外单元
也满足条件7"如大于临界值 7&$!与额外单元相
邻的单元也应入样!直至遇到不满足条件的额外单
元!抽样才停止!这种抽样称为跨越边界的两阶段自
适应群团抽样% 如果是不跨越边界的两阶段自适应
群团抽样!当额外单元处于一阶单元边界时!抽样就
会停止# 否则!直至遇到不满足条件的额外单元!抽
样才停止%
网络’群团和包含概率等概念与自适应群团抽
样一致%
两阶段自适应群团抽样有 ! 种不同的抽样
设计&
%$ 跨边界基于修正的 PP估计量的两阶段自
适应群团抽样#
#$ 跨边界基于修正的 P+估计量的两阶段自
适应群团抽样#
=$ 不跨边界基于修正的 PP估计量的两阶段
自适应群团抽样#
!$ 不跨边界基于修正的 P+估计量的两阶段
自适应群团抽样%
#8
6第 " 期 朱光玉等& 两阶段自适应群团抽样在沙漠边缘植被调查中的比较
CBAD跨越边界的抽样设计
通常情况下每个初级单元 A-所包含的单元数
是相等的% 单元" -!@$表示第-个初级单元中的第@
个次级单元!用 5-@表示单元观测值% 令 I- O
#A-@O%5-@为初级单元-中的单元观测值总和" 5$%I
O#A-@O%I-为总体单元值总和% 总体单元均值为 ’
OIZAI%
在抽样的第一阶段!从F个初级单元中不放回
随机抽取=个初级单元!在第二阶段从第一阶段抽
取的初级单元 -"-O%!#!/!=$中!不放回随机抽
取 +-个次级单元!则 +$ O#=-O%+-!为最初样本总
量%当=OF时!即为分层抽样设计% 以下对两阶
段自适应群团抽样的原理介绍中!抽样的第一阶段
和第二阶段最初样本量的抽取中!均采取不放回简
单随机抽样%
不考虑最初抽样单元 " \UHOEUXKEO\0H4F34HW!
d&m$的边界!将AI个单元分割成9个网络%
%1#1%6修正的P+估计量6由+L/O\K/4 "%77$$得
总体均值估计 -’&
-’OAR%I#
9
PO%
5!PdP
&9
! "%$
总体均值方差[EU"-’$为
[EUi "-’$ OAR#I#
9
PO%
#
9
PjO%
5!P5!Pj"&99jR&9&9j$Z"&9&9j$!
.)的方差估计量为
[EUi "-’$ OAR#I#
P
PO%
#
P
PjO%
5!P5!Pj"&PPjR&P&Pj$Z"&PPj&P&Pj$!
"#$
其中! 9为总体网络单元数! P为抽取的网络单元
数! dP为随机变量" dPO%或dPO$ $!dPO%表示
网络P被抽中!否则!网络P未被抽中%&P表示网络P
被抽取的包含概率!&PPj表示网络 P和网络 Pj被同
时抽取的包含概率!5!P!5!Pj表示网络 P中所有单元
值之和!&P和&PPj的计算见 &E0MLH等 "#$$<$%
%1#1#6修正的PP估计量6E-为初级单元的包含
概率!E-@为初级单元-和初级单元@都入样的包含概
率!8-@为包含单元" -!@$的网络!8-@3表示网络8-@位
于初级单元3的部分%0-@"表示初级单元样本 +$ 落入
网络8-@中的单元数!0-@"O#
F
3O%
0-@3!0-@"可能为 $% 因此
其均值估计为&
-’OAR%I#
F
-O%
#
A-
@O%
5-@0-@"Z2"0-@"$! "=$
2"0-@"$ O#
F
3O%
+3&-@3E3ZA3% "!$
66由公式"=$中的5-@0-@"可知!网络8-@与最初样本
单元交叉了0-@"次!则-’为与最初样本交叉的所有网
络的全部单元的加权和!有些网络可能交叉多次%
由于2"0-@"$对于网络8-@中的所有单元是相等的!且
+-O$ 表示最初样本单元在第一阶段抽样中没有被
选中!因此有
-’O%AI#
F
-O%
#
+-
@O%
%
20( )-@"
#
-j!( )@j/8-@
5( )-j@j
O%AI#
=
-O%
#
+-
@O%
c-@
20( )-@"
!
其中!c-@表示网络8-@单元值之和%
为了求出 -’的方差!可以将上式后面部分表示
为两阶段的样本均值&
-’O %AI#
=
-O%
A-.(( )- ZE-! "<$
其中!.(-O#
+-
@O%
(-@Z+-!(-@OE-+-c-@Z0A-2"0-@"$1!当E-
和 +-ZA-对于所有的初级单元!它们都相等时!(-@O
c-@Z#3&-@3即为单元 -!( )@所在网络的均值"网络8-@
的均值$% 当所有的 E-一致时!即分层简单随机抽
样% 由于感兴趣的目标变量转化为(-@!可以得到均
值的方差&
[EU-( )’ O
%
A#I
F
-O%
#
F
-jO%
Q-Q-j
E-jRE-E-j
E-E
( )
-j
T %
A#I
F
-O%
f-
E-
!
其中!E-jOE-!f-OA- A-R+( )-!
#
-Z+-%
Q- O#A-@O%(-@!0Q- OQ-ZA-!!#- O#
A-
@O%
"(-@ R
0Q-$
#ZA-R( )% !分别为总体总和’总体均值和总体
方差%对于初级单元-!方差无偏估计公式为&
[EUi -( )’ O
%
A#I
=
-O%
#
=
-jO%
A-A-j.(-.(-j
E-jRE-E-j
E-E-jE
( )
-j
T
%
A#I
=
-O%
kf-
E-
! ""$
其中!kf-OA- A-R+( )-%
#
-Z+-!
%#- O# +--O% (-@R0(( )- #Z+-R( )% %
如果初级单元的选取采用不放回简单随机抽
样!则E-O=ZF!E-jO= =R( )% ZF FR( )% !方差
公式可转化为&
[EU-( )’ O
%
A#I
F( )FR=
!#F
= T
%
A#I
F
=#
F
-O%
f-! "8$
其中! !#F O#F-O%"Q- R0Q"$ #ZFR( )% !0Q" O
#F-O%Q-ZF%无偏估计公式""$的可转化为&
=8
林 业 科 学 !" 卷6
1[EUk( )’ O
%
A#I
F( )FR=
%#F
=T
%
A#I
F
=#
=
-O%
kf-! "9$
其中!%#F O#=-O%"A-(-R#
=
-O%
A-(-Z=$
#Z=R( )% %
CBED不跨越边界的抽样设计
%1=1%6修正的P+估计量6总体均值估计 -’为&
-’O %AI
F#
=
-O%
k)-Z=-! "7$
式中!k)-O#9-PO%5!-P*-PZ&-P%9-和5!-P分别表示初级单
元-中的网络数和网络 P的单元值之和!下式中 &-P
表示最初样本中的单元与初级单元 -中的网络 P相
交的概率%&-PPj表示最初样本中的单元与初级单元-
中的网络P和网络Pj都相交的概率%
&-P O% R7
+-
A-RG-PZ7
+-
A-% "%$$
&-PPjO&-PT&-PjR"% R7
+-
A-RG-PRG-PjZ7
+-
A-$% "%%$
66由于2"*-P$ O&-P!2"k)-$ O)-!且 k’% 是无偏的!
总体均值估计方差公式为&
[EU-( )’ O
%
A#I
F( )FR=
!#F
= T
%
A#I
F
=#
F
-O%
f-%
不同的是&
f-O#
9-
PO%
#
9-
PjO%
5!-P5!-Pj &-PPjR&-P&( )-Pj Z&-P&( )-Pj !
!#F O#F-O% )-R2( ))#ZFR( )% !
2)O#F-O%)-ZF%
式中f-为2)的方差估计量!因此!如果P-O$则f-O
$%其方差无偏估计仍为&
[EUi k( )’ O
%
A#I
F( )FR=
%#F
=T
%
A#I
F
=#
=
-O%
kf-% "%#$
不同的是&
kf-O#
P-
PO%
#
P-
PjO%
5!-P5!-Pj &-PPjR&-P&( )-Pj Z&-P&-Pj&( )-PPj !
%#F O#F-O% )-R#
=
-O%
k)-( )Z= #Z=R( )% !
式中5!-P!5!-Pj分别表示网络P与Pj的单元值之和%
%1=1#6修正的 PP估计量6不跨越边界修正的
PE4KM4]P3UZHWa估计量与跨越初级抽样单元边界的
估计量公式是一致的!只是被抽中的网络经过修剪!
相应的参数值也会变化%
#6研究区概况与数据采集
ABCD研究区概况
本研究地点位于内蒙古自治区磴口县境内!地
处内蒙古西部!属于黄河河套地区!灌溉农业发达!
境内自然环境分割明显!西部为沙漠戈壁% 研究区
为黄河西岸绿洲向乌兰布和沙漠过渡区!分布有典
型的沙地植被!是林业治沙技术试验区% 根据项目
区的生态系统结构’功能及其环境特点!在研究区选
择具有典型代表性质的稀少且呈群团状的沙漠植被
类型% 试验区总面积为 %$$ LO#%
研究区植被隶属亚非荒漠植物区!亚洲中部区!
阿拉善省!东阿拉善州% 阿拉善荒漠省的东界就在
乌兰布和沙漠的东缘!也就是亚洲中部荒漠区与草
原区的分界线!而且是极为重要的植物地理学分界
线% 沙漠植物基本上都是沙生’旱生’盐生类灌木和
小灌木组成!这些植物对当地生境有极强的适应性
和抗 逆 性% 植 被 以 天 然 灌 木 白 刺 " A-,’&’-&
,&+4,/’.=$为主!主要分布在圆锥沙丘!人工种植沙
枣 " 23&$&4+.% &+4.%,-0/3-& $’ 梭 梭 " H&3/G53/+
&==/6$+6’/+$和肉苁蓉 "7-%,&+()$6$%$’,-(/3&$等%
乔木有沙枣% 灌木主要有白刺’梭梭’柽柳"I&=&’-G
()-+$+%-%$’花棒’盐爪爪"9&3-6-.=0/3-&,.=$’柠条锦
鸡儿 " 7&’&4&+& P/’%)-+%P-$ 和 沙 蒿 " 8’,$=-%-&
/’6/%-(&$等% 草本植物主要有沙米 "84’-/E)53.=
%e.&’/%.=$’ 芦 苇 " !)’&4=-,$%&.%,’&3-%$’ 沙 鞭
"!%&==/()3/& <-3/%& $’ 沙 地 旋 覆 花 " *+.3&
%&3%/3/-6$%$’苦豆子">/E)/’& &3/E$(.’/-6$%$’细叶砂
引草"F$%$’%()=-6-& %-;-’-(& [EU5&+4.%,-/’$’雾冰藜
"?&%-& 6&%5E)53&$’盐地碱蓬">.&$6& %&3%&$’苦苣
菜">/+().%/3$’&($.%$和猪毛菜">&3%/3& (/3-+&$等%
ABAD样地设置与数据采集
首先在调查区内!选择具有代表性的稀少且呈
群团状样地作为试验大样地!大样地设置为方形!面
积为 % $$$ Oj% $$$ O!在该大样地内按行"编号依
次为 $!%!#!/$列"编号依次为 ,!B!’!/$交叉设
置 %$$ 块样地!面积为 %$$ Oj%$$ O% 方形样地 !
个边界测量以样地的边界西南角为起点!然后用全
站仪实测各测点的距离和三维坐标%
在每个样地内再依次细分设置小样方 %$$ 个!
面积为 %$ Oj%$ O% 每个样方的境界测量精度原
则上要求达到 %e%$$!即每 %$ O的误差为 %$ ;#$
YO% 小样方均以样地的左下角点为编号起点!向右
"由西向东$’向上"由北向南$按行列编号%
#1#1%6样地基本因子调查6各样地"%$$ Oj%$$
O$的基本因子调查内容主要包括样地编号’样地面
积’每个样地的 ! 个地面控制点坐标点的三维地理
坐标’样地在大样地的位置图’小地形’土壤类型’土
层厚度"YO$’优势种’起源’林种’权属’造林时间’
株行’植被类型’设置者’设置日期等内容%
#1#1#6样地乔木#灌木等因子调查6样地的因子调
!8
6第 " 期 朱光玉等& 两阶段自适应群团抽样在沙漠边缘植被调查中的比较
查是分别基于以每个小样方"%$ Oj%$ O$为单位
进行乔木’灌木植物各因子的调查!根据样方的调查
结果即可统计整个样地的乔木’灌木植物等各调查
因子种类’数量及分布情况%
#1#1=6花棒总体分布6本文以花棒数据作为研究
总体!其分布状况如图 #% 本文以小样方"%$ Oj%$
O$为最小单元!以单元内花棒株数为感兴趣的研究
指标% 由于花棒株数的总体分布表数据太多"%$$
j%$$$!共有 % $$$ 个最小单元!故没有在此显示出
来!而以花棒平面坐标图显示其分布状况!原点为样
地西南角点!横坐标为东西方向!纵坐标为南北方
向% 由图 # 分析可以得知& 花棒分布稀少’集聚成
群且分布广泛%
图 #6花棒总体分布
gHF5#6CHKWUH^3WH/4 /TH"%(/E&’-.=\/\30EWH/4
=6模拟试验设计方案
将总体"%$ $$$ Oj%$ $$$ O$分为 %$$ 个初级
单元"%$$ Oj%$$ O$!每个初级单元包括 %$$ 个次
级单元"小样方& %$ Oj%$ O$% 总体总值为 # %$9
株!总体均值为每个单元 $1#%% 株!总体单元的方差
为 81$$% 邻域的定义采用一阶邻域!临界值 7& O
$!扩充条件7l7&%
模拟试验以两阶段简单不放回抽样’跨边界修
正的PP两阶段不放回自适应群团抽样’跨边界修
正的 P+两阶段不放回自适应群团抽样’不跨边界
修正的PP两阶段不放回自适应群团抽样和不跨边
界修正的P+两阶段不放回自适应群团抽样为研究
对象%
EBCD样本量
对 8 种不同的样本量进行重复抽样! <$ U+-"+-
O!!"!9!%$$!<$为抽取的初级单元个数!+-为抽取
的次级单元个数%
EBAD抽样重复次数
对这 ! 种不同样本量!设计了 %7 种"%$$!#$$!
=$$! !$$! <$$! "$$! 8$$! 9$$! 7$$! % $$$! # $$$!
= $$$! ! $$$! < $$$! " $$$! 8 $$$! 9 $$$! 7 $$$ 和
%$ $$$次$不同重复抽样次数的模拟抽样方案% 本
研究总共进行了 8" 次抽样模拟试验%
EBED程序设计
本次抽样模拟工具!采用的是自编的程序% 开
发语言为.B"1$%
由于抽样设计的中英文名太长!在图中显示不
便!所以!在此处对各种抽样设计估计量参数做一个
临时的简捷表示%
图 =!! 中的横坐标表示重复抽样次数!纵坐标
表示重复抽样得到的参数% 图中的 <$ U+-"+-O!!
"!9!%$ $表示最初样本总量!<$ 表示抽取的最初单
元数! +-表示抽取的次级单元数% 图中的m表示两
阶段抽样的均值估计的期望!PP表示跨越边界
PP,’& 均值估计的期望!PP% 表示不跨越边界
PP,’&均值估计的期望!P+表示跨越边界 P+,’&
均值估计的期望!P+% 表示不跨越边界P+,’&均值
估计的期望% 图中的 .表示两阶段抽样的方差估
计的期望!.P表示跨越边界PP,’& 方差估计的期
望!.P% 表示不跨越边界PP,’& 方差估计的期望!
.+表示跨越边界 P+,’& 方差估计的期望!.+% 表
示不跨越边界P+,’&方差估计的期望%
!6结果与分析
OBCD样本均值分析
由图 = 分析可知& 随着样本量的增加!均值估
计的期望!开始呈波浪型曲线!然后逐渐趋向于常
数!除了不跨越边界 PP,’& 均值估计的期望没有
明显接近总体均值!其他 ! 种方法均值估计的期望
均趋向于总体均值% 这表明模拟试验从实际上验证
了这 < 种抽样方法的无偏性%
OBAD样本方差分析
此处的方差是指!重复抽样得到的方差估计的
期望% 由图 ! 分析可知& %$ 两阶段简单随机抽样
方差估计的期望波动比较大!且其方差估计的期望
始终远大于其他 ! 种抽样的方差估计的期望# #$
除了两阶段简单随机抽样!其他 ! 种抽样的方差估
计的期望一直比较稳定!且趋近于 $% 这些说明!两
阶段自适应群团抽样比简单的两阶段抽样方法
要好%
OBED综合分析
由样本均值分析可以!无法判断 ! 种两阶段自
<8
林 业 科 学 !" 卷6
适应群团抽样的优劣!所以!需要进一步对它们的样
本方差估计期望% ! 种两阶段自适应群团抽样"跨
边界修正的 PP两阶段不放回自适应群团抽样
"PP,’&$’跨边界修正的 P+两阶段不放回自适应
群团抽样’不跨边界修正的 PP两阶段不放回自适
应群团抽样和不跨边界修正的 P+两阶段不放回自
适应群团抽样$的样本方差估计期望的均值依次
为& $1%$9 方差估计期望的均值越小!说明其对应的抽样
方法效率越高% 这 ! 种抽样方法的优越性从高到低
的顺序为& 不跨边界P+,’&%’跨边界 P+,’&’不跨
边界PP,’&%’跨边界PP,’&%
图 =6均值估计期望
gHF5=6)_\MYWEWH/4 /TOME4 MKWHOEWM
图 !6方差估计期望
gHF5!6)_\MYWEWH/4 /T[EUHE4YMMKWHOEWM
<6结论
以花棒数据研究对象!通过对 ! 种方法的模拟
研究得出以下结论%
%$ 通过对样本均值的分析!可知& 随着样本量
的增加!均值估计的期望!开始呈波浪型曲线!然后
逐渐趋向于常数% 表明模拟试验从实际上验证了这
< 种抽样方法的无偏性%
#$ 通过对样本方差分析和样本方差估计期望
的分析!得出针对研究区植被花棒!这 < 种抽样设计
"8
6第 " 期 朱光玉等& 两阶段自适应群团抽样在沙漠边缘植被调查中的比较
的效率排序从高到低依次为& 不跨边界P+,’&%’跨
边界P+,’&’不跨边界PP,’&%’跨边界PP,’&’简
单两阶段抽样%
=$ 不跨越边界的设计优于跨越边界的设计%
参 考 文 献
雷渊才!唐守正5#$$85适应性群团抽样技术在森林资源清查中的应
用5林业科学!!="%%$& %=# A%=95
CUX[MU,5#$$=5dMUT/UOE4YM/TEVE\WH[MY03KWMUKEO\0H4FMKWHOEW/UKH4 E
O30WH[EUHEWMKMWH4F5)4[HU/4OM4WE0E4V )Y/0/FHYE0&WEWHKWHYK!%$& %$8
A%%=5
gM0H_]QMVH4EQ P! +L/O\K/4 & D5#$$!5,VE\WH[MY03KWMUV/3^0M
KEO\0H4F5BH/OMWUH‘E! 7%"!$& 988 A97%5
Q3W0E‘ P!DLE4 ,5#$$#5,Vh3KWMV WZ/]KWEFMEVE\WH[MY03KWMUKEO\0H4F5
)4[HU/4OM4WE0E4V )Y/0/FHYE0&WEWHKWHYK!7& %%% A%#$5
N/YY/)5#$$=5’/4KWUEH4MV H4[MUKMEVE\WH[MY03KWMUKEO\0H4F52/3U4E0/T
oTHYHE0&WEWHKWHYK!%7& !< A<85
&E0MLHQ! &M^MUI5%778E5,VE\WH[MY03KWMUKEO\0H4FZHWL 4MWZ/U‘K
KM0MYWMV ZHWL/3WUM\0EYMOM4W5BH/OMWUH‘E!9!& #$7 A#%75
&E0MLHQ! &M^MUI5%778^5+Z/]KWEFMEVE\WH[MY03KWMUKEO\0H4F5
BH/OMWUHYK!<=& 7<7 A78$5
&E0MLHQ!&OHWL N5#$$<5+Z/]KWEFMKMR3M4WHE0KEO\0H4F&E4MHFL^/UL//V]
TUMMEVE\WH[MKEO\0H4F\U/YMV3UM52/3U4E0/T,FUHY30W3UE0! BH/0/FHYE0
E4V )4[HU/4OM4WE0&WEWHKWHYK!%$& 9! A%$=5
+L/O\K/4 &5%77%5&WUEWHTHMV EVE\WH[MY03KWMUKEO\0H4F5BH/OMWUH‘E!89
"#$& =97 – =785
+L/O\K/4 &5%77$5,VE\WH[MY03KWMUKEO\0H4F52/3U4E0/TWLM,OMUHYE4
&WEWHKWHYE0,KK/YHEWH/4!9<& %$<$ – %$<75
+3U‘ d!B/U‘/ZK‘H225#$$<5,UM[HMZ/TEVE\WH[MY03KWMUKEO\0H4F& %77$
A#$$=5)4[HU/4OM4WE0E4V )Y/0/FHYE0&WEWHKWHYK! %#"%$& << A7!5
!责任编辑6郭广荣"
88