免费文献传递   相关文献

Accuracy Improvement in Yield Estimation of Large-scale Grassland by Stratified Sampling—-A Case Study of Lowland Meadow

地理空间分层抽样对大尺度草地估产精度的改善—-以低地草甸为例



全 文 :第 18 卷  第 3 期
Vol. 18  No. 3
草  地  学  报
ACTA AGRESTIA SINICA
   2010 年  5 月
 May   2010
地理空间分层抽样对大尺度草地估产精度的改善
   以低地草甸为例
包海明1 , 贠旭疆1, 2* , 张德罡1 , 李新一2 , 刘晓东1
( 1.甘肃农业大学草业学院 , 甘肃 兰州  730070; 2.农业部全国畜牧总站 , 北京  100025)
摘要: 为优化天然草地监测策略,提高样本点的地域空间代表性和分层估产模型的稳定性,改善全国天然草地地上
生物量的估测精度,以低地草甸草原为研究对象, 结合地面采样数据和 MODIS-NDVI 数据, 根据统计学的分层抽
样方法和全国草地资源区划原理为理论依据,通过分层效率检验、总体平均值误差对比验证和模型分析等方法, 以
低地草甸为例进行分析。结果表明:各分层区域的分层效率都大于 1; 采用分层抽样方法相对于简单随机抽样方法
地面采样样本的总体平均值精度提高 9. 672% , 模型的估产精度提高 13. 827%。从而, 验证了某一类型草地的区
域分层抽样方法比简单随机抽样方法更可取。
关键词:大尺度; 分层抽样;精度; 分层效率;优化决策
中图分类号: S812    文献标识码: A      文章编号: 1007-0435( 2010) 03-0327-06
Accuracy Improvement in Yield Estimation of Large-scale Grassland
by Stratified Sampling    A Case Study of Lowland Meadow
BAO Ha-i m ing
1
, YU N Xu-jiang
1, 2*
, ZHANG De-gang
1
, L I Xin-yi
2
, L IU Xiao-dong
1
( 1. Pratacul tu ral College, Gan su Agricultu ral University, Lan zhou, Gansu Province 730070, China;
2. Nat ional Animal Hu sban dry S ervice, M inist ry of Agricu lture, Beijin g 100025, China)
Abstract: T here are var ious types o f grassland in China and the geog raphical spat ial span of a g iv en g rass-
land type is v ery larg e. Due to dif ferent climate and so il condit ion in dif ferent areas, the situat ion of vege-
tat ive development is dif ferent f rom each other, thus these elements af fect the pr ecision of yield estimat ion
by convent ional methods. In order to optimize the monitoring st rateg y of natural grasslands, the
aboveg round biomass y ield o f low land meadow w as evaluated according to the principles of str at if ied sam-
pling method and grassland zoning in China using st rat if icat ion ef ficiency test , ov er al l average error compa-
r ing analy sis, and model analysis based on the g round measured data and MODIS-NDVI data. T he r esults
show that: the st rat if icat ion ef f iciency of each strata area w as mo re than 1; in comparison with random
sampling method, the st rat if ied sampling method improved the over all av er age accuracy by 9. 672% and
the r eg ression mode accuracy by 13. 827%. These results verify that st ratif ied sampling method could be
more recommendable than random sampling method fo r the biomass yield est imat ion of a given grassland
type.
Key words: Large-scale; St rat ified sampling ; A ccuracy; St rat ificat ion ef ficiency; Opt imizat ion str ategy
  草地类型地理空间分布跨度大的现状, 使得全
国范围的大尺度天然草地生产力估测存在诸多难
点。如有些同类型草地, 由于在地理空间上的区域
跨度非常大,不同的气候区域和月份,降水和积温对
地表植被的作用程度明显不同; 前期降水和活动积
温对植被作用的有效时间尺度也分布不均, 并与土
壤质地类型分布有关其同一时期气候条件也会呈现
较大差别 [ 1] , 因此该类型的草地在达到最高生产力
的时间上并不同步。而常规方法通常是使用同期遥
感影像按草地类型建模进行生产力估测, 会在一定
程度上导致估测该类型草地最高生产力的精度有所
降低。
科学合理的抽样方法是研究可运行的大尺度天
然草原生产力监测的关键[ 2] 。分层抽样是统计分组
收稿日期: 2009-11-20;修回日期: 2010- 04-28
基金项目:内蒙古自治区自然科学资金项目( 2009MS0414)资助
作者简介:包海明( 1982- ) ,男,内蒙古呼伦贝尔人,硕士研究生,研究方向为草地生态、管理与遥感监测, E-m ail: b hm999@ 126. com ; * 通
讯作者 Author for corr espondence, E- mail : yun xj@ cav. net . cn
草  地  学  报 第 18卷
法与抽样原理的结合,可以提高样本的代表性,而且
还可以深化对现象的认识, 满足分层次管理的需
要[ 3] ;且当分层是基于有效的先验知识时,分层抽样
能够获得比系统抽样和简单随机抽样方法高得多的
精度[ 4] 。因此,近几年数理统计分层抽样方法越来
越被各行各业所接受,如在农林普查监测,工业渔业
统计,医疗等等,并应用于管理阶层的管理分析, 分
层规划及分层管理 [ 4~ 8] , 而分层抽样统计方法在草
业科学上的应用还尚待进一步研究。
本研究在农业部 2008 年全国草原生产力地面
调查数据库的支持下, 以 NASA 网站提供的标准
MODIS-NDVI遥感影像数据库为辅助变量,设计了
基于分层抽样方法的中国天然草原生产力估测与优
化决策的遥感监测方法, 可以获取不同时间不同空
间分辨率条件下大尺度地理空间的地表植被信息,
为草原冷季草畜平衡的宏观管理决策提供及时可
靠、全面客观的草情信息。
1  材料与方法
1. 1  遥感影像的获取与处理
遥感影像为 NASA( Nat ional A eronautics and
Space A dminist rat ion)网站提供的 NASA MODIS-
NDVI 2008225. 250m_16 _days 数据。运用 ARC-
GIS-9. 3(美国 ESRI 公司) [ 9] 和 ERDAS-9. 1(美国
ESRI公司) [ 10]地理信息系统和遥感影像处理软件,
完成 MODIS数据地理坐标投影转换、研究区域的
裁切、直方图匹配、模型运算和统计等步骤。
1. 2  地面数据采集
以各省区提供的与遥感准同步的 2008 年 8 月
中下旬地面数据为实验数据, 其采集是以天然草原
类型与利用状况为基础在全国尺度下进行的, 样地
布设均匀并具有代表性, 每个样地 GPS定位, 选择
好、中、差 3个重复样方, 求出样方地上生物量的平
均值。对于草本及矮小灌木植物群落, 选择 1 m  1
m 的样方进行监测; 对于具有灌木及高大草本植物
的植物群落选择 10 m  10 m 的样方进行监测 [ 9]。
1. 3  数据对匹配
通过控制地面采样区范围, 以 250 m  250 m
的样地地上生物量信息与遥感数据的单像素值进行
对应匹配,并提取相应的 NDVI 值用于模型, 该方
法在遥感领域随着遥感影像分辨率的不断提高, 其
监测精度也随之不断精确, 优点: 提高草原监测效
率,更加科学准确具有时效性; 缺点: 遥感影像数据
受一定的天气等外界条件情况影像, 需要进一步的
做处理完善。
1. 4  数据统计分析
均值的正态性分布检验[ 11] 采用 Shapiro-Wilk
方法;区域分层抽样方法数据处理及其验证 [ 12]采用
SPSS 14. 0; MODIS-NDVI同植被地上生物量的相
关、回归分析、样本观测值与模型估测值之间差异性
检验[ 13]采用 SAS 8. 1统计软件进行。
2  天然草地分层抽样方法的依据和原理
本研究在草地类型划分的基础上, 结合区域气
候变化规律,应用统计学抽样调查理论,设计可运行
化的空间分层统计抽样方法; 以处理后的 MODIS-
NDV I遥感影像与地面调查相结合获取抽样样本,
建立分层估产模型, 分别计算各分层区域天然草地
最高生产力状况。
2. 1  天然草地地面抽样分层原理
在我国 18大类型草地中,有一大部分类型草地
分布的地理空间跨度比较大,例如: 高寒草甸类、温
性草原类、温性山地草甸类和低地草甸类等等(图1)。
  对于跨度如此大的草地类型,依据中国草地资
源的区划标准是以反映经纬度和垂直度热量带及
水湿条件的草地类为划分标准, 将全国草地划分为
7大区 [ 14] (图 2) , 包括: 1. 东北温带半温带草地草原
和草甸区; 2. 西北温带、暖温带干旱荒漠和山地草
原区; 3. 蒙宁甘温带半干旱草原和荒漠草原区; 4.
华北暖温带干湿润、半干旱暖性灌草丛区; 5. 西南
亚热带湿润热性灌草丛区; 6. 青藏高原高寒草甸和
高寒草原区; 7. 东南亚热带、热带湿润热性灌草丛
区。以低地草甸类草地为例(图 1, D) , 其主要分布
区可分为东北低地草甸区、蒙甘宁低地草甸区、西北
低地草甸区。
2. 2  分层抽样方法统计学原理
经典抽样中,分层的指导思想是使层内差异尽
量小、层间差异尽量大 [ 15] ,相对于简单随机抽样,对
某一类型天然草地采用分层抽样方法的效率主要来
源于:区域分层使层内水热条件差异变小,层间气候
变化差异变大(即:使层内空间相关性增大,层间空
间相关性减小) , 则层内方差变小, 减小了样本点的
不确定性,从而使样本点的代表性得到提高,并改善
天然草地生产力的估产精度。
328
第 3期 包海明等:地理空间分层抽样对大尺度草地估产精度的改善    以低地草甸为例
图 1 几种类型天然草地分布图
F ig. 1 Dist ribution o f sev eral t ypes o f nat ur al g rasslands
图 2  我国天然草原 7 大分区图[14]
Fig. 2 Map of seven natur al g rassland zones in China[ 14]
  注: 1. 东北温带半温带草地草原和草甸区; 2. 西北温带、暖温
带干旱荒漠和山地草原区; 3. 蒙宁甘温带半干旱草原和荒漠草原
区; 4. 华北暖温带干湿润、半干旱暖性灌草丛区; 5. 西南亚热带湿
润热性灌草丛区; 6. 青藏高原高寒草甸和高寒草原区; 7. 东南亚热
带、热带湿润热性灌草丛区
Note: 1. T em perate sem-i h umid meadow-steppe and meadow of
th e northeast . 2. T em perate and w arm-temperate desert and mon-
tane s teppe of the northw est . 3. T em perate sem-i arid steppe and
d esert- stepp e of Inner Mongolia-Ningx ia-Gansu. 4. Warm-tem perate
sem-i humid, sem-i arid h ot shru bby herb os a of the north. 5. S ub-
t ropical h umid hot shrubby tu ssock of the southw est . 6. Alpin e f rig-
id meadow and steppe of Qingh a-i T ibet Plateau. 7. S ubt ropical,
t r opical humid hot sh rubby tussock of the southeas t.
2. 3  分层构建模型的原理
按照上述的分层结果,将某类型草地划分为不
同区域作为分层的基本单元,分别采样建模,其中零
星的同类型分布于其他区域,可按临近的区域模型
代替,如果采样点充足可继续按区域分层建模。这
样可进一步增加层内采样点数据间的相关性,以及
地面实测数据与模型预测值的吻合度。
3  分层抽样方法的验证原理
3. 1  区域分层抽样方法的分层效率
分层抽样方法的核心是得到具有最高抽样效率
的分层方式, 分层效率 V 一般用相同条件下简单随
机抽样的估计精度(方差)与分层抽样的估计精度
(方差)的比值,比值越高,分层效率越高;只有当比值
大于 1时,分层抽样才会比简单随机抽样更可取[ 4]。
3. 2  总体平均值误差对比验证公式
设 A 为地理空间对象的抽样域, N 为可抽样总
体大小,抽样总体的方差为 2 , 目标量是抽样总体
的平均值 E( z )总的样本量大小为 n,离散化后的抽
329
草  地  学  报 第 18卷
样总体为 z I ( I= 1, 2, 3, , n) ,抽样比为 f = n/ N。
当采用简单随机抽样方法时, 总体平均值实际
的误差计算式为 [ 4, 17] :
E( v ran )=
1- f
n
N
N - 1 2 - cov( z i , z j ) ij ( 1)
当采用分层抽样方法时, 设分层数为 k ,第 1分
层的总体大小为 N 1 ,第 1分层的样本量为 n1 ,且 n1
+ n2 + + nk = n, 第 1分层的方差为 21 , 基于分层
抽样得到的总体平均值的误差计算式为 [ 4, 17] :
E(v str )= 1
N
2 kh= 1N 1( N1- n1 )
n1 21- cov( z i , z j ) ij (2)
采用简单随机抽样方法和分层抽样方法的总体
平均值误差作对比验证, 求分层抽样方法相对于简
单随机抽样方法的优化度
G= 1-
E( v str )
E( v ran)
 100% ( 3)
3. 3  模型预测值与实测值精度对比
利用回测数据的预测值与实测值, 求出各分层
模型相对于整体模型的精度优化度 W :
R=
 ni= 1 | Fn预- Fn实 |
n
W =
R- ( R 1+ R 2+ R3 )
R
 100% ( 4)
R 为模型预测值F预 与实测值 F实 误差均值, ( i
= 1, 2, 3, , n) , n1 , n2 , n3 为分层模型回测样本数,
n全= n1 + n2+ n3 为全国低地草甸模型的回测样本数。
4  结果与分析
4. 1  低地草甸类区域分层抽样分层效率
由表 1可知各分层区域的分层效率 V> 1, 说明
按分层区域进行分层抽样会比整体的简单随机抽样
更可取。
表 1  低地草甸类分层抽样的分层效率
T able 1 Str atification eff iciency of low land meadow type by stratified sampling
区域划分    
Zoning    
n样本数
S ample number
2 方差
Varian ce
V 分层效率
St rat ificat ion ef f icien cy
全国低地草甸类
Nat ional low land meadow
159 0. 132 1. 000
东北低地草甸区
N orth east low land meadow area
67 0. 095 1. 389
蒙甘宁低地草甸区
M ongol ia-Gan su- Ningxia low land meadow area
48 0. 101 1. 307
西北低地草甸区
N orthw est lowland meadow area
54 0. 116 1. 137
4. 2  总体平均值误差对比验证
由于本研究采用的遥感影像的分辨率为 250 m 
250 m,即一个样本所代表的面积为 250 m 250 m,则
可抽样样本的总体数为N= S/ 62500,抽样样本数为 n。
  由表 2结果可知, 优化度 G= 9. 672% > 0, 说明
低地草甸类草原采用分层抽样方法进行总体平均值
误差统计分析,相对于简单随机抽样方法,其总体平
均值精度提高了 9. 672%。
表 2  低地草甸类分层抽样方法相对于简单随机抽样方法的优化度
Table 2 Optimization degr ee by str atified sampling method of lowland meadow as oppo sed to simple random sam pling method
区域划分       
Zonin g       
S 面积( km2 )
Area
N 总体数
Overall number
n样本数
Sample number
2 方差
Variance
G优化度( % )
Opt imizat ion degree
全国低地草甸类
Nat ional lowland meadow
273760 4380162 159 0. 132 9. 672
东北低地草甸区
North east low land meadow area
144777 2316437 67 0. 095
蒙甘宁低地草甸区
M ongolia-Gan su- Ningxia low land meadow ar ea
43024 688378 48 0. 101
西北低地草甸区
Northwest low lan d meadow ar ea
85959 1375347 54 0. 116
330
第 3期 包海明等:地理空间分层抽样对大尺度草地估产精度的改善    以低地草甸为例
4. 3  低地草甸类分层估产模型建立
NDVI与草原植被生物量有较好的相关性, 可
以较好地量化草原植被的产草量特征[ 18] 。本研究
用 MODIS-NDVI与地面监测点数据构建产量估测
模型。各层内地面实测样点数据与标准同步的
MODIS-NDVI2008225. 250m _16 _days 遥感数据
拟合,得到低地草甸类各区域草产量与 NDV I的最
适回归模型。
  由表 3可知, 各区域的最适回归模型都达到了
显著性水平 P< 0. 05, 但全国低地草甸类区域的回
归模型的显著性要远远低于各分层区域的显著性
水平。
表 3  低地草甸类分层区域估产模型显著性水平
Table 3  Significance lev el o f yield estimat ion model in str atified reg ion of low land meadow
区域划分     
Zoning     
函数类型
Function type
回归模型
Regr ess ion m odel
R2
P值
P value
全国低地草甸类
Nat ional low land meadow
指数函数
E xponen tial fu nct ion
Y= 0. 043e3. 800X/ 10000 0. 351 0. 041
东北低地草甸区
North east low land meadow area
指数函数
E xponen tial fu nct ion
Y= 0. 073e3. 054X/ 10000 0. 493 0. 009
蒙甘宁低地草甸区
M ongolia-Gan su- Ningxia low land meadow area
线性函数
Linear fu nct ion
Y= 2. 045X/ 10000- 0. 590 0. 511 0. 036
西北低地草甸区
Northwest low land meadow area
线性函数
Linear fu nct ion
Y= 1. 854X/ 10000- 0. 221 0. 540 0. 013
4. 4  低地草甸类分层估产模型误差检验
将预留 25%的样点, 应用 SAS 软件中均值的
双样本成对 T 检验 [ 13] ,分别对各分层模型的估测值
与样本实测值结果进行显著性检验。
  回测结果显著性检验结果表明(表 4) , 虽然各
区域天然草地实测草产量分别同 NDVI 植被指数
所建回归模型,预留数据的样本实地测量值与模型
预测值之间均未形成显著性差异, 但全国低地草甸
区域样本的预测值与实测值的吻合度要远远小于各
分层区域。进一步验证了我国大尺度地理空间分布
的天然草地采用区域分层抽样方法的优越性。
表 4  地面实测值与模型预测值显著性检验
T able 4 Significance t est o f gr ound measur ed value and model predicted value
区域划分   
Zonin g  
回归模型
Regression model
数据组
Data array
标准差
Std. deviation
标准误
Std. er ror
t 显著性
水平 Sig.
全国低地草甸类
Nat ional lowland meadow
Y= 0. 043e3. 800X/ 10000
实测值
Measured
0. 420 0. 132 1. 138 0. 284
预测值
Predicted
0. 397 0. 125
东北低地草甸区
North east lowland meadow area
Y= 0. 073e3. 054X/ 10000
实测值
Measured
0. 217 0. 072 - 0. 731 0. 485
预测值
Predicted
0. 23 0. 078
蒙甘宁低地草甸区
M ongolia- Gansu-Ningxia low land meadow area
Y= 2. 045X/ 10000- 0. 590
实测值
Measured
0. 393 0. 160 - 0. 390 0. 712
预测值
Predicted
0. 194 0. 079
西北低地草甸区
Northw est low lan d mead ow ar ea
Y= 1. 854X/ 10000-0. 221
实测值
Measured
0. 203 0. 072 - 0. 419 0. 687
预测值
Predicted
0. 214 0. 075
4. 5  模型误差对比
通过公式( 4) ,区域分层抽样方法相对于简单随
机抽样方法所建立的估产模型精度提高了 13. 827%。
4. 6  优化采样和建模过程
在全国大尺度地理空间上, 获取年度某种类型
草地更为精准的地上生物量,采取了以下优化策略:
331
草  地  学  报 第 18卷
4. 6. 1  将各类型天然草地按中国草地资源的 7
大气候区划带进行区域分层。
4. 6. 2  避免了在大尺度采样的空间异质性和不均
匀性,从而使样本点的代表性得到提高,进而改善天
然草地生产力的估产精度。
4. 6. 3  可以因地适宜确定采样时间,减小了层间气
候差异,提高了层间样本的同质性,使估测模型更趋
于稳定。
4. 6. 4  同一类型草地不同分层区域水热差异,导致
地面数据和遥感数据的相关关系表现为多形式的,
即线性或非线性的,本研究根据不同区域植被长势
和利用状况选择线性和指数模型为主。
5  讨论与结论
在大尺度地理空间天然草原生产力的监测上,
在总样本数不变的前提下, 使用区域分层抽样的方
法,可以减小采样样本点的不确定性,从而使样本点
的代表性得到提高,并改善天然草地生产力的估产
精度。
从而得出东北地区最适模型为指数模型, 说明
东北地区的低地草甸类草地已入成熟期, 其盖度产
量分辨率已经大于 NDVI 敏感度的饱和值(在植被
生长旺盛时期当植被盖度达到一定程度时 NDVI
对产量的敏感度降低) [ 19]。而蒙甘宁和西北地区最
适模型为线性模型,说明蒙甘宁和西北地区天然草
地该类植被的生长状况与东北地区不同, 而且成熟
期略晚于东北地区。这进一步证明了不同分层区域
气候变化差异对同一类型草地植被生长状况的影
响,更加确认了区域分层建模的必要性。
分层抽样方法在不同的先验知识下,分层所得
到的效果不同, 本研究是以中国草地资源的 7 大
气候区划带作为分层原则, 为天然草原地上生物量
估产统计方法提供参考, 除此之外,还可根据地形地
貌、海拔高度、光照条件等的先验知识, 做进一步对
比研究, 选出最佳的统计方法提高天然草地估测
精度。
参考文献
[ 1]  徐兴奎, 林朝晖, 薛峰, 等. 气象因子与地表植被生长相关性
分析[ J] . 生态学报, 2003, 23( 2) : 221-229
[ 2]  沼田真. 草地调查法手册[ M ] . 北京, 科学出版社, 1986, 17-
32, 47-54
[ 3]  Kish L. Survey Sampling [ M ] . USA: J oh n W iley & Sons ,
1985, 8-11
[ 4]  曹志冬, 王劲峰, 李连发, 等. 地理空间中不同分层抽样方式
的分层效率与优化策略 [ J] . 地理科学进展, 2008, 27 ( 3 ) :
152-160
[ 5]  周琪, 姚顺彬. 分层抽样下的森林资源清查数据年度更新探
讨[ J] . 林业资源管理, 2009, 6: 116-119
[ 6]  连健, 李小娟, 宫辉力, 等. GIS支持下的空间分层抽样方法
研究    以北京市人均农业总产值抽样调查为例[ J] . 地理与
地理信息科学, 2008, 24( 6) : 30-33
[ 7]  王宝来, 翁泽宇, 祝晓青, 等. 分层抽样理论在电动钉枪耐久
性试验中的应用[ J] . 轻工机械, 2007, 25( 5) : 99-102
[ 8]  焦险峰, 杨邦杰, 裴志远. 基于分层抽样的中国水稻种植面积
遥感调查方法研究[ J] . 农业工程学报, 2006, 22( 5) : 105- 110
[ 9]  汤国安, 杨昕. ArcGIS 地理信息系统空间分析实验教程[ M ] .
北京: 科学出版社, 2007, 106-130
[ 10] 党安荣, 王晓栋. ERDAS IM AGINE 遥感图像处理方法[ M ] .
北京: 清华大学出版社, 2003, 62- 95
[ 11] 辛贤, 蒋乃华. 统计学原理[ M ] . 北京: 中国农业大学出版社,
2001, 132.
[ 12] 罗应婷, 杨钰娟. SPSS 统计分析[ M ] . 北京: 电子工业出版社
2007, 130-137, 169-177
[ 13] 裴喜春, 薛河孺. SAS及应用[ M ] . 北京: 中国农业出版社,
1997, 81-116, 121-134, 139-151, 158-171
[ 14] 廖国藩, 贾幼陵. 中国草地资源[ M ] . 北京: 中国科学技术出
版社, 1996, 400-404.
[ 15] Cochr an W G. Samplin g techniques. 3rd ed. [ M ] . New
York: John Wiley & Sons, 1977. 34-39
[ 16] H ainin g R P. Spatial data analysi s: th eory an d practice [ M ] .
Cam bridge: Cambridge U nivers ity, 2003. 21-25
[ 17] Dunn R, H ar rison A R. Tw o-dim ens ion al systemat ic samplin g
of land use [ J] . Applied S tat ist ics, 1993, 42( 4) : 585-601
[ 18] 刑旗, 刘爱军, 刘永志, 等. 应用 M ODIS- NDVI 对草原植被
变化监测研究    以锡林郭勒盟为例 [ J ] . 草地学报, 2005,
13: 15-19
[ 19] 李红军, 郑力. 基于 EOS/ MODIS 数据的 NDVI 与 EVI 比较
研究[ J] . 地理科学进展, 2007, 26( 1) : 26-32
(责任编辑  米  佳)
332