全 文 :遥感探测土地植被覆盖指数的准确度评估*
周忠轩1 吴 钢1 邵国凡2* *
( 1 中国科学院生态环境研究中心系统生态重点实验室, 北京 100085; 2Department of Forestry and Natural Resources,
Purdue Univ ersity, West Lafayette IN 479071159, USA)
摘要 GIS 数据的准确度一直是 GIS 应用的考虑事项. 用虚例和实例揭示了土地植被覆盖指数的准确
度与图像分类的准确度之间的复杂关系, 并进一步用数学方式进行了解释. 土地植被覆盖指数的准确度取
决于图像分类准确度, 但与分类总准确度没有直接关系.用户和产家准确度比总准确度对土地植被覆盖指
数的准确度具有更直接的控制, 所以在图像分类报告中不应被忽略. 为了保证土地植被覆盖指数的准确
度, 某土地类型的用户和产家准确度应该尽可能一致, 同时要使得这两个准确度数值越高越好.
关键词 土地植被覆盖指数 图像分类 准确度评估 遥感探测 景观生态
文章编号 1001- 9332( 2004) 01- 0036- 03 中图分类号 Q149 文献标识码 A
Accuracy evaluation of land vegetative cover index by RS detection. ZHOU Zhongxuan1, WU Gang1 , SHAO
Guo fan2( 1K ey Laborator y of Systems Ecology , Research Center f or EcoEnvironmental Sciences, Chinese A
cademy of Sciences , Beij ing 100085, China; 2Depar tment of For estry and Natural Resources, Purdue Univer
sity , W est Laf ayette IN 479071159, USA ) . Chin. J . A pp l . Ecol . , 2004, 15( 1) : 36~ 38.
The accuracy of G IS data is impor tant in GIS application. In this paper , a fictitious case and an example w ere
used to discuss the relationship betw een accuracy of land vegetative cover index and accuracy of image classifica
tion, and this relat ionship w as explained by mathematics. T he accuracy o f land vegetat ive cover index rested
with the accuracy of image classification, but had no direct relations w ith total classification accuracy. User accu
racy and producer accur acy had mo re direct control on the accur acy of land vegetat ive cover index t han total clas
sification accur acy; and hence, they could not be ignored in the image classification. To improve the accuracy of
land vegetative cover index , user accuracy and producer accuracy of the same land type should be consistent to
the g reatest extent.
Key words Land vegetative cover index , Image classificat ion, Accuracy evaluation, RS detect ion, Landscape
ecolog y.
* 中国科学院 百人计划支持项目、中国科学院重点创新项目
( KZCX3SW423, KZCX2405, RCEES9903) .
* * 通讯联系人.
2002- 10- 23收稿, 2003- 10- 04接受.
1 引 言
在景观生态学、景观评价和景观规划等领域常
用的景观指数至少有几十个; 其中最基本、最重要的
指数是土地覆盖指数(称为% land) . 它等于某一土
地利用/覆盖类型(简称为土地类型)的所有面积比
上该景观的总面积[ 4] , 即土地植被覆盖指数是用来
描述不同土地类型在某一景观上的面积比例. 同其
它景观指数的计算一样, 土地植被覆盖指数的数值
一般是根据从遥感数据产生出来的土地类型图计算
的.因为土地类型图存在着图像分类误差,从其计算
出来的景观指数也必然存在着误差.然而,人们还没
有研究出来评价景观指数误差的有效方法[ 3] . Shao
等[ 7]揭示了景观指数的误差与图像分类误差之间
存在着非线性关系,说明了误差传播具有极大的复
杂性. 该误差传播问题是生态学家、图像分类及 GIS
专家共同所关心的,应该通过学科间的合作共同解
决.虽然在过去的 10年里人们努力研究景观指数的
误差,但其进展并非令人满意.人们似乎理解景观指
数的潜在误差, 而在实际应用中很少谨慎使用景观
指数.鉴于数据准确度在基于遥感技术的生态学研
究中的重要意义, 本文将用虚拟和实际的例子说明
误差传播的问题, 并解释如何评估土地覆盖指数的
准确度,以期为相关研究提供参考.
2 研究方法
分别用虚拟和实际的例子来计算和说明分类总误差与
土地覆盖指数的误差. 其中虚拟的例子见图 1; 实例则运用
美国陆地卫星 T M 数据, 其详细分类方法见参考文献[ 7] . 在
用例子说明的基础上, 进一步用 Congalton 及 Green 等[ 4]的
用户准确度和产家准确度公式对土地植被覆盖指数的准确
度问题予以数学解释.
3 结果与分析
31 虚例
图 1中 3张土地利用图(分类图 a- c)的分类准
应 用 生 态 学 报 2004 年 1 月 第 15 卷 第 1 期
CHINESE JOURNAL OF APPLIED ECOLOGY, Jan. 2004, 15( 1)36~ 38
确度分别为 90% ( a、b)和 ( 92%) . 虽然这样高的分
类准确度在实际中是比较满意的,但由此计算出来
土地植被覆盖指数数值与标准图相差在- 21% ~
21%之间(图 2) . 倘若标准图不存在(在实际情况下
往往会如此) ,这样大的误差范围是很难想象的. 这
个例子也说明了即使遥感数据相同,分类结果也可
能不同.假如土地类型没有发生变化,分类误差可以
导致 40%的变化的错误结论( a 与 b 或 c 相比) , 这
进一步说明用遥感技术探测土地类型变化可能会导
致比人们常常想象的误差更高的误差.
图 1 虚例
Fig. 1 A fict itious case.
图 2 标准图与 3张分类图之间土地覆盖面积的相对差异( % )
Fig. 2 Relat ive dif ference of land cover area betw een standard maps and
3 classif icat ion maps.
32 实例
用美国陆地卫星 T M 数据, 23 位人员各用不同
分类方法得出一张土地类型图[ 7] .共产生出 23张土
地利用图,每张图有 4种土地类型:城镇、农地、森林
和水体.由于操作人员的技术和经验略有不同, 23
张图的分类总准确度在 78% ~ 89%之间. 虽然分类
总误差在 23 张图之间最多只有 11% ,土地覆盖指
数(土地植被覆盖指数)的数值却相差 45% ~ 128%
(表 1) . 也就是说, 即使 23 张图的分类总误差相对
一致,土地植被覆盖指数的数值是明显有区别的, 说
明分类总误差的误差指标不是估计土地植被覆盖指
数误差的可靠指标.
33 是什么控制着土地植被覆盖指数的准确度?
无论是虚例还是实例都揭示了一个共同现象:
在分类总准确度和土地植被覆盖指数的准确度之间
没有简单的相关关系.用遥感的语言说,如果把土地
植被覆盖指数低估了,说明图像分类存在着漏失误
表 1 各土地类型的土地植被覆盖指数在 23张图中之间的变化范围
Table 1 Variation range of land vegetative cover index of each land type
among the 23 maps
统计指标
Indexes
城镇
Town
农地
Farmland
森林
Forest
水体
Waters
最低数值 M inimum ( % ) 5. 3 49. 8 13. 1 0. 8
最高数值 Maximum ( % ) 24. 0 78. 3 31. 5 1. 4
(Max- Min) / (Max+ Min) 200 127. 6 44. 5 82. 5 54. 5
差;如果把土地植被覆盖指数高估了,说明图像分类
存在着添增误差. 而这两种误差分别可以用用户准
确度和产家准确度的准确度指标来表示 [ 2].
根据上述数据, 在土地植被覆盖指数准确度和
各种分类准确度指标之间的线性回归分析肯定了土
地植被覆盖指数准确度与分类总准确度无关,而与
该土地覆盖类型的用户准确度和产家准确度有
关[ 9] . 最为紧密的相关存在于土地植被覆盖指数的
准确度与用户准确度的倒数和产家准确度的倒数之
差之间[ 9] (表 2) .
表 2 在土地植被覆盖指数准确度和各种分类准确度指标之间的线
性回归分析( R2 数值)
Table 2 Regression analysi s between accuracy of land vegetative cover
index and accuracy of other classification indexes
准确度指标
Indexes
城镇
Town
农地
Farmland
森林
Forest
水体
Waters
总准确度 T otal accuracy 0. 07 0. 00 0. 00 0. 00
产家准确度 Producer accuracy 0. 74 0. 80 0. 68 0. 62
用户准确度 U ser accuracy 0. 74 0. 74 0. 72 0. 39
1/用户准确度( U A) - 1/产家准确度( PA) 0. 86 0. 94 0. 87 0. 75
34 数学解释
根据 Congalton 等的公式[ 2] , 第 i 个土地类型
的用户分类准确度 ( UA i )为:
UA i= f ii
f i+
=
f ii
n
j = 1
f ij
=
f ii
f ii+ n
j = 1j 1 f ij
( 1)
且第 i 个土地类型的产家分类准确度 ( PA i )为:
PA i= f ii
f + i
=
f i i
n
j= 1
f ji
=
f ii
f ii + n
j = 1j 1f j i
( 2)
式中, n 为在某一景观内土地类型的种类; f ij为土地
类型 i 在分类数据和土地类型 j 在观测数据中共同
出现的次数; f + i为土地类型 i 在观测数据中出现的
总数; f i+ 为土地类型 i 在分类数据中出现的总数.
所以,
1
UAi
-
1
PA i
=
f ii+ n
j= 1 j if ij
f ii
-
f ii+ n
j= 1j if ij
f ii
=
n
j= 1 j if ij -
n
j= 1 j if ij
f ii
( 3)
在式( 3)中, n
j= 1j if ij项代表了把其它土地类型误分为
土地类型 i的次数,其数值越高, 则越高估土地类型
371 期 周忠轩等:遥感探测土地植被覆盖指数的准确度评估
i的面积; n
j = 1j if ij 项代表了把土地类型 i 误分为其
它土地类型的次数, 其数值越高, 则低估土地类型 i
的面积.因此, n
j= 1j if ij-
n
j = 1j if ji代表了土地类型 i 高
估与低估之间的净差.当净差等于 0的时候, 对土地
植被覆盖指数的估计则是准确的.倘若净差不为 0,
用户准确度和产家准确度的高低(取决于 f ii )也将
对土地植被覆盖指数的准确度产生影响.
4 讨 论
GIS的功能对生态学研究应该是非常有用的,
但这不等于 GIS 的分析结果都是有用的. GIS 的结
果的可靠性主要取决于 GIS 数据本身的可靠性.
GIS的数据来源有多种:地面调查、图数字化以及遥
感数据解译.在地面调查中,现地测量和纪录可能都
很准确,但调查地点有位置误差.辅助定位的工具有
地形图、遥感影像、罗盘仪和全球定位系统( GPS) .
任何一种工具有可能产生位置误差. 例如, 如果
GPS信号不强或未经过分差校正,很可能产生几十
米的误差. 位置上的错误可能会导致一系列分析结
果的错误.数字化过程在技术上并不复杂,但缺乏职
业训练和反复核对也会导致位置误差甚至记录错
误,原图本身有绘图误差,甚至数字化员的心态也会
导致人为误差[ 1] . 例如, 在 15 万的地图上产生
1mm拼图误差, 等于在地面产生 50m 误差[ 5] . GIS
的普及应用使得数字化工作相对容易, 但同时也能
造成基础数据数字化的不系统性和数据维持的不连
续性,甚至造成在部门之间的重复. 其结果是, 似乎
谁都能数字化, 谁都有数据,所有的数据都不一样.
现在几乎所有的土地覆盖图都是通过遥感数据
分类产生出来的.土地覆盖图在现代生态学研究中
应用深广, 但它在许多应用方面都有潜在误差或错
误.例如, 用土地覆盖图计算各种土地覆盖类型的面
积,其准确度与遥感数据的总准确度指标毫无关
系[ 7] .土地覆盖指数的准确度取决于图像分类准确
度,但与分类总准确度没有直接关系.土地植被覆盖
指数的误差可以达到分类总误差的 2倍. 用户和产
家准确度比总准确度对土地植被覆盖指数的准确度
具有更直接的控制, 所以在图像分类报告中不应被
忽略.为了保证土地植被覆盖指数的准确度,某土地
类型的用户和产家准确度应该尽可能一致,同时要
使得这两个准确度数值越高越好.
GIS数据的准确度或准确度一直是 GIS应用的
考虑事项[ 8] . 另外, 在什么情况下用栅格数据结构还是矢量数据结构, 如何确定 GIS 数据库的参数
( Metadata) , GIS操作员应该具备哪些知识和技术,
以及谁来负责 GIS 数据库的管理都是 GIS 应用的
考虑事项.这些技术问题不解决,将直接或间接影响
生态学研究的发展. 空间生态模型正在得到越来越
多的应用. GIS 数据的误差将在模型运行过程中放
大传播,再加上模型假设和参数的误差,空间生态模
型的输出结果具有不可估量的误差. 空间生态模型
是有用的生态学研究工具,但在决策应用中要特别
谨慎.对多个模型的输出结果进行比较,从中选优,
才能使结果比较可靠[ 6] .
参考文献
1 Bolstad PV, Smith JL. 1992. Errors in GIS . J For , 90( 11) : 13~ 20
2 Congalton RG, Green K. 1998. Assessing the Accuracy of Remotely
Sensed Data: Principles an d Practices. New York: Lew is Publ ish
ers. 137
3 Hess GR. 1994. Pat tern and error in landscape ecology: A commen
tary. Landscape Ecol , 9: 3~ 5
4 M cGarigal K, Marks BJ. 1994. FRAGSTAT S: Spat ial pat terns
analysis program for quant ifying landscape st ructure. Unpubl. S of t
ware, Dept . Forest Science, Oregon S tate University.
5 Shao G, Zhu H, M ills WL. 2000. An algorithm for automated map
Mosaicing prior to georegist rat ion. J G eogra Inf or Sci , 6( 1) : 97~
101
6 Shao G, Bugm ann H, Yan X. 2001. A com parat ive analysis of the
structure and behavior of three gap models at sit es in northeastern
China. Climati c Change , 51: 389~ 413
7 Shao G, Liu D, Zhao G. 2001. Relationships of classif icat ion accura
cy and variat ion of landscape stat ist ics. Can J Remote Sensing , 27
( 1) : 33~ 43
8 Wing M G, Bet tinger P. 2003. GIS : An updated primer on a pow er
ful management tool. J For , 101( 4) : 4~ 9
9 Wu W, Shao G. 2001. On the accuracy of land use and land cover
mapping and postclassificat ion change detect ions. In: Proceedings
of International Conference on Land U se/ Cover Dynamics, held in
Beijing, China,Aug. 26~ 30
作者简介 周忠轩, 男, 1956 年生,在读博士, 研究方向为区域
规划和区域经济,发表论文 3篇. Email: wug@ mail. rcees. ac. cn
38 应 用 生 态 学 报 15卷