为了采用广义加法模型整合数字高程模型和遥感数据进行植被分布的预测, 并探索耦合环境变量和遥感数据作为预测变量是否能够有效地提高植被分布预测的精度, 选择海拔、坡度、至黄河最近距离、至海岸线最近距离, 以及从SPOT5遥感影像中提取的光谱变量作为预测变量, 采用广义加法模型整合环境变量和光谱变量, 建立植被分布预测模型。研究设置3种建模情景(以环境变量作为预测变量, 以光谱变量作为预测变量, 综合使用环境变量与光谱变量作为预测变量)对黄河三角洲的优势植被类型的分布进行了预测, 并对预测结果采用偏差分析、受试者工作特征曲线和野外采样点对比等3种方法进行了验证。结果表明: (1)基于广义加法模型的植被分布预测方法具有一定的实用性, 可以较为准确地预测植被的分布; 盖度较高的植被类型预测精度较高, 盖度较低的植被类型预测精度较低, 植物群落结构的特点是出现这些差异的主要原因; 综合使用环境变量和光谱变量作为预测变量的模型, 预测精度高于单独以环境变量或者光谱变量作为预测变量的模型。(2)环境变量、光谱变量大多被选入模型, 二者均对植被分布预测有重要的作用; 同一预测变量在不同植被类型的预测模型中的贡献不同, 这与植被的光谱、环境特征差异有关; 同一预测变量在不同的建模情景下对模型的贡献不同, 环境变量与光谱变量的耦合效应可能是导致预测变量对模型的贡献出现变化的原因。
Aims Our objective was to integrate vegetation survey data, remotely sensed data and environmental data based on generalized additive model to map vegetation and investigate whether coupling remotely sensed data and environmental data could improve the performance of generalized additive model. Methods Altitude, slope, nearest distance to coastline, nearest distance to the Yellow River and spectral variables were selected as predictive variables. Generalized additive model was employed to describe the relation between the vegetation and predictive variables. Deviance (D2) was employed to test the goodness of curve fitting, and a probability map of each vegetation type produced by the fitted generalized additive model was assessed by cross-validation of receiver operating characteristic (ROC). Vegetation type of each grid cell was determined according to the maps of probability. We validated the final predicted vegetation type map by comparing the predicted vegetation type map with vegetation survey data. Important findings Results indicated that integrating field sampling, digital elevation model and remotely sensed data based on generalized additive model was feasible to map vegetation. Coupling environmental variables and spectral variables improved the performance of generalized additive model. Prediction accuracy varied according to the plant community type, and plant community with dense cover was better predicted than sparse plant community. The selected generalized additive models for each vegetation type indicated that both environmental variables and spectral variables were important factors for predicting vegetation distribution. Drop contribution calculation indicated that the contribution of the same predictive variable for different vegetation types was different. This can be explained by the different spectral and environmental characteristics of vegetation types. The contribution of each predictive variable for the same vegetation type varied according to the modeling scene. This might be explained by the coupling effects of environmental variables and spectral variables.
全 文 :植物生态学报 2012, 36 (10): 1106–1119 doi: 10.3724/SP.J.1258.2012.01106
Chinese Journal of Plant Ecology http://www.plant-ecology.com
——————————————————
收稿日期Received: 2011-07-14 接受日期Accepted: 2012-05-08
* E-mail: songcy@ibcas.ac.cn
采用广义加法模型整合数字高程模型和遥感数据
进行植被分布预测
宋创业1* 刘慧明2 刘高焕3 黄 翀 3
1中国科学院植物研究所植被与环境变化国家重点实验室, 北京 100093; 2环境保护部卫星环境应用中心, 北京 100094; 3中国科学院地理科学与资源
研究所资源与环境信息系统国家重点实验室, 北京 100101
摘 要 为了采用广义加法模型整合数字高程模型和遥感数据进行植被分布的预测, 并探索耦合环境变量和遥感数据作为
预测变量是否能够有效地提高植被分布预测的精度, 选择海拔、坡度、至黄河最近距离、至海岸线最近距离, 以及从SPOT5
遥感影像中提取的光谱变量作为预测变量, 采用广义加法模型整合环境变量和光谱变量, 建立植被分布预测模型。研究设置3
种建模情景(以环境变量作为预测变量, 以光谱变量作为预测变量, 综合使用环境变量与光谱变量作为预测变量)对黄河三角
洲的优势植被类型的分布进行了预测, 并对预测结果采用偏差分析、受试者工作特征曲线和野外采样点对比等3种方法进行
了验证。结果表明: (1)基于广义加法模型的植被分布预测方法具有一定的实用性, 可以较为准确地预测植被的分布; 盖度较
高的植被类型预测精度较高, 盖度较低的植被类型预测精度较低, 植物群落结构的特点是出现这些差异的主要原因; 综合使
用环境变量和光谱变量作为预测变量的模型, 预测精度高于单独以环境变量或者光谱变量作为预测变量的模型。(2)环境变
量、光谱变量大多被选入模型, 二者均对植被分布预测有重要的作用; 同一预测变量在不同植被类型的预测模型中的贡献不
同, 这与植被的光谱、环境特征差异有关; 同一预测变量在不同的建模情景下对模型的贡献不同, 环境变量与光谱变量的耦
合效应可能是导致预测变量对模型的贡献出现变化的原因。
关键词 曲线下面积(AUC) , 归一化植被指数(NDVI), 受试者工作特征曲线(ROC)
Applying generalized additive model to integrate digital elevation model and remotely sensed
data to predict the vegetation distribution
SONG Chuang-Ye1*, LIU Hui-Ming2, LIU Gao-Huan3, and HUANG Chong3
1State Key Laboratory of Vegetation and Environmental Change, Institute of Botany, Chinese Academy of Sciences, Beijing 100093, China; 2Satellite Eenvi-
ronment Center, Ministry of Environmental Protection, Beijing 100094, China; and 3State Key Laboratory of Resources and Environmental Information Sys-
tem, Institute of Geographic Sciences and Nature Resources Research, Chinese Academy of Sciences, Beijing 100101, China
Abstract
Aims Our objective was to integrate vegetation survey data, remotely sensed data and environmental data based
on generalized additive model to map vegetation and investigate whether coupling remotely sensed data and en-
vironmental data could improve the performance of generalized additive model.
Methods Altitude, slope, nearest distance to coastline, nearest distance to the Yellow River and spectral
variables were selected as predictive variables. Generalized additive model was employed to describe the rela-
tion between the vegetation and predictive variables. Deviance (D2) was employed to test the goodness of curve
fitting, and a probability map of each vegetation type produced by the fitted generalized additive model was as-
sessed by cross-validation of receiver operating characteristic (ROC). Vegetation type of each grid cell was de-
termined according to the maps of probability. We validated the final predicted vegetation type map by comparing
the predicted vegetation type map with vegetation survey data.
Important findings Results indicated that integrating field sampling, digital elevation model and remotely
sensed data based on generalized additive model was feasible to map vegetation. Coupling environmental vari-
ables and spectral variables improved the performance of generalized additive model. Prediction accuracy varied
according to the plant community type, and plant community with dense cover was better predicted than sparse plant
community. The selected generalized additive models for each vegetation type indicated that both environmental
variables and spectral variables were important factors for predicting vegetation distribution. Drop contribution
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1107
doi: 10.3724/SP.J.1258.2012.01106
calculation indicated that the contribution of the same predictive variable for different vegetation types was dif-
ferent. This can be explained by the different spectral and environmental characteristics of vegetation types. The
contribution of each predictive variable for the same vegetation type varied according to the modeling scene. This
might be explained by the coupling effects of environmental variables and spectral variables.
Key words area under curve (AUC), normalized difference vegetation index (NDVI), receiver operating
characteristic (ROC)
遥感影像分类是获取植被类型空间分布信息
的重要途径(Sanders et al., 2004)。在植被遥感分类
中, 应用较多的是传统的监督分类、非监督分类等
模式识别方法(杨存建和周成虎, 2001)。由于光谱特
征相似性, 以及“同物异谱”、“异物同谱”等现象, 基
于光谱的分类结果不够理想 (Berberoglu et al.,
2007)。为此, 人们不断尝试新方法, 如基于人工神
经网络、模糊数学的植被遥感影像分类, 并在一定
程度上提高了分类的精度(Frizzelle & Moody, 2001;
刘小平等, 2007)。但是, 这些分类方法同样是以植
被的光谱特征为基础的, 依然不能有效地克服“同
物异谱”、“异物同谱”等带来的问题(Berberoglu et
al., 2007)。为解决上述问题, 专家分类系统被逐步
应用到植被遥感分类中。专家分类系统不仅可以对
遥感影像进行基于光谱的分类, 而且可借助海拔、
坡度和坡向等信息, 进行综合、协同分类(Stow et
al., 2008; Zhang & Zhu, 2011)。但是, 知识的获取、
量化, 以及知识的不确定性等制约了专家分类系统
的运用(Stow et al., 2008)。植被-环境模型是获取植
被类型分布信息的另一条途径(Guisan & Zimmer-
mann, 2000)。按照生态位理论, 任一植物群落都有
自己的生态位, 即分布在一定的地理空间中, 这个
空间是由地形、土壤、温度、降水、太阳辐射等条
件决定的(宋永昌, 2001)。生态位理论认为, 在一定
的时间和空间尺度下, 植被与环境变量之间存在着
“平衡”或“准平衡”的关系(Ferrier & Guisan, 2006)。
基于这一假设条件, 众多学者通过统计模型的方法
建立植被-环境模型, 以此来定义植物群落生态位
与环境之间的关系, 并对植被的空间分布进行预测
(Guisan & Zimmermann, 2000; Ferrier & Guisan,
2006)。然而, 植被-环境模型难以对现实植被进行准
确的预测, 因为现实植被的分布不仅受环境的影
响, 而且还受到其他干扰作用(放牧、火烧、开垦与
弃耕等)的影响(Guisan & Zimmermann, 2000; Dirn-
bök et al., 2001; White et al., 2001)。因此, 植被-环境
模型的预测结果只能被称为潜在植被, 而不是现实
植被(Guisan & Zimmermann, 2000)。综上所述, 植
被遥感分类的优势在于能够识别现实植被, 由于
“同物异谱”、“异物同谱”等问题, 植被遥感分类的
精度不理想。植被-环境模型是对植被分布进行预测
的一种有效的方法, 但是, 现实植被是环境和干扰
等因素综合作用的结果, 植被-环境模型的预测结
果是潜在植被, 而不是现实植被。所以, 植被遥感
分类和植被-环境模型各有特点和优势。另一方面,
根据光谱难以进行有效识别的植被, 有可能根据其
与环境之间的关系对之识别, 反之亦然。所以, 综
合使用植被与环境、光谱之间的对应关系进行植被
类型的分布预测, 是提高植被遥感分类精度的一条
可行的途径。
综合使用光谱和环境变量建模并进行植被类
型的分布预测, 首先需要解决模型的选择问题。植
被-环境关系模型大体上可以分为线性模型和非线
性模型两大类。但是, 大量的研究表明, 植物和环
境之间的关系在多数情况下不是线性关系, 而是非
线性关系(张金屯, 1995)。最著名的非线性模型是高
斯模型(Gaussian model), 基于高斯模型的除趋势对
应分析(detrended canonical analysis, DCA)、典范对
应分析(canonical correspondence analysis, CCA)和
除趋势典范对应分析 (detrended canonical corre-
spondence analysis, DCCA)等排序技术, 在植被与
环境关系研究中得到了广泛的应用(张金屯, 1995;
Dirnböck et al., 2003; Chang et al., 2004)。但是, 排
序的降低维数、减少坐标轴的数目会损失大量信息
(张金屯, 1995)。其他非线性模型, 如最大熵技术
(maximum entropy, Maxent) 和 人 工 神 经 网 络
(artificial neural network, ANN)等, 在植被与环境关
系的研究中也得到一定的运用, 并取得了较好的拟
合效果(Olden et al., 2006; Phillips & Dudik, 2008)。
然而, 非参数模型的敏感性相对较差, 对于大样本,
非参数模型的计算十分复杂, 且非参数拟合模型空
1108 植物生态学报 Chinese Journal of Plant Ecology 2012, 36 (10): 1106–1119
www.plant-ecology.com
间外延困难, 其生态学意义解释方面还存在一定的
问题。广义加法模型(generalized additive model,
GAM)是广义线性模型 (generalized linear model,
GLM)的非参数化扩展, 是介于参数模型与非参数
模型之间的一种模型(Lehmann et al., 2002)。GAM
利用平滑函数(如spline)替代GLM中的参数, 因此
数据中的非线性关系(如双峰和不对称)很容易被发
现。GAM的模拟结果不是来自于一个预先设定好的
参数化的模型, 而是应用非参数的方法来检测数据
的结构, 并找出数据中的规律, 最终构建模型。
GAM的特点使其成为在植被与环境关系及植被分
布预测研究中应用较为广泛的模型之一(Leathwick,
2001; Cawsey et al., 2002; Lehmann et al., 2002; 沈
泽昊和赵俊 , 2007; 赫晓慧等 , 2008; 温仲明等 ,
2008)。
本研究以GAM为拟合工具, 综合考虑植被的
光谱特征、植被与环境之间的对应关系, 建立植被
分布与预测变量(植被的光谱特征与环境变量)之间
的响应模型, 进行植被类型的分布预测, 主要探讨
以下两个问题: (1)综合使用环境变量与光谱数据作
为预测变量能否有效地提高植被类型分布预测的
精度?(2)影响植被类型分布预测精度的主要因素
是什么?期望本文的研究结果能够为植被制图和
植被生态学研究提供方法上的参考。
1 研究区概况
研究区选在黄河三角洲。黄河三角洲位于渤海
湾南岸和莱州湾西岸, 主要分布于山东省东营市和
滨州市境内, 地理坐标117°31′–119°18′ E、36°55′–
38°16′ N (图1)。地势总体平缓, 南高北低, 西高东
低。岗阶地、河成高地、低洼地、河滩地、平地以
及滩涂地等为其主要地貌类型(许学工, 1997)。
图1 黄河三角洲的位置及野外采样点分布图。
Fig. 1 Map of location of the Yellow River Delta and distribution of field sampling sites.
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1109
doi: 10.3724/SP.J.1258.2012.01106
图2 黄河三角洲的主要植被类型。
Fig. 2 Main vegetation types of the Yellow River Delta.
黄河三角洲属暖温带半湿润大陆性季风气候,
境内气候南北差异不明显。年日照时数为2 590–
2 830 h, 年平均气温11.7–12.8 , ℃ 无霜期206天,
≥10 ℃的积温约4 300 , ℃ 年降水量530–630 mm,
70%分布在夏季, 年蒸发量1 900–2 400 mm (赵延
茂和宋朝枢, 1995)。黄河三角洲属暖温带落叶阔叶
林区, 区内无地带性植被类型, 植被的分布主要受
土壤含盐量、地下水水位与矿化度、地貌类型以及
人类活动的影响(赵延茂和宋朝枢 , 1995)。柽柳
(Tamarix chinensis)灌丛、芦苇(Phragmites australis)
草甸、翅碱蓬(Suaeda heteroptera)群落是该地区主
要的自然植被类型(图2)。
2 研究方法
2.1 植被调查数据
本文所用的植被调查数据来源于2006–2008年
6–9月对黄河三角洲进行的野外调查。灌木群落样
方大小为10 m × 10 m, 草本群落样方大小为1 m ×
1 m。记录样方中每种植物的个体数、盖度、株高
等指标, 最后获取247个植被调查的样方资料, 其
中柽柳灌丛样方112个, 芦苇草甸样方95个, 翅碱
蓬群落样方40个。
由于遥感影像进行几何校正时存在一定的误
差, 且记录的样方分布点的全球定位系统(global
positioning system, GPS)坐标也存在误差(±10 m),
在设置植物群落样方的时候, 我们把样方都设置在
靠近群落中央的区域, 保证样方至植被边界的距离
超过50 m (图3), 以确保用植被调查样方的坐标值
提取的光谱值、海拔、坡度等变量可以真实地反映
植被类型的光谱和生境特征。
图3 样方设置方法示意图。
Fig. 3 Diagram of quadrat setting method.
2.2 环境数据
地形在生态学研究中被认为是间接的环境变
量, 可用来代替气温、水分和光照等直接环境变量,
分析植被分布与环境之间的关系(Austin, 1980)。在
黄河三角洲, 现有的研究表明, 地形、地下水位和
土壤理化性质有显著的相关关系 (Song et al.,
2009)。所以, 本研究以50 m的数字高程模型(digital
elevation model, DEM) (来源于东营市1:5万地形图
的数字化)数据为基础, 获取海拔数据(altitude, ALT)
及坡度(slope, SP)数据作为环境变量进行植被-环境
关系分析。另外, 鉴于海洋和黄河对研究区植被分
布格局有着重要的影响, 本研究选择了至海岸线最
近距离(nearest distance to coastline, DC)和至黄河最
近距离(nearest distance to the Yellow River, DR)作为
预测变量进行建模。
1110 植物生态学报 Chinese Journal of Plant Ecology 2012, 36 (10): 1106–1119
www.plant-ecology.com
2.3 遥感数据
本研究所用的遥感数据是一景覆盖研究区的
SPOT5多光谱影像, 成像时间为2005年9月7日, 包
含绿波段(visible green band, VG) (0.50–0.59 µm)、
红波段(visible red band, VR) (0.61–0.68 µm)、近红
外波段(near infrared band, NIR) (0.78–0.89 µm)、短
波红外波段(short infrared band, SIR) (1.58–1.75 µm)
和全色波段, 多光谱影像空间分辨率为10 m, 全色
波段的空间分辨率为2.5 m。
2.3.1 几何校正
采用亚米级差分GPS采集高精度地面控制点,
选取27个在图上均匀分布的地面控制点, 采用双线
性内插法对2.5 m全色波段影像进行几何校正, 均
方根(root mean square, RMS)小于0.01个像元, 然后
以校正好的全色波段影像为基准影像, 对多光谱影
像进行几何校正。由于本研究是对有自然植被覆盖
的区域进行植被分布预测的, 所以对于没有自然植
被分布的区域(如农田、滩涂、水域等)进行掩膜去
除处理。
2.3.2 遥感影像的重采样
由于本研究采用的SPOT5多光谱数据的空间
分辨率是10 m, 所以我们采用双线性内插法对
DEM进行了重采样处理, 生成空间分辨率为10 m
的DEM数据。
2.3.3 基于遥感数据的预测变量
1)各个植被类型在不同波段(VG、 VR、NIR和
SIR)的灰度值 (digital number, DN), 即 : DNVG、
DNVR、DNNIR和DNSIR;
2)归一化植被指数(normalized difference vege-
tation index, NDVI): NDVI较好地指示了植被生长状
态和植被覆盖度, 且经过比值处理, NDVI可以部分
消除太阳高度角、卫星观测角、地形、云以及大气
条件等导致的辐照度变化的影响, 所以本研究选择
NDVI为预测变量。
NDVI = (DNNIR–DNVR) / (DNNIR + DNVR), DNNIR
和DNVR分别表示近红外波段和红波段的灰度值
(Deering, 1978)。
NDVI值介于–1和1之间, 本研究把NDVI值归一
化到0–255之间, 标准化的NDVI值(NDVIN)算法如
下: NDVIN = 127.5 (NDVI + 1)。
2.3.4 数据的提取和异常值检验
在建模过程中, 需要使用植被调查样方的坐标
来提取其对应的海拔、坡度、至海岸线和黄河的最
近距离、各个波段的灰度值和NDVI值。为了使提取
的数据能真实地反映植被的光谱特征及分布区的
环境特征, 我们提取了植被样方所在的像元及其相
邻的8个像元的光谱及环境信息。对提取的数据进
行异常值检验。如果某个数据与平均值之间的差异
超过两倍标准差, 那么这个数据是异常值。删除异
常值之后, 对植被样方所在像元及其相邻像元的海
拔、坡度、至海岸线和黄河的最近距离、各个波段
的灰度值和NDVI值取平均值, 以平均值作为预测
变量值进行建模。
2.4 模型的构建
2.4.1 理论基础
GAM的优点在于解决响应变量与预测变量之
间的非线性、非单调关系方面的能力。GAM的建立
是数据驱动的, 而不是基于模型本身, 数据决定着
响应变量与预测变量之间的关系, 而不是假设在响
应变量与预测变量之间存在某种参数关系。因而,
GAM也被称为半参数模型。正因如此, GAM具有高
度的灵活性, 能够有效地揭示数据中所隐含的生态
学关系。关于GAM的理论知识可以参考Hastie和
Tibshirani (1990)的研究结果。
GAM的特点使其成为植被与环境关系研究中
应用较为广泛的模型。目前, 不少科研工作者将
GAM与GIS相结合 , 进行植被空间分布的预测
(Leathwick, 2001; Cawsey et al., 2002; Lehmann et
al., 2002; 沈泽昊和赵俊, 2007; 赫晓慧等, 2008; 温
仲明等, 2008)。Lehmann等(2002)开发了基于S语言
的GRASP模块, 实现了GAM分析与GIS的结合, 将
模型建立、验证与空间预测制图统一起来。
2.4.2 模型构建
植被分布预测是建立在GAM的基础之上, 利
用生成的查找表(lookup table)和预测变量来计算植
被类型在各个预测单元上出现的概率。具体过程要
通过ARCVIEW中的GRASP扩展模块 , 以生成的
GAM为基础, 利用生成的查找表, 生成各个植被类
型的分布概率图, 最终根据植被类型在各个预测单
元上分布概率的大小, 确定每个预测单元上的植被
类型。具体流程见图4。
2.4.3 建模情景设置
为了比较环境变量和光谱变量在模型中的作
用, 本研究设置了3种建模情景: A)以环境变量(海
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1111
doi: 10.3724/SP.J.1258.2012.01106
图4 植被类型识别和空间分布预测流程。GRASP, 广义回归分析与空间预测。
Fig. 4 Procedure of vegetation type identification and spatial distribution prediction. GRASP, generalized regression analysis and
spatial prediction.
拔、坡度、至海岸线最近距离、至黄河最近距离)
作为预测变量; B)以光谱变量(DNVG、DNVR、DNNIR、
DNSIR、NDVI)作为预测变量; C)同时以环境变量和
光谱变量作为预测变量。
2.4.4 数据准备与参数设置
模型运行需要4个数据矩阵 : 响应变量矩阵
(YYY)、预测变量矩阵(XXX)、预测区域中预测变
量的最大值和最小值(XXX lut)和以栅格形式存储
的同名预测变量数据。
响应变量的选择是由建立植被分布模型的目
的决定的, 本研究预测植被的分布概率, 因此采用
植物群落的存在/缺失(0/1)指标作为响应变量。为了
生成模型所需要的二元数据(0/1), 我们对植被调查
数据做了如下转换: 对于某个植被类型来说, 如果
这个植被类型的物种在样方中的重要值(importance
value, IV)最大, 那么这个样方所代表的样点数据就
为1, 否则这个样点的数据就为0。重要值按照如下
公式计算:
r r rIV C D H= + + (1)
式中, Cr是相对盖度, Dr是相对密度, Hr是相对高度。
预测变量包括ALT、SP、DC、DR、DNVG、DNVR、
DNNIR、DNSIR和NDVI。
在建模过程中, 首先选择全模型, 采用自由度
为4的平滑函数spline拟合全部预测变量, 由于响应
变量采用存在/缺失(0/1)数据, 因此模型采用二项
式分布, 联接函数为logit, 将数据转化为群落出现
的概率值, 其值介于0–1之间。建模中采用95%水平
下的F检验进行判别, 逐步剔除未通过统计检验的
1112 植物生态学报 Chinese Journal of Plant Ecology 2012, 36 (10): 1106–1119
www.plant-ecology.com
变量, 在对预测变量的显著性变化验证的基础上建
立模型。
2.5 模型验证
对植被分布的预测分为3步: 一是通过GAM构
建植被与光谱特征、环境变量之间的响应模型; 二
是根据模型计算每个植被类型的分布概率; 三是根
据概率的大小确定每个预测单元上的植被类型。所
以本研究采用的验证方法分为3步:
(1)采用D2对GAM的拟合效果进行评价, D2通
过如下公式进行计算;
D2 = (null deviance-residual deviance)/null devi-
ance, null deviance是指模型在只剩下截距时的偏差
(总偏差); residual deviance是指拟合状态下仍然不
能解释的偏差(剩余残差); D2相当于线性回归模型
中的回归系数, 用来评价模型拟合效果。理想状态
下, D2值为1, 表示没有剩余残差, 变异可以完全被
模型解释, D2的值越接近1, 模型拟合的效果越好。
(2)采用受试者工作特征曲线(receiver operating
characteristic, ROC)对植被分布概率图进行交叉验
证(cross validation)。ROC曲线是一种不依赖于阈值
的方法, 它不需要选取固定的阈值来确定模型精
度, 而是将不同阈值的正确模拟存在的百分率(敏
感性, sensitivity)和1减去正确模拟不存在的百分率
(特异性, specificity)通过作图法表示在图上, 通过
比较曲线和45°线之间的面积 (area under curve,
AUC)来确定模型的精度 , 因此它的评估结果比
Kappa值更客观(Thuiler, 2003)。基于此种考虑, 许多
模型预测研究应用ROC曲线来评估模型精度
(Thuiller, 2003; Thuiller et al., 2004)。
本研究以基于ROC曲线的交叉验证方法来评
估模型预测精度,即将数据分成5份, 取其中4份用
来构建模型, 剩余的1份用来评估模型, 依次循环5
次, 5次循环的平均值可用来评估模型的精度。研究
表明, 如果ROC曲线的AUC值大于0.7, 那么表示模
拟的结果是可以接受的 (Hosmer & Lemeshow,
2000)。
(3)采用部分植被调查数据对最终的预测结果
进行验证。本研究共获取了247个植被样方资料, 对
于每种植被类型, 选择50%的样方用于构建模型,
其余用于对预测结果进行验证。
3 研究结果
3.1 不同植被类型的光谱特征及其分布区环境变
量特征
表1是根据植被样方调查统计的3种植被类型
分布区海拔、坡度、至海岸线最近距离、至黄河最
近距离及其光谱特征。从表1中可以看出, 柽柳灌丛
分布区的海拔显著大于芦苇草甸和翅碱蓬群落分
布区的海拔, 芦苇草甸和翅碱蓬群落分布区之间的
海拔差异显著(p < 0.05)。柽柳灌丛分布区的坡度显
著大于芦苇草甸和翅碱蓬群落分布区的坡度, 而芦
苇草甸和翅碱蓬群落之间的坡度差异不显著(p >
0.05)。柽柳灌丛与芦苇草甸至海岸线最近距离显著
大于翅碱蓬群落至海岸线最近距离, 柽柳灌丛与芦
苇草甸至海岸线最近距离之间的差异不显著(p >
0.05)。翅碱蓬群落至黄河最近距离相对较远, 柽柳
表1 3种植被类型的光谱特征及其分布区的环境特征(平均值±标准偏差)
Table 1 Spectral attributes of three vegetation types and environmental characteristics of their distribution range (mean ± SD)
变量
Variable
柽柳灌丛
Tamarix chinensis
shrub
芦苇草甸
Phragmites australis
meadow
翅碱蓬群落
Suaeda heteroptera
community
海拔 Altitude (m) 2.31 ± 0.91a 1.42 ± 0.50b 1.72 ± 0.77c
坡度 Slope (°) 0.06 ± 0.06b 0.04 ± 0.04a 0.04 ± 0.04a
至海岸线最近距离 Nearest distance to coastline (km) 11.62 ± 6.73a 11.97 ± 4.07a 10.55 ± 6.39b
至黄河最近距离 Nearest distance to the Yellow River (km) 28.00 ± 9.03a 24.76 ± 6.06b 29.40 ± 6.00c
短波红外波段灰度值 Digital number of short infrared band 77.63 ± 9.77a 67.66 ± 11.43b 79.41 ± 14.65c
红波段灰度值 Digital number of visible red band 69.60 ± 9.49a 59.95 ± 7.17b 75.31 ± 13.88c
近红外波段灰度值 Digital number of near infrared band 66.37 ± 8.52a 71.80 ± 9.10b 70.31 ± 9.87c
绿波段灰度值 Digital number of visible green band 76.47 ± 5.66a 71.62 ± 4.50b 79.24 ± 7.03c
归一化植被指数 Normalized difference vegetation index 124.54 ± 12.09a 138.78 ± 11.87b 123.65 ± 15.46c
不同字母表示不同植被类型之间差异显著(p < 0.05)。
Different letters indicate significant differences between different vegetation types (p < 0.05).
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1113
doi: 10.3724/SP.J.1258.2012.01106
灌丛次之, 芦苇草甸至黄河最近距离最小, 且三者
之间差异显著(p < 0.05)。3种植被类型在不同波段
上的灰度值和NDVI之间的差异均达到显著水平
(p < 0.05)。
3.2 基于GAM的植被预测模型及其空间预测
基于GAM拟合的植被预测模型见表2。由于在
建模过程中分别采用环境变量、光谱变量、环境变
量与光谱变量作为预测变量对3种植被类型进行建
模, 所以共有9个拟合的GAM模型。从表2中可以看
出, 单独以环境变量和光谱变量作为预测变量的
GAM的D2值均小于综合使用环境变量和光谱变量
作为预测变量的GAM的D2值, 这说明耦合环境变
量和光谱变量进行建模在一定程度上提升了GAM
的拟合效果。
在GAM的基础上, 我们对各个预测变量对模
型的贡献进行了分析, 预测变量对模型贡献的大小
是通过计算从模型中移出该变量时模型残差的变
化来进行量化的, 具体结果见表3。从表3中可以看
出: 1)以环境变量作为预测变量, 对于3种植被类型,
ALT、SP、DC和DR对模型均有较大的贡献。2)以光
谱变量作为预测变量, 对于柽柳灌丛, DNSIR对模型
的贡献最大, 其次是DNVR和DNVG, NDVI和DNNIR的
贡献较小; 对于芦苇草甸, DNNIR、DNIR、DNVG、
NDVI对模型的贡献较大, DNVR对模型的贡献最小;
对于翅碱蓬群落, DNVR的贡献最大, 其次是DNVG,
DNNIR和NDVI对模型的贡献相当, 且小于DNVR与
DNVG, DNSIR对模型的贡献最小。3)以环境变量和光
谱变量作为预测变量, 对于柽柳灌丛, ALT、SP、
DNVR和DNVG对模型的贡献较大; 对于芦苇草甸,
ALT、SP、DC和DR对模型的贡献最大, DNVG和NDVI
对模型的贡献次之; 对于翅碱蓬群落, ALT、SP、DC
和DR对模型的贡献较大, DNVR和NDVI对模型的贡
献较大。
基于表2中的GAM模型, 我们首先对各个植被
类型在研究区内各个预测单元(栅格)上出现的概率
进行了计算(图5), 通过比较各个植被类型在同一预
测单元上的分布概率的大小, 最终确定了各个预测
单元的植被类型(图6)。
3.3 模型的验证
本研究采用D2值检验、ROC曲线和野外采样点
表2 3种植被类型的广义加法模型
Table 2 Generalized additive models of three vegetation types
预测变量
Predictive variables
植被类型
Vegetation type
样本数
Number of
samples
模型
Model
AUC D2
柽柳灌丛
Tamarix chinensis shrub
56 s (SP, 4) + s (ALT, 4) + s (DR, 4) 0.863 0.36
芦苇草甸
Phragmites australis meadow
48 s (SP, 4) + s (ALT, 4) + s (DR, 4) + s (DC, 4) 0.900 0.44
环境变量
Environmental
variable
翅碱蓬群落
Suaeda heteroptera community
20 s (SP, 4) + s (ALT, 4) + s (DR, 4) + s (DC, 4) 0.795 0.20
柽柳灌丛
Tamarix chinensis shrub
56 s (DNSIR, 4) + s (DNNIR, 4) + s (DNVG, 4) + s (NDVI, 4) +
s (DNVR, 4)
0.842 0.291
芦苇草甸
Phragmites australis meadow
48 s (DNSIR, 4) + s (DNVR, 4) + s (DNNIR, 4) + s (DNVG, 4) +
s (NDVI, 4)
0.855 0.335
光谱变量
Spectral variable
翅碱蓬群落
Suaeda heteroptera community
20 s (DNSIR, 4) + s (DNVR, 4) + s (DNNIR, 4) + s (DNVG, 4) +
s (NDVI, 4)
0.797 0.268
柽柳灌丛
Tamarix chinensis shrub
56 s (SP, 4) + s (ALT, 4) + s (DNSIR, 4) + s (DNVR, 4) +
s (DNNIR, 4) + s (DNVG, 4) + s (NDVI, 4) + s (DR, 4) +
s (DC, 4)
0.938 0.561
芦苇草甸
Phragmites australis meadow
48 s (SP, 4) + s (ALT, 4) + s (DNSIR, 4) + s (DNVR, 4) +
s (DNNIR, 4) + s (DNVG, 4) + s (NDVI, 4) + s (DR, 4) +
s (DC, 4)
0.941 0.554
环境变量+光谱变量
Environmental vari-
able + spectral vari-
able
翅碱蓬群落
Suaeda heteroptera community
20 s (SP, 4) + s (ALT, 4) + s (DNSIR, 4) + s (DNVR, 4) +
s (DNNIR, 4) + s (DNVG, 4) + s (NDVI, 4) + s (DR, 4) +
s (DC, 4)
0.884 0.412
括号中的4是spline平滑曲线的自由度。 ALT, 海拔; AUC, ROC曲线下的面积; D2, 偏差; DC, 至海岸线最近距离; DR, 至黄河最近距离; NDVI,
归一化植被指数; DNNIR, 近红外波段灰度值; DNSIR, 短波红外波段灰度值; DNVG, 绿波段灰度值; DNVR, 红波段灰度值; s, spline平滑曲线; SP,
坡度。
4 in the bracket is the degree of freedom of the smoothing curve. ALT, altitude; AUC, area of under ROC curve; D2, deviance; DC, nearest distance to
coastline; DR, nearest distance to the Yellow River; NDVI, normalized difference vegetation index; DNNIR, digital number near infrared band; DNSIR,
digital number of short infrared band; DNVG, digital number of visible green band; DNVR, digital number of visible red band; s, spline smoothing
curve; SP, slope.
1114 植物生态学报 Chinese Journal of Plant Ecology 2012, 36 (10): 1106–1119
www.plant-ecology.com
表3 预测变量对广义加法模型的贡献
Table 3 Contribution of predictive variables to the generalized additive models
预测变量
Predictive
variables
坡度
Slope
海拔
Altitude
至海岸线
最近距离
Nearest
distance to
coastline
至黄河
最近距离
Nearest
distance to
the Yellow
River
短波红
外波段
灰度值
Digital
number
of short
infrared
band
红波段
灰度值
Digital
number
of visible
red band
近红外
波段灰
度值
Digital
number
near
infrared
band
绿波段
灰度值
Digital
number
of visi-
ble green
band
归一化
植被指数
Normal-
ized dif-
ference
vegetation
index
柽柳灌丛
Tamarix chinensis shrub
49.5 248.1 − 171.6 − − − − −
芦苇草甸
Phragmites australis meadow
130.1 83.5 96.9 228.3 − − − − −
环境变量
Environmental
variable
翅碱蓬群落
Suaeda heteroptera community
36.4 116.8 74.9 175.5 − − − − −
柽柳灌丛
Tamarix chinensis shrub
− − − − 91.1 70.9 16.2 59.2 23.4
芦苇草甸
Phragmites australis meadow
− − − − 38.2 23.5 39.8 33.9 33.4
光谱变量
Spectral variable
翅碱蓬群落
Suaeda heteroptera community
− − − − 20.6 79.3 45.9 54.5 43.8
柽柳灌丛
Tamarix chinensis shrub
40.2 130.3 7.6 37.4 20.7 61.2 26.2 42.5 36.6
芦苇草甸
Phragmites australis meadow
84.8 57.8 95.1 107.7 17.3 22.5 7.1 40.7 29.5
环境变量+
光谱变量
Environmental
variable +
spectral variable 翅碱蓬群落
Suaeda heteroptera community
34.9 96.5 57.5 97.1 15.4 64.7 40.1 32.8 77.7
预测变量的贡献是通过计算每个预测变量从模型中移出时模型剩余残差的变化量来进行量化的。
The contribution of predictive variable is quantified by calculating the average changes in residual deviance when dropping each variable from the
model.
验证三种方法对模拟结果进行了验证。
3.3.1 D2值检验
对于3种植被类型, 在综合采用环境变量和光
谱变量作为预测变量的时候, 其拟合模型的D2值
(表2)均要大于单独以环境变量或者光谱变量作为
预测变量时拟合模型的D2值, 说明综合采用环境变
量和光谱变量作为预测变量在一定程度上提升了
模型的预测能力。同时也可以看到, 最大的D2值为
0.561 (表2), 这也说明拟合的模型不能完全解释植
被空间分布规律。
3.3.2 ROC曲线
对于3种植被类型, 在综合采用环境变量和光
谱变量作为预测变量的时候, 其拟合模型的ROC曲
线的AUC值(表2)均要大于单独以环境变量或光谱
变量作为预测变量时拟合模型的AUC值, 这也说明
综合采用环境变量和光谱变量作为预测变量在一
定程度上改善了模型的预测效果。另外, 对于3种植
被类型, 综合采用环境变量和光谱变量作为预测变
___________________________________________________________________________________________
→
图5 基于广义加法模型预测的3种植被类型分布概率。At、Ap、As分别表示柽柳灌丛、芦苇草甸和翅碱蓬群落在情景A中
预测的分布概率; Bt、Bp、Bs分别表示柽柳灌丛、芦苇草甸和翅碱蓬群落在情景B中预测的分布概率; Ct、Cp、Cs分别表示
柽柳灌丛、芦苇草甸和翅碱蓬群落在情景C中预测的分布概率。情景A是以环境变量作为预测变量; 情景B是以光谱变量作为
预测变量; 情景C是以环境变量与光谱变量作为预测变量。 图6 基于广义加法模型预测的3种植被类型分布图。A, 以环境
变量作为预测变量。B, 以光谱变量作为预测变量。C, 以环境变量和光谱变量作为预测变量。
Fig. 5 Predicted distribution probability of three vegetation types based on generalized additive model. At, Ap and As is respec-
tively the predicted distribution probability of Tamarix chinensis shrub, Phragmites australis meadow, Suaeda heteroptera commu-
nity under scene A; Bt, Bp and Bs is respectively the predicted distribution probability of Tamarix chinensis shrub, Phragmites aus-
tralis meadow, Suaeda heteroptera community under scene B; Ct, Cp and Cs is respectively the predicted distribution probability of
Tamarix chinensis shrub, Phragmites australis meadow, Suaeda heteroptera community under scene C. Scene A, using environ-
mental variables as predictive variables; Scene B, using spectral variables as predictive variables; Scene C, using both environmental
variables and spectral variables as predictive variables. Fig. 6 Predicted distribution map of three vegetation types based on gener-
alized additive models. A, using environmental variables as predictive variables. B, using spectral variables as predictive variables.
C, using both environmental variables and spectral variables as predictive variables.
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1115
doi: 10.3724/SP.J.1258.2012.01106
1116 植物生态学报 Chinese Journal of Plant Ecology 2012, 36 (10): 1106–1119
www.plant-ecology.com
表4 广义加法模型验证结果
Table 4 Validation results of generalized additive model
预测变量
Predictive variables
验证样方的植被类型
Vegetation type of the quadrat for validation
广义加法模型预测的植被类型
Predicted vegetation type by generalized additive model
柽柳灌丛
Tamarix chinensis
shrub
芦苇草甸
Phragmites australis
meadow
翅碱蓬群落
Suaeda heteroptera
community
柽柳灌丛 Tamarix chinensis shrub 36.7% 43.4% 19.9%
芦苇草甸 Phragmites australis meadow 14.7% 58.9% 26.4%
光谱变量
Spectral variable
翅碱蓬群落 Suaeda heteroptera community 18.4% 30.4% 51.2%
柽柳灌丛 Tamarix chinensis shrub 34.1% 37.2% 28.7%
芦苇草甸 Phragmites australis meadow 23.1% 57.7% 19.2%
环境变量
Environmental variable
翅碱蓬群落 Suaeda heteroptera community 23.1% 22.8% 54.1%
柽柳灌丛 Tamarix chinensis shrub 52.1% 30.6% 17.3%
芦苇草甸 Phragmites australis meadow 10.5% 82.7% 6.8%
环境变量+光谱变量
Environmental variable +
spectral variable
翅碱蓬群落 Suaeda heteroptera community 16.1% 16.6% 67.3%
表中数字含义以表中第一行数据为例, 在所有的柽柳灌丛的验证样方中, 36.7%被预测为柽柳灌丛, 43.4%被预测为芦苇草甸, 19.9%被预测为
翅碱蓬群落。
The meaning of the number in the table mean, such as data of the first row, of all the validation quadrats of Tamarix chinensis shrub, 36.7% are pre-
dicted as Tamarix chinensis shrub, 43.4% as Phragmites australis meadow, and 19.9% as Suaeda heteroptera community.
量的模型的AUC值均大于0.8 (表2), 说明拟合的结
果是可以接受的(Hosmer & Lemeshow, 2000)。
3.3.3 野外采样点验证
当以环境变量作为预测变量的时候, 3种植被
类型的预测正确率较低(表4); 当以光谱变量作为
预测变量时, 预测正确率也较低(表4); 当同时以环
境变量和光谱变量作为预测变量时, 预测正确率得
到了较大的提高(表4)。同时我们还可以看到, 在这3
种植被类型中, 芦苇草甸预测正确率最高, 翅碱蓬
群落次之, 柽柳灌丛最低。
4 讨论
4.1 预测精度分析
传统的遥感影像分类方法以光谱信息为基础
进行分类, 而本研究综合考虑了植物群落的物种组
成, 环境因子以及植物群落的光谱特征, 通过GAM
建立植物群落特征与预测变量之间的响应模型, 进
行植被遥感分类。与传统的遥感影像分类方法相比,
本研究的方法在理论上具有一定的优势, 但由于模
型响应变量、环境与光谱数据本身存在的缺陷, 导
致分类结果难以达到理想状态。在本研究中, 柽柳
灌丛、芦苇草甸和翅碱蓬群落的预测精度分别为
52.1%、82.7%和67.3%, 平均精度为67.4%。叶庆华
等(2004)采用监督分类与非监督分类对黄河三角洲
进行遥感分类的原始分类精度为65% (未经过分类
后处理), 与之相比, 本研究的分类精度略有提高,
但是提高幅度不大。因此, 在未来的研究中, 需要
对响应变量(植被调查数据)处理、数据时空尺度匹
配等方面进行进一步的研究与改进, 以期不断提高
模型的预测精度。
本研究还发现: 对于不同的植被类型, 模型预
测精度存在较大的差异。芦苇草甸的预测精度最高,
翅碱蓬群落次之, 柽柳灌丛最低。具体原因可以从
两方面分析: 一是用于建模的样本数量, 二是群落
结构的差异。本研究中用于建模的柽柳灌丛的样方
为56个, 芦苇草甸的样方为48个, 翅碱蓬群落样方
为20个, 而柽柳灌丛的预测精度最低, 这说明样本
数量不是导致不同植被类型预测精度差异较大的
主要因素, 群落结构的差异可能是出现较大差异的
主要原因。柽柳为灌木, 冠幅的直径在1–2 m之间,
柽柳灌丛盖度较低(图2), 灌丛之间往往有芦苇、白
茅(Imperata cylindrica)和翅碱蓬等群落分布, 本研
究所使用的遥感数据的空间分辨率为10 m, 这样就
会发生较为复杂的混合光谱现象(Goward et al.,
1994), 柽柳灌丛很容易被误分为芦苇草甸等其他
群落(表4)。芦苇草甸的盖度较高, 且芦苇草甸的群
落结构简单, 芦苇为唯一的优势种, 伴生种较少且
大都生长在群落底部, 所以从遥感影像上提取的灰
度值可以较好地反映芦苇草甸的光谱特征, 预测效
果较好。翅碱蓬群落的盖度变化较大, 变化范围在
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1117
doi: 10.3724/SP.J.1258.2012.01106
20%–90%之间, 翅碱蓬群落的物种组成也较为简
单, 翅碱蓬处于绝对优势的地位, 伴生物种较少,
所以翅碱蓬群落的预测精度高于柽柳灌丛, 但是低
于芦苇草甸。所以, 群落结构对预测结果有较大的
影响, 盖度较大的植被类型的预测效果好于盖度较
小的稀疏植被类型, 这个结论和Dirnböck等(2003)
的研究结果是一致的。
4.2 预测变量及其对模型的贡献分析
通过表2和表3可以看出, 植被类型不同, 拟合
的GAM模型就不同, 各个预测变量对模型的贡献
不同。从总体上看, ALT、SP、DC、DR、DNSIR、
DNVR、DNVG和NDVI对模型有较大的影响(表3)。在
黄河三角洲, 海洋与黄河是地表特征的主要塑造
者, 海拔的变化, 小地形的起伏, 不仅决定着土壤
质地的砂、壤、黏性, 而且对地下水的状况、地面
蒸发强弱、土壤含盐量及土壤发育均有深刻的影响,
进一步影响植被的空间分布格局(叶庆华等, 2004;
Song et al., 2009)。在本研究中, ALT、SP、DC和DR
等变量被选入各个植被类型的GAM模型, 且对模
型的贡献较大, 这也证明海拔、坡度、海洋和黄河
对植被空间分布格局有重要的影响。绿波段、红波
段、近红外波段、短波红外波段和NDVI被选入模型,
这与植物在不同波段下的光谱特征有密切联系。绿
波段位于植物的反射峰附近, 对健康茂盛植物反射
敏感, 可以识别植物种类和评价植物的生产力; 红
波段位于叶绿素的主要吸收带, 可用于区分植物类
型、覆盖度, 判断植物生长状况等; 近红外波段位
于植物的高反射区, 具有较强的植物识别、分类能
力; 短波红外波段位于两个水体吸收带之间, 对植
物和土壤水分含量敏感, 区分植物类型能力较强;
NDVI是近红外与红色波段反射率比值的一种变换
形式, 是单位像元内的植被类型、覆盖形态、生长
状况等的综合反映(赵英时, 2003)。所以, 绿波段、
红波段、近红外波段、短波红外波段和NDVI都具有
较强的植被类型识别能力, 它们被选入模型是合理
的。另外, 随着植被类型不同, 选入模型的波段不
同, 其对模型的贡献也不同, 如柽柳灌丛, 短波红
外波段对其识别能力较强, 而红波段和绿波段对芦
苇草甸和翅碱蓬群落的识别能力较强, 这些则反映
了不同植物的叶肉组织结构、色素含量等方面存在
差异。我们还发现, 同一预测变量在不同的建模情
景下对模型的贡献不同, 如柽柳灌丛, 单独以光谱
变量进行建模时, 短波红外波段对模型的贡献最
大, 但是, 当综合环境变量与光谱变量建模时, 红
波段对模型的贡献最大, 环境变量与光谱变量的耦
合效应可能是导致预测变量对模型的贡献出现变
化的原因。
4.3 响应变量对模拟精度的影响
针对本研究的目的, GAM要求输入的响应变量
是0/1类型的二元数据。为得到0/1类型的二元数据,
本研究对植被调查数据做如下处理: 对于某种植被
类型, 如果其物种的重要值最大, 那么这个样方所
代表的样点数据就为1, 否则这个样点的数据就为
0。但是, 这种处理方式会带来一些问题。比如, 有
的样方中具有两个优势种a和b, 而且a和b的重要值
很接近, 但是a的重要值稍大于b, 按照我们的处理
办法, 这个样方就会归到a类型, 但是, 这个样方在
很大程度上也反映了b类型的特征。另外, 响应变量
是基于群落物种组成, 建模的实质是建立群落物种
组成和环境变量、光谱特征之间的关系。但是, 植
被的光谱特征对植被的生物量、叶面积指数以及净
初级生产量等指标的变化比较敏感, 而反映群落物
种组成变化的能力相对较弱(Treitz et al., 1992), 所
以, 模型中的光谱数据的解释能力相对较弱。
4.4 数据时空尺度对模拟精度的影响
现有研究表明, 在黄河三角洲, 影响植被分布
的环境变量主要是海拔、坡度、地下水位、土壤全
盐含量、土壤有机质含量和土壤全氮含量等(Song et
al., 2009)。但是限于人力、物力, 本研究无法获取
空间分辨率较高的地下水位、土壤全盐含量、土壤
有机质含量和土壤全氮含量的栅格数据, 因此在建
模的时候只采用海拔、坡度、至海岸线和黄河的最
近距离作为环境变量进行模拟, 造成大量信息的缺
失, 削弱了环境变量的解释能力。而且, 本研究所
使用的DEM数据的空间分辨率为50 m, 限于精度,
部分微地貌的特征难以被精细地刻画(Dirnböck et
al., 2003), 所以环境变量的解释能力受到了很大的
限制。另一方面, 本研究的遥感数据是四波段、空
间分辨率为10 m的SPOT5多光谱影像, 其空间分辨
率较高, 但是光谱分辨率较低。较高的空间分辨率
在一定程度上削弱了混合光谱的效应, 提高了遥感
数据的解释能力, 但是较低的光谱分辨率也导致其
提供的光谱信息较少, 降低遥感数据的解释能力。
所以, 提高遥感数据的空间分辨率和光谱分辨率可
1118 植物生态学报 Chinese Journal of Plant Ecology 2012, 36 (10): 1106–1119
www.plant-ecology.com
以有效地提高模型的预测精度。
时空尺度的匹配对预测精度也存在着一定的
影响。在时间尺度上, 本研究所使用的植被调查资
料是在2006–2008年6–9月收集的, 而遥感影像成像
于2005年9月, 因为植被的光谱特征在不同时间段
内会产生一定的变化, 所以遥感数据难以准确地反
映当时植被的光谱特征。在空间尺度上主要是植被
样方的大小和DEM、遥感影像空间分辨率之间的差
异。理论上, 植被样方的大小和DEM、遥感影像空
间分辨率应一致, 但是在实践中却很难做到, 这会
给预测精度带来一定的负面影响 (Estes et al.,
2010)。
5 小结
本研究的结果表明, 综合使用环境变量和遥感
数据作为预测变量有效地提高了模型的预测精度。
海拔、坡度、至海岸线和黄河的最近距离以及大部
分基于遥感数据的预测变量被选入GAM模型, 但
是, 同一预测变量在不同的植被模型中的作用不同,
同一预测变量在不同的建模情景下对模型的贡献不
同。不同的植被类型的预测精度不同, 盖度较高的植
被类型的预测精度高于盖度较低的植被类型。
致谢 国家自然科学基金青年基金(41001384)资
助。
参考文献
Austin MP (1980). Searching for a model for use in vegetation
analysis. Vegetatio, 42, 11–21.
Berberoglu S, Curran PJ, Loyd CD, Atkinson PM (2007). Tex-
ture classification of Mediterranean land cover. Interna-
tional Journal of Applied Earth Observation and Geoin-
formation, 9, 322–334.
Cawsey EM, Austin MP, Baker BL (2002). Regional vegeta-
tion mapping in Australia: a case study in the practical use
of statistical modelling. Biodiversity and Conservation,
11, 2239–2274.
Chang CC, Lee PF, Bai ML, Lin TT (2004). Predicting the
geographical distribution of plant communities in complex
terrain: a case study in Fushian Experimental Forest,
northeastern Taiwan. Ecography, 27, 577–588.
Deering DW (1978). Rangeland Reflectance Characteristics
Measured by Aircraft and Spacecraft Sensors. PhD
dissertation, Texas A & M University, College Station,
USA. 338.
Dirnböck T, Dullinger S, Grabherr G (2001). A new grassland
community in the Eastern Alps (Austria): evidence of en-
vironmental distribution limits of endemic plant commu-
nities. Phytocoenologia, 31, 521–536.
Dirnböck T, Dullinger S, Grabherr G (2003) A regional impact
assessment of climate and land use change on alpine
vegetation. Journal of Biogeography, 30, 401–418.
Estes LD, Reillo PR, Mwangi AG, Okin GS, Shugart HH
(2010). Remote sensing of structural complexity indices
for habitat and species distribution modeling. Remote
Sensing of Environment, 114, 792–804.
Ferrier S, Guisan A (2006). Spatial modelling of biodiversity at
the community level. Journal of Applied Ecology, 43,
393–404.
Frizzelle BG, Moody A (2001). Mapping continuous distribu-
tions of land cover: a comparison of maximum-likelihood
estimation and artificial neural networks. Photogrammet-
ric Engineering and Remote Sensing, 67, 693–705.
Goward SN, Huemmerich KF, Waring RH (1994). Visible-near
infrared spectral reflectance of landscape components in
western Oregon. Remote Sensing of Environment, 47,
190–203.
Guisan A, Zimmermann NE (2000). Predictive habitat distribu-
tion models in ecology. Ecological Modelling, 135,
147–186.
Hastie TJ, Tibshirani RJ (1990). Generalized Additive Models.
Chapman and Hall, London.
He XH (赫晓慧), Wen ZM (温仲明), Wang JX (王金鑫)
(2008). Spatial distribution of major grassland species and
its relations to environment in Yanhe River catchment
based on generalized additive model. Chinese Journal of
Ecology (生态学杂志), 27, 1718–1724. (in Chinese with
English abstract)
Hosmer DW, Lemeshow S (2000). Applied Logistic Regres-
sion. Wiley & Sons, New York.
Leathwick JR (2001). New Zealand’s potential forest pattern as
predicted from current species-environment relationships.
New Zealand Journal of Botany, 39, 447–464.
Lehmann A, Overton JM, Leathwick JR (2002). GRASP: gen-
eralized regression analysis and spatial prediction. Eco-
logical Modelling, 157, 189–207.
Liu XP (刘小平), Li X (黎夏), Peng XJ (彭晓鹃), Li HB (黎海
波), He JQ (何晋强) (2007) . Swarm intelligence for clas-
sification of remote sensing data. Science in China Series
D: Earth Sciences (中国科学D辑: 地球科学), 51, 79–87.
(in Chinese)
Olden JD, Joy MK, Death RG (2006). Rediscovering the spe-
cies in community-wide predictive modeling. Ecological
Applications, 16, 1449–1460.
Phillips SJ, Dudik M (2008). Modeling of species distributions
with Maxent: new extensions and a comprehensive
evaluation. Ecography, 31, 161–175.
Sanders ME, Dirkse GM, Slim PA (2004). Objectifying the-
matic, spatial and temporal aspects of vegetation mapping
for monitoring. Community Ecology, 5, 81–91.
宋创业等: 采用广义加法模型整合数字高程模型和遥感数据进行植被分布预测 1119
doi: 10.3724/SP.J.1258.2012.01106
Shen ZH (沈泽昊), Zhao J (赵俊) (2007). Prediction of the
spatial patterns of species richness based on the
plant-topography relationship: an application of GAMs
approach. Acta Ecologica Sinica (生态学报 ), 27,
953–963. (in Chinese with English abstract)
Song CY, Liu GH, Liu QS (2009). Spatial and environmental
effects on plant communities in the Yellow River Delta,
Eastern China. Journal of Forestry Research, 20, 117–
122.
Song YC (宋永昌) (2001). Vegetation Ecology (植被生态学).
East China Normal University Press, Shanghai. (in Chi-
nese)
Stow D, Hamada Y, Coulter L, Anguelova Z (2008). Monitor-
ing shrubland habitat changes through object-based
change identification with airborne multispectral imagery.
Remote Sensing of Environment, 112, 1051–1061.
Thuiller W (2003). BIOMOD-optimizing predictions of species
distributions and projecting potential future shifts under
global change. Global Change Biology, 9, 1353–1363.
Thuiller W, Brotons L, Araújo MB, Lavorel S (2004). Effects
of restricting environmental range of data to project cur-
rent and future species distributions. Ecography, 27,
165–172.
Treitz PM, Howarth PJ, Suffling RC (1992). Application of
detailed ground information to vegetation mapping with
high spatial resolution digital imagery. Remote Sensing of
Environment, 42, 65–82.
Wen ZM (温仲明), Jiao F (焦峰), Jiao JY (焦菊英) (2008).
Prediction and mapping of potential vegetation distribu-
tion in Yanhe River catchment in hilly area of Loess Pla-
teau. Chinese Journal of Applied Ecology (应用生态学
报), 19, 1897–1904. (in Chinese with English abstract)
White PS, Wilds SP, Stratton DA (2001). The distribution of
heath balds in the Great Smoky Mountains, North Caro-
lina and Tennessee. Journal of Vegetation Science, 12,
453–466.
Xu XG (许学工) (1997). An analyses on the land structure in
the Yellow River Delta. Acta Geographica Sinica (地理学
报), 52, 18–26. (in Chinese with English abstract)
Yang CJ (杨存建), Zhou CH (周成虎) (2001). Investigation on
classification of remote sensing image on basis of knowl-
edge. Geography and Territorial Research (地理学与国
土研究), 17, 72–77. (in Chinese with English abstract)
Ye QH (叶庆华), Tian GL (田国良), Liu GH (刘高焕), Ye JM
(叶景敏), Lou WG (娄维国) (2004). Tupu analysis on the
land cover evolving patterns in the new-born wetland of
the Yellow River Delta. Geographical Research (地理研
究), 23, 257–264. (in Chinese with English abstract)
Zhang JT (张金屯) (1995). Quantitative Method of Vegetation
Ecology (植被数量生态学方法 ). China Science and
Technology Press, Beijing. (in Chinese)
Zhang RQ, Zhu DL (2011). Study of land cover classification
based on knowledge rules using high-resolution remote
sensing images. Expert Systems with Applications, 38,
3647–3652.
Zhao YM (赵延茂), Song CS (宋朝枢) (1995). Scientific Sur-
vey of the Yellow River Delta National Nature Reserve (黄
河三角洲国家级自然保护区科学考察集). China For-
estry Publishing House, Beijing. (in Chinese)
Zhao YS (赵英时) (2003). The Principle and Method of Analy-
sis of Remote Sensing Application (遥感应用分析原理与
方法). Science Press, Beijing. (in Chinese)
责任编委: 江 洪 责任编辑: 王 葳