免费文献传递   相关文献

Comparative evaluation of multiple models of the effects of climate change on the potential distribution of Pinus massoniana

气候变化对马尾松潜在分布影响预估的多模型比较


物种分布模型被广泛应用于评估气候变化对物种分布的影响。随着计算机和统计学的发展, 模拟物种分布的模型层出不穷, 但对这些模型的相对表现知之甚少, 因此需要对其进行对比分析, 以便更可靠地评估气候变化的影响。该文采用3个比较新颖的组合集成学习(ensemble learning)模型(随机森林(random forest, RF)、广义助推法和NeuralEnsembles)、3个常规模型(广义线性模型、广义加法模型和分类回归树)、3个大气环流模型(global circulation model, GCM) (MIROC32_medres, JP; CCCMA_CGCM3, CA; BCCR-BCM2.0, NW)和一个气体排放情景(SRES_A2), 模拟分析了马尾松(Pinus massoniana)历史基准气候(1961-1990)和未来3个不同时期(2010-2039, 2020s; 2040-2069, 2050s; 2070-2099, 2080s)的潜在分布。基于环境阈值方法选择物种不发生区, 依据ClimateChina软件进行当前和未来气候数据的降尺度处理, 采用接收机工作特征曲线(receiver operator characteristic, ROC)下的面积(area under the curve, AUC)、Kappa值和真实技巧统计法(true skill statistic, TSS)以及马尾松种子区划范围来评价模型的预测精度。结果表明: 6个物种分布模型都具有较高的预测精度, 但组合集成学习模型的预测精度稍高于其他常规模型, 其中RF的预测精度最高。3个GCM和6个模型模拟条件下, 马尾松对气候变化的响应格局既有一致性也有异同性。一致性表现在: 随着时间的推移, 马尾松分布区将逐渐向北迁移, 未来潜在分布区的面积将逐渐增加; 异同性表现在: 在不同模型和不同气候情景下, 马尾松潜在分布区的迁移距离和面积变化幅度不同, 其中NW模式下预测的变化幅度小于CA和JP模式; RF模型预测的分布区迁移距离和面积变化幅度最大。随着时间的推移, 未来马尾松的18个潜在分布空间预测图(6个模型 × 3 GCM)之间的差异也逐渐增大, 其中空间不一致性地区主要集中发生在马尾松潜在分布区的北部和西部边缘地带。模型本身不同的构建原理以及GCM之间的差异是导致预测结果存在差异的主要原因。

Aims New, powerful statistical techniques and GIS tools have resulted in a plethora of methods for modelling species distribution. However, little is known about the relative performance of different models in simulating and projecting species’ distributions under future climate. Our objective is to compare novel ensemble learning models with other conventional models by modelling the potential distribution of Masson pine (Pinus massoniana) and identifying and quantifying differences in model outputs.
Methods We simulated Masson pine potential distribution (baseline 1961-1990) and projected future potential distributions for three time periods (2010-2039, 2040-2069 and 2070-2099) using three global circulation models (GCM) (MIROC32_medres, JP; CCCMA_CGCM3, CA, and BCCR-BCM2.0, NW), one pessimistic SRES emissions scenario (A2), three ensemble learning models (random forest, RF; generalized boosted model, GBM, and NeuralEnsembles) and three conventional models (generalized linear model, GLM; generalized additive models, GAM, and classification and regression model, CART). The environmental envelope method was used to select absence of species. The area under the curve (AUC) values of receiver operator characteristic (ROC) curve, Kappa and true skill statistic (TSS) were used to objectively assess the predictive accuracy of each model. National standards for seed zone of Masson pine (GB 8822.6-1988) was employed to intuitively assess model performance. We developed ClimateChina software to downscale current and future GCM climate data and calculate seasonal and annual climate variables for specific locations based on latitude, longitude and elevation.
Important findings Ensemble learning models (GBM, NeuralEnsembles and RF) achieved a higher predictive success in simulating the distribution of Masson pine compared to other conventional models (CART, GAM and GLM). RF had the highest predictive accuracy, and CART had the lowest. Masson pine shows a globally consistent pattern in response to climate change for the three GCMs and six models, i.e., Masson pine will likely gradually shift northward and expand its distribution under altered future climate, with the magnitude of range changes dependent on model classes and GCMs. RF predicts a greater magnitude of range changes than other models. Projections of Masson pine distribution by NW are more conservative than JP and CA climate scenarios. In the case of Masson pine, range changes are mainly attributed to the colonization of newly available suitable habitat in high-latitudes and unchanging habitat suitability in the south-central part of its baseline range. Differences among 18 projections (6 models × 3 GCMs) increase with increasing time, and the greatest spatial uncertainty in projections is mainly in the north and west borders of the potential distribution range.


全 文 :植物生态学报 2011, 35 (11): 1091–1105 doi: 10.3724/SP.J.1258.2011.01091
Chinese Journal of Plant Ecology http://www.plant-ecology.com
——————————————————
收稿日期Received: 2010-11-26 接受日期Accepted: 2011-04-22
* 通讯作者Author for correspondence (E-mail: liusr@caf.ac.cn)
气候变化对马尾松潜在分布影响预估的多模型比较
张 雷1 刘世荣1* 孙鹏森1 王同立2
1中国林业科学研究院森林生态环境与保护研究所, 国家林业局森林生态环境重点实验室, 北京 100091; 2Department of Forest Sciences, University of
British Columbia, 3041-2424 Main Mall, Vancouver B.C. Canada V6T 1Z4
摘 要 物种分布模型被广泛应用于评估气候变化对物种分布的影响。随着计算机和统计学的发展, 模拟物种分布的模型层
出不穷, 但对这些模型的相对表现知之甚少, 因此需要对其进行对比分析, 以便更可靠地评估气候变化的影响。该文采用3个
比较新颖的组合集成学习(ensemble learning)模型(随机森林(random forest, RF)、广义助推法和NeuralEnsembles)、3个常规模
型(广义线性模型、广义加法模型和分类回归树)、3个大气环流模型(global circulation model, GCM) (MIROC32_medres, JP;
CCCMA_CGCM3, CA; BCCR-BCM2.0, NW)和一个气体排放情景(SRES_A2), 模拟分析了马尾松(Pinus massoniana)历史基准
气候(1961–1990)和未来3个不同时期(2010–2039, 2020s; 2040–2069, 2050s; 2070–2099, 2080s)的潜在分布。基于环境阈值方法
选择物种不发生区, 依据ClimateChina软件进行当前和未来气候数据的降尺度处理, 采用接收机工作特征曲线(receiver
operator characteristic, ROC)下的面积(area under the curve, AUC)、Kappa值和真实技巧统计法(true skill statistic, TSS)以及马尾
松种子区划范围来评价模型的预测精度。结果表明: 6个物种分布模型都具有较高的预测精度, 但组合集成学习模型的预测精
度稍高于其他常规模型, 其中RF的预测精度最高。3个GCM和6个模型模拟条件下, 马尾松对气候变化的响应格局既有一致性
也有异同性。一致性表现在: 随着时间的推移, 马尾松分布区将逐渐向北迁移, 未来潜在分布区的面积将逐渐增加; 异同性
表现在: 在不同模型和不同气候情景下, 马尾松潜在分布区的迁移距离和面积变化幅度不同, 其中NW模式下预测的变化幅
度小于CA和JP模式; RF模型预测的分布区迁移距离和面积变化幅度最大。随着时间的推移, 未来马尾松的18个潜在分布空间
预测图(6个模型 × 3 GCM)之间的差异也逐渐增大, 其中空间不一致性地区主要集中发生在马尾松潜在分布区的北部和西部
边缘地带。模型本身不同的构建原理以及GCM之间的差异是导致预测结果存在差异的主要原因。
关键词 气候变化, 组合集成学习技术, 模型比较, 马尾松, 物种分布模拟
Comparative evaluation of multiple models of the effects of climate change on the potential
distribution of Pinus massoniana
ZHANG Lei1, LIU Shi-Rong1*, SUN Peng-Sen1, and WANG Tong-Li2
1Institute of Forest Ecology, Environment and Protection, Chinese Academy of Forestry, Key Laboratory of Forest Ecology and Environment of State Forestry
Administration, Beijing 100091, China; and 2Department of Forest Sciences, University of British Columbia, 3041-2424 Main Mall, Vancouver B.C. Canada
V6T 1Z4
Abstract
Aims New, powerful statistical techniques and GIS tools have resulted in a plethora of methods for modelling
species distribution. However, little is known about the relative performance of different models in simulating and
projecting species’ distributions under future climate. Our objective is to compare novel ensemble learning
models with other conventional models by modelling the potential distribution of Masson pine (Pinus
massoniana) and identifying and quantifying differences in model outputs.
Methods We simulated Masson pine potential distribution (baseline 1961–1990) and projected future potential
distributions for three time periods (2010–2039, 2040–2069 and 2070–2099) using three global circulation models
(GCM) (MIROC32_medres, JP; CCCMA_CGCM3, CA, and BCCR-BCM2.0, NW), one pessimistic SRES
emissions scenario (A2), three ensemble learning models (random forest, RF; generalized boosted model, GBM,
and NeuralEnsembles) and three conventional models (generalized linear model, GLM; generalized additive
models, GAM, and classification and regression model, CART). The environmental envelope method was used to
select absence of species. The area under the curve (AUC) values of receiver operator characteristic (ROC) curve,
Kappa and true skill statistic (TSS) were used to objectively assess the predictive accuracy of each model.
National standards for seed zone of Masson pine (GB 8822.6-1988) was employed to intuitively assess model
1092 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com
performance. We developed ClimateChina software to downscale current and future GCM climate data and cal-
culate seasonal and annual climate variables for specific locations based on latitude, longitude and elevation.
Important findings Ensemble learning models (GBM, NeuralEnsembles and RF) achieved a higher predictive
success in simulating the distribution of Masson pine compared to other conventional models (CART, GAM and
GLM). RF had the highest predictive accuracy, and CART had the lowest. Masson pine shows a globally
consistent pattern in response to climate change for the three GCMs and six models, i.e., Masson pine will likely
gradually shift northward and expand its distribution under altered future climate, with the magnitude of range
changes dependent on model classes and GCMs. RF predicts a greater magnitude of range changes than other
models. Projections of Masson pine distribution by NW are more conservative than JP and CA climate scenarios.
In the case of Masson pine, range changes are mainly attributed to the colonization of newly available suitable
habitat in high-latitudes and unchanging habitat suitability in the south-central part of its baseline range.
Differences among 18 projections (6 models × 3 GCMs) increase with increasing time, and the greatest spatial
uncertainty in projections is mainly in the north and west borders of the potential distribution range.
Key words climate change, ensemble learning model, model comparision, Pinus massoniana, species distribu-
tion modelling


全球地表平均温度近100年来(1906–2005年)升
高了(0.74 ± 0.18) , ℃ 预计到21世纪末仍将上升
1.1–6.4 ℃ (IPCC, 2007)。气候变暖已成为不争的事
实, 气候变化导致的植物分布区迁移已经有具体的
观测实例。例如, Peñuelas和Boada (2003)通过对比
西班牙Montseny山区当前和1945年的植被分布, 发
现寒温带生态系统逐步被地中海生态系统所代替,
山毛榉(Fagus sylvat ica)森林分布的最高海拔
(1 600–1 700 m)上升了70 m, 在中海拔高度(800–
1 400 m), 山毛榉和石楠(Calluna vulgaris)正被圣栎
(Quercus ilex)代替。在欧洲, Lenoir等(2008)通过比
较1905–1985年与1986–2005年间171个森林树种的
海拔分布发现, 气候变化导致的物种最适宜海拔分
布平均上升速率为29 m·10 a–1。Parmesan和Yohe
(2003)探讨了1 700多个物种在过去20–140年间分布
区的变化, 发现物种分布区的迁移与气候变化相
关; 对其中99个物种的定量分析发现, 气候变化导
致物种分布区北界的平均北向移动速率为6.1 km·
10 a–1, 最高海拔分布高度的平均上升速率为6.1
m·10 a–1; Root等(2003)对143个研究中的1 473个物
种进行了整合分析, 发现有80%的物种的迁移与温
度变化高度相关。然而, 气候变化条件下, 植物群
组不会作为一个完整的整体进行移动, 每个物种的
迁移变化是独立发生的, 群落内的各个树种在未来
气候变化条件下, 会以不同的组合方式聚集在一起
(Webb & Bartlein, 1992)。目前, 气候变化对物种分
布的影响已经越来越受到关注。
物种分布模型(species distribution modelling)是
用来评估气候变化对物种分布影响的主要方法
(Guisan & Zimmermann, 2000; 王娟和倪健, 2006),
中国也广泛开展了气候变化对植物分布影响的研
究(吕佳佳和吴建国, 2009)。由于缺少气候变化影响
植物分布的实证观测, 多以大气环流模型(global
circulation model, GCM)预估或者自定义气候变化
情景为背景, 采用模型模拟的方法预测气候变化对
物种分布的影响。物种分布模型主要分为环境阈值
模型、基于距离的模型、基于回归关系的模型和基
于规则的模型(王娟和倪健, 2006), 这些模型只考虑
了那些控制物种分布的环境因子, 没有考虑物种之
间的相互作用、物种进化、极端干扰事件和物种扩
散过程等。这些模型本质上都是基于生态位理论的,
是根据物种分布与环境之间的统计关系(而不是因
果关系)建立的, 当前物种与环境(气候)之间的相关
关系并不一定能保证适用于预估未来的物种分布。
但基于生态位理论的模型仍然是大尺度下评估气
候变化和土地利用变化对物种和生物多样性分布
影响的最普遍方法(Guisan & Zimmermann, 2000;
Lawler et al., 2006; 王娟和倪健, 2006), 这是由于
在物种地理分布尺度上不能有效地开展实地试验
来预测分布区的迁移, 而这些基于生态位的模型较
容易构建, 并且可以为大量物种的分布区迁移和生
境消失风险提供快速预估; 另一个原因是真正针对
单个物种的基于过程的大尺度模型还鲜有报道, 如
Phenofit模型(Chuine & Beaubien, 2001)。为大量的
张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1093

doi: 10.3724/SP.J.1258.2011.01091
物种建立机理模型需要了解每个物种的生活史和
生理学特性(Lawler et al., 2006), 这将需要巨大的
工作量。随着GIS、计算机、统计学和机器学习技
术的发展, 基于生态位的物种分布模拟模型层出不
穷(Elith et al., 2006; Lawler et al., 2006; Wisz et al.,
2008)。目前物种分布模型呈现出一种“过剩”的趋
势 , 但对各种模型预测能力的差异还知之甚少
(Elith et al., 2006), 尤其是缺少一些新颖模型与传
统模型的对比分析。因此, 在评估气候变化对物种
分布影响的时候, 需要对模型预测能力进行比较分
析, 以选取最适宜的模型获取更稳健的预估结果,
进而制定最佳的适应和减缓气候变化影响的策略。
马尾松(Pinus massoniana)是我国重要的造林
树种, 是我国东南部湿润亚热带地区分布最广、资
源最丰富的森林类型, 既有天然林也有人工林。以
往研究表明: 气候变暖将导致马尾松林分布面积减
少(贺庆棠等, 1996; 徐德应等, 1997), 但这些结果
是基于气候包络模型(bioclimatic envelop model)得
出的, 气候包络模型通常会产生过度估计(Barry &
Elith, 2006; Chefaoui & Lobo, 2008); 此外, 这些研
究成果是基于以往的GCM输出结果, 而那些GCM
已经被当前最新的气候模型所替代。本研究采用最
新的GCM气候变化模型, 比较分析了3个比较新颖
的组合集成学习(ensemble learning)模型(随机森林
(random forest, RF), 广义助推法(generalized boost-
ed model, GBM)和NeuralEnsembles)和3个常规模型
(广义线性模型(generalized linear model, GLM), 广
义加法模型(generalized additive model, GAM)和分
类回归树(classification and regression tree, CART))
对马尾松未来分布区变化预估的差异。
1 材料和方法
1.1 马尾松的空间分布数据
1 : 100万的中国植被图基本反映了我国20世纪
80–90年代的植被分布状况(中国科学院中国植被图
编辑委员会, 2001), 本研究即是从中提取的马尾松
空间分布数据(图1), 因研究是在分辨率为8 km × 8
km的全国范围开展, 需对马尾松的空间分布数据
进行栅格化处理。
1.2 预测变量
一共选用了17个预测变量, 其中7个为与物种
生理特征有关的气候变量: 年平均气温(℃)、最冷
月平均气温(MCMT, ℃)、最暖月平均气温(MWMT,
℃)、气温年较差(MWMT-MCMT, ℃)、年平均降
水量(mm)、平均夏季降水量(5–9月, mm)及大于5
℃的积温。这7个气候变量分别是1961–1990年30年
的平均值。还有10个是连续的土壤变量: 土壤有机
质、N、P和K含量(%)、土壤的粗砂、细砂、粉砂
和黏粒含量(%)、土层厚度(cm)及pH值。土壤变量
从1:100万土壤图中提取。土壤图以及上文的1 : 100
万中国植被图都来源于国家自然科学基金委员会
“中国西部环境与生态科学数据中心 ” (http://
westdc.westgis. ac.cn)。
模型所采用的7个气候变量从我们开发的Climate-
China (V 4.4)气候模型中输出。用Climate-China将
1961–1990年的PRISM数据(Daly et al., 2002)进行降
尺度处理, 基于经纬度和海拔可以提取任意位置的
年、季节和月气候变量。此模型采用双线性插值和
动态海拔调整技术进行降尺度处理, 可以输出38个
直接和衍生的气候变量 (Wang et al., 2006); 以
PRISM数据的降尺度技术为基础, 对CRUTS 2.1的
月气候变量数据(Mitchell & Jones, 2005)进行降尺
度处理, 得到1901–2002年的月、季节和年气候变
量; 运用此模型对几个GCM在未来3个时间段的气
候 (2020s, 2010–2039; 2050s, 2040–2069; 2080s,
2070–2099)进行了降尺度处理, 其数据输出范围覆
盖全国。
1.3 未来气候情景
采用IPCC (2007)报告中参考的3个未来气候变
化GCM: MIROC32_medres (JP)、CCCMA_CGCM3
(CA)和BCCR-BCM2.0 (NW)。这3个GCM都采用
SRES_A2温室气体排放情景下的气候变化情景。A2
情景中, 未来世界的发展很不均衡, 主要特征是自
给自足、保持区域特色、强调家庭价值和当地传统。
不同地区间生产力方式的趋同异常缓慢, 导致人口
持续增长。相应的7个气候变量分别是2010–2039
(2020s)、2040–2069 (2050s)和2070–2099 (2080s) 30
年的平均值。未来气候情景数据也是通过Climate-
China软件进行降尺度得到分辨率为8 km × 8 km的
数据, 使其与栅格化的马尾松空间分布数据相匹
配。
1.4 组合集成学习模型
组合集成学习是指通过训练和组合多个准确
而有差异的分类器, 从而最终提供分类系统识别率
1094 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com

审图号: GS(2011)1123号


图1 不同模型预测的基准气候条件下(1961–1990)马尾松的潜在分布区。CART, 分类回归树; GAM, 广义加法模型; GBM,
广义助推法; GLM, 广义线性模型; RF, 随机森林。
Fig. 1 Potential distribution maps for Pinus massoniana predicted by different models under baseline climate (1961–1990). CART,
classification and regression tree; GAM, generalized additive model; GBM, generalized boosted model; GLM, generalized linear
model; RF, random forest.

的一种新方法, 目前以决策树和神经网络等为基本
分类器的组合集成学习技术研究已经取得了很大
进展, 并且已经成为机器学习领域近10年来最主要
的研究方向之一, 其稳健的表现也得到了广泛的认
可(Clemen, 1989), 但是其在生态学研究中的应用
鲜有报道。
1.4.1 RF模型
RF模型是由Breiman在2001年开发完成的一种
汇总式自学习数据处理方法, 它是一种现代分类与
回归技术 , 同时也是一种组合式的自学习技术
(Breiman, 2001)。这种组合式自学习技术在处理数
据时, 首先对数据进行分类, 然后再对每一类数据
张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1095

doi: 10.3724/SP.J.1258.2011.01091
的分析结果进行汇总分析, 通过汇总分析可以进一
步提高每个分类树数据处理的精度 (Breiman &
Cutler, 2004)。其基本算法是: 假设读者知道单个分
类树的构建, RF通过自举法(bootstrap)随机选择(不
是全部)变量生长成分类“树”, 每个树都会完整生
长而不作修剪(pruning)。并且在生成树的时候, 每
个节点的变量都仅仅由随机选出的少数几个变量
中产生。通过这种随机方式生成的单个、十个、百
个或者成千个树被用于分类和回归分析(因此被称
为“随机森林”)。最终的决策树是通过对潜在的随机
变量树进行“投票”(voting system)表决生成的, 即
RF选择具有最多投票的分类。如果目的是回归, 则
由这些树的结果的平均得到因变量的预测值。RF
具有以下优点(Breiman, 2001): 不会产生过度拟合
(overfitting); 不需要对总体进行分布假定; 对于大
的数据库很有效率, 可以处理大量变量; 在建造森
林时, 它产生一个内部无偏的一般误差的估计(即
范围外误差); 在很大比例的数据缺失时(如变量个
数远大于样本量)仍然保持精度。本研究利用R软件
(R Development Core Team, 2010)中的“RANDOM-
FOREST”模块(Liaw & Wiener, 2002)来执行RF模型
的构建及分布预测。
1.4.2 NeuralEnsembles
NeuralEnsembles (http://www.kent.ac.uk/kbs/
documents/staff/ohanley/neuralensembles.html) 通 过
人工神经网络(artificial neural networks, ANN)模型
来估计物种的生境适宜性(O’Hanley, 2009), 它利用
多个ANN子模型的组合来预测物种分布。Neural-
Ensembles模型通过自举法为每个ANN模型产生独
立的训练数据集, 然后单个模型不断训练直到当前
的组合预测和前一步的组合预测的差异达到近似
最小值为止。在每一步逐步组合构建过程中, 只有
当前ANN的权重得到了更新, 前面模型的权重保持
不变, 当前模型训练完成后被组合到前面的综合模
型中。NeuralEnsembles利用逐步组合构建规则(step-
wise ensemble construction algorithm) (Granitto et
al., 2005)对ANN子模型进行组合集成。ANN模型输
出结果的范围为0–1, 为物种发生的条件概率估计。
NeuralEnsembles预测的输出结果是组合模型产生
的平均生境适宜性以及其标准误差和95%的置信
区间。
1.4.3 GBM
GBM是建立在由Friedman (2001)发明的随机
梯度助推法(gradient boosting machine)基础上的,
它把分类树和助推法(boosting)集成在一起(Elith et
al., 2008)。助推法是一种执行监督分类的机器学习
技术, 在算法上并不受限制, 其基本思想是: 通过
对样本集的操作获得一系列的样本子集, 并对每个
样本子集建立一个弱分类器, 然后将这些分类器进
行加权融合, 生成一个最后的结果分类器(Ridge-
way, 1999; Elith et al., 2006)。在这个过程中, 每个
分类器的分类识别率不一定很高, 但它们组合后具
有很高的识别率, 从而提高了弱分类算法的识别
率。GBM的构建过程被认为是一个前向逐级过程
(forward stagewise procedure), 通过逐步增加分类
树以达到逐步减小偏差(deviance)的目的。GBM中
分类树的个数是复杂性的自然测度, 它通过独立数
据的测试精度来选择 , GBM通过交叉验证(cross
validation)来选择模型预测精度最大时的分类树个
数(Ridgeway, 1999; Elith et al., 2008)。本研究利用R
软件(R Development Core Team, 2010)中的“GBM”
模块(Ridgeway, 2007)执行GBM的构建及预测。
1.5 常规模型
GLM、GAM和CART是物种分布模拟中最常用
的方法, 关于这3个模型特征的详细介绍请参考曹
铭昌等(2005)和李峰等(2006)的文献。本研究利用R
软件进行GLM、GAM和CART分析。
1.6 准不发生数据(pseudo-absence)的处理
把马尾松的实际分布区称为物种发生(pres-
ence)地区, 把不存在地区称为准不发生(pseudo-
absence)地区。RF需要物种的发生和不发生数据进
行建模。准不发生数据不能直接用于建模, 这是由
于历史和生态的原因, 很多适宜马尾松生长的地
区, 当前可能没有物种发生数据, 如果把这些地区
加入到模型中, 可能造成模型预测误差(Wisz &
Guisan, 2009)。为此, 我们需要把这些适宜物种发生
但实际并没有发生的数据从准不发生数据中剔除。
采用类似BIOCLIM (Nix, 1986)的环境阈值方法, 把
准不发生地区中与当前发生地区环境相匹配的部
分删除, 剩余地区可以认为是“真实”不发生地区。
具体过程是根据17个预测变量, 建立一个多维空间
或称为环境包络(environmental envelope), 准不发

1096 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com
生地区中的所有变量都落入这个多维空间的将被
删除, 剩余地区称为“真实”不发生地区。
1.7 模型评估
为验证模型的预测精度, 将全部物种分布数据
(“真实”物种不发生数据+物种发生数据)分为两个
数据集 : 训练子集(validating dataset)和评估子集
(testing dataset)。通过随机取样, 70%的数据用于建
模, 30%的数据用于模型验证。并且保证训练数据集
和验证数据集中“真实”不发生数据和发生数据之间
的比例是恒定的。
采用接收工作机特征曲线下的面积(area under
the curve (AUC) of receiver operator characteristic
(ROC) curves)、Kappa值和真实技巧统计法(true skill
statistic, TSS)来评估模型的预测精度。由于AUC不
受诊断阈值的影响, 且对物种发生率(prevalence)不
敏感 , 因此目前被公认为是最佳的评价指标
(Fielding & Bell, 1997)。AUC评价模型的标准是
(Swets, 1988): 0.90–1.00, 极好; 0.80–0.90, 好; 0.70–
0.80, 一般; 0.60–0.70, 差; 0.50–0.60, 失败。
Kappa值常用于测试空间分布格局的相似性
(Cohen, 1960), 它需要指定一个阈值把物种发生概
率转化为二元值(物种发生和不发生), 本文采用的
是使Kappa值最大时的阈值。Kappa值评估标准为
(Monserud & Leemans, 1992): 1.00–0.85, 极好 ;
0.70–0.85, 很好 ; 0.55–0.70, 好 ; 0.40–0.55, 一般;
< 0.40, 失败。Allouche等(2006)提出了TSS测量方
法, 它既继承了Kappa的优点, 又克服了Kappa值对
物种发生率呈单峰曲线响应形式的弱点。和Kappa
值一样, TSS值的范围是–1到1, 1代表观测值和预测
值完全一致, ≤0代表小于期望一致性。TSS是敏感
度(sensitivity, 物种发生记录被正确预测的比例)和
特异度(specificity, 物种不发生区被正确预测的比
例)的函数(Allouche et al., 2006), 因此也需要把物
种分布概率转化为二元值。
此外 , 还采用种子区划国家标准 (国标GB
8822.6-1988)中马尾松种子区的县域范围(图1)来主
观评估模型的预测能力。
1.8 分布区的迁移及面积变化
由于模型输出结果为马尾松的空间分布概率
图, 且分布区不规则, 其分布区的最南界和最北界
不容易确定, 因此我们通过比较不同情景下分布区
质心(centroid)的变化来分析气候变化条件下马尾
松分布区的迁移方向和迁移幅度。物种分布区质心
通过ARCGIS中的“mean center”函数来实现。
本研究采用物种分布的最适海拔高度(eleva-
tion optima)作为气候变化导致的物种在海拔高度上
分布变化的评价指标, 这是因为它们比极端物种分
布区边界(如最高最低海拔高度)更具有指示意义
(Shoo et al., 2006)。以物种发生概率值作为权重, 采
用加权平均方法来计算物种分布的最适海拔高度
(ter Braak & Looman, 1986)。
为了比较气候变化对马尾松分布区面积变化
的影响, 需要一个阈值把马尾松的空间分布概率图
转化为二元分布图(发生和不发生), 本研究采用的
这个概率阈值是0.5, 规定>0.5为物种发生地区, 反
之为物种不发生地区。
1.9 混合线性模型分析
混合线性模型(mixed linear model)可以有效地处
理重复测量的数据, 并且克服了一般线性模型中反应
变量必须具有独立和等方差的缺点。本文采用混合线
性模型来评估分布区面积变化在模型类型和GCM类
型之间的差异。把模型类型和GCM作为固定效应
(fixed effect), 把未来3次预估时间作为随机效应
(random effect)。采用R软件(R Development Core
Team, 2010)中的“LME”模块进行混合线性模型分析。
2 结果分析
2.1 模型预测精度比较
采用模型测试数据评价模型的预测能力, 由计
算的AUC、Kappa和TSS这3个模型预测能力评价指
标可知, 6个模型的这3个评价指标都大于0.95 (表1),
都具有极好的预测能力。其中, 组合集成学习模型
(RF、GBM和NeuralEnsembles)比常规模型(CART、
GAM和GLM)的预测精度稍高。组合集成学习模型
中, RF的模型预测精度最高, NeuralEnsembles的预
测精度最低; 常规模型中, CART的预测精度最低,
GAM的预测精度最高。
2.2 马尾松当前分布的模拟结果比较
从植被图中提取的马尾松现实分布基本落入
种子区内, 但台湾北部在植被图数据中没有反映
(图1)。采用6个模型分别模拟基准气候条件下马尾
松的潜在分布区。采用国家标准中的种子区划范围
评估模型的预测能力。图1表明, 6个模型预测的分
布图都与种子区范围大体吻合。主要差异体现在:
张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1097

doi: 10.3724/SP.J.1258.2011.01091
表1 模型的预测精度
Table 1 Predictive accuracy of model
模型类型 Model type 评估指标
Evaluation index
RF GBM NeuralEnsembles GAM GLM CART
AUC 1.000 1.000 0.994 1.000 0.999 0.995
Kappa 0.996 0.990 0.985 0.985 0.983 0.980
TSS 0.997 0.992 0.989 0.987 0.986 0.982
AUC, 接收机工作特征曲线下的面积; TSS, 真实技巧统计; CART、GAM、GBM、GLM和RF见图1。
AUC, area under the curve of receiver operator characteristic curve; TSS, true skill statistic; CART, GAM, GBM, GLM and RF see Fig. 1.


表2 未来气候条件下马尾松分布区的北向迁移距离
Table 2 Northward shifting distance for Pinus massoniana under future climate
CA (km) JP (km) NW (km) 模型类型
Model type 2020s 2050s 2080s 2020s 2050s 2080s 2020s 2050s 2080s
CART 28 41 61 15 21 35 6 12 22
GAM 28 46 76 25 43 88 6 17 39
GBM 33 43 64 25 38 50 12 22 38
GLM 12 15 40 10 20 44 1 4 6
NeuralEnsembles 65 88 142 61 95 154 26 56 87
RF 45 54 82 34 50 74 17 29 45
CA, CCCMA_CGCM3; JP, MIROC32_medres; NW, BCCR-BCM2.0。CART、GAM、GBM、GLM和RF见图1。
CA, CCCMA_CGCM3; JP, MIROC32_medres; NW, BCCR-BCM2.0. CART, GAM, GBM, GLM and RF see Fig. 1.


表3 未来气候条件下马尾松最适宜海拔分布高度的上升距离
Table 3 Upward shifting at optimum elevation for Pinus massoniana under future climate
CA (m) JP (m) NW (m) 模型类型
Model type 2020s 2050s 2080s 2020s 2050s 2080s 2020s 2050s 2080s
CART 23 23 57 15 29 60 12 20 42
GAM 7 2 13 –1 1 5 3 8 12
GBM 16 26 55 9 24 55 8 20 46
GLM 15 9 11 8 11 12 10 16 22
NeuralEnsembles –7 0 35 –10 0 21 –2 1 17
RF 3 8 42 –6 4 34 –4 3 22
CART、GAM、GBM、GLM和RF见图1。CA、JP和NW见表2。
CART, GAM, GBM, GLM and RF see Fig. 1. CA, JP and NW see Table 2.


RF中四川盆地底部马尾松的生境适宜性低于其他
模型; 在种子区西南部的广西西部, NeuralEnsem-
bles预测的生境适宜性大于其他模型; 在江苏省种
子区范围外以北, 组合集成学习模型预测的生境适
宜面积大于常规模型。
2.3 气候变化条件下分布区迁移距离的比较
通过对马尾松分布区质心迁移的分析(表2)发
现, 随着时间的推移, 3种气候模式下得出的结论一
致, 即马尾松逐渐向北迁移, 2020s、2050s和2080s
时间段的北向迁移距离分别为6–65、4–88和6–142
km, 但迁移幅度有所不同, 相对来讲, NW情景模
式下北向迁移的幅度较小。不同模型预测的马尾松
北向迁移幅度也不同, 其中NeuralEnsembles预测的
迁移幅度最大, 其次是RF; GLM预测的迁移幅度最
小, 其次是CART; GAM和GBM处于中间, 但两者
的迁移距离大小在不同的GCM和未来时间段也不
同。
气候变化也对马尾松分布的最适宜海拔高度
产生了影响(表3)。在2050s和2080s时间段, 马尾松
最适宜的海拔分布高度与基准气候条件下相比将
升高, 且2080s时间段的增加幅度大于2050s时间段,
对于这一点, 6个模型和3个气候情景下的预测方向
都是一致的, 只是增加幅度不同。然而, 在2020s时
间段, 各个模型和各个气候情景给出的结果不同,
1098 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com
NeuralEnsembles在这个时间段在3个气候情景下都
预测最适宜海拔高度下降, 而CART、GBM和GLM
在3个气候情景下都预测最适宜海拔高度增加。RF
预测马尾松的最适宜海拔高度在CA模式下将增加3
m, 在JP和NW模式下分别下降6和4 m。GAM在JP
模式下下降1 m, 在CA和NW模式下增加7和3 m。
2.4 气候变化条件下分布区面积的变化
对马尾松生境适宜性大于0.5的地区进行统计,
与各个模型预测的基准气候条件下的潜在分布区
进行比较。6个模型和3个气候情景给出的结论一致,
即随着时间推移, 其潜在适宜分布面积将逐步增加
(2.1%–23.7%) (表4)。不同气候模式下, 分布区面积
增加的幅度不同。对不同模型来说, NW模式下的增
加幅度小于CA和JP模式。不同模型在不同气候情景
下, 在未来不同时间段预测的分布区面积的变化也
不同, 其中RF在未来3个时间段、3个气候模式下,
分布区面积增加的比例最大。2020s和2050s时间段,
分布区面积增加最小的是NW模式下的CART (分别
是2.1%和4.2%); 2080s时间段, 分布区面积增加最
小的是CA模式下的GBM (5.5%)。重复测量资料的
方差分析表明(表5), 不同模型类型之间、不同GCM
之间分布区的面积变化都存在显著差异。
气候变化条件下分布区面积的变化是由两方
面原因造成的, 一是原分布区的消失, 一是新适宜
分布区的增加(表4)。3种气候模式和6个模型条件下,
随着时间的推移, 适宜马尾松分布的新分布区逐渐
增加(2.6%–24.2%) (表4)。其中NW模式下增加的比
例最小, RF在未来3个时间段、3个气候模式下, 新
获取的适宜分布区面积最大。气候变化也导致马尾
松原适宜分布区部分消失, 随着时间的推移, GBM
预测的原适宜分布区消失的比例增大, NeuralEn-
sembles预测消失的比例减少; 其他模型在不同的
GCM下和不同的未来时间段, 原分布区消失的比
例大小不一。
以模型预测精度最高的RF的输出结果作图 ,
概率图转化为二元分布图(图2)。基准气候条件下马
尾松的潜在分布区集中在华中华南地区, 北部到达
陕西南部、河南南部和江苏南部, 西部到达四川中


表4 未来气候条件下马尾松潜在分布区的面积变化
Table 4 Potential distribution area change for Pinus massoniana under future climate
消失面积 Area lost (%) 新增面积 New area (%) 总面积变化 Total area change (%) 模型类型
Model type 2020s 2050s 2080s 2020s 2050s 2080s 2020s 2050s 2080s
CART CA 2.8 2.2 2.4 5.9 9.0 13.6 3.1 6.8 11.2
JP 0.9 1.0 1.0 4.8 6.7 11.0 3.8 5.7 10.0
NW 1.0 0.8 0.6 3.1 5.0 8.3 2.1 4.2 7.6
GAM CA 0.9 0.3 0.4 5.6 10.6 18.1 4.7 10.3 17.7
JP 0.1 0.1 0.2 6.4 9.9 19.1 6.3 9.8 18.9
NW 0.1 0.1 0.1 3.1 5.8 11.2 3.0 5.7 11.1
GBM CA 1.9 1.9 3.0 5.0 6.6 8.5 3.1 4.8 5.5
JP 0.7 0.9 1.5 5.3 7.2 8.8 4.6 6.3 7.4
NW 0.5 0.7 1.1 3.4 5.0 8.3 2.9 4.4 7.2
GLM CA 1.1 0.3 0.3 3.9 7.4 14.7 2.7 7.1 14.4
JP 0.5 0.1 0.2 4.3 7.9 15.6 3.8 7.7 15.4
NW 0.4 0.1 0.1 2.6 4.9 9.4 2.2 4.8 9.3
NeuralEnsembles CA 1.1 0.3 0.3 3.9 7.4 14.7 2.8 7.1 14.4
JP 0.5 0.1 0.1 4.3 7.8 15.6 3.8 7.7 15.5
NW 0.4 0.1 0.1 2.6 4.9 9.4 2.2 4.8 9.3
RF CA 2.2 2.3 2.4 11.6 15.8 23.8 9.4 13.5 21.4
JP 0.9 1.0 0.5 11.2 16.0 24.2 10.3 15.0 23.7
NW 0.8 0.5 0.4 5.8 10.6 17.2 5.0 10.1 16.9
CART、GAM、GBM、GLM和RF见图1。CA、JP和NW见表2。
CART, GAM, GBM, GLM and RF see Fig. 1. CA, JP and NW see Table 2.


张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1099

doi: 10.3724/SP.J.1258.2011.01091
表5 物种分布模型(SDM)和大气环流模型(GCM)对预测分布区面积变化影响的方差分析
Table 5 Analysis of variance with species distribution model (SDM) and global circulation model (GCM) effects on change of
predicted distribution area
自由度 Degrees of freedom 差异来源
Source of variation 分子 Numerator 分母 Denominator
F

p
截距 Intercept 1 44 10.114 65 0.002 7
物种分布模型 Species distribution model 5 44 25.867 31 <0.000 1
大气环流模型 Global circulation model 2 44 17.121 49 <0.000 1
采用混合线性模型进行重复测量数据分析, 模型类型和GCM类型作为固定效应, 未来的3个时间段作为随机效应。
Mixed linear model was used to perform this analysis with model types and GCMs as fixed factors and three time slice as random factor.


部、云南和贵州广西交界处, 东部和南部濒临大海,
台湾北部也有分布; 四川盆地底部为不适宜地区。
图2表明, 与基准气候条件下的分布相比, 未
来气候条件下物种分布区增加的区域集中在北部
高纬度地区, 此外四川盆地西缘、云贵高原东缘和
西藏墨脱县也有少部分的增加。分布区消失的区域
集中在雷州半岛北部、云贵高原东缘和大别山-秦岭-
大巴山之间的盆地地区。
2.5 未来气候条件下多模型预估的空间比较
6个模型的预测精度都在可以接受的范围内(表
1), 因此对其空间分布的不一致性进行了对比分
析。6个模型对基准气候条件下马尾松的潜在分布
区预测的差异主要发生在分布区的北部和西部边
缘地带及南部的雷州半岛地区(图3A)。未来潜在分
布的18个预估图(6个模型 × 3 GCM)在空间上存在
差异(图3B–3D), 同样, 差异主要发生在分布区的
北部西部边缘地带和雷州半岛处。随着时间的推移,
分布区预估存在较大差异的地区将逐渐增多, 尤其
是随着马尾松北部分布区逐步向北扩展, 18个预估
图在北部分布区的差异逐渐增大。在南部地区雷州
半岛和海南岛北部的差异也逐渐增加。在西部广西
和云南交界处的云贵高原地区, 以及西藏的墨脱县
地区预估差异也逐渐增加。
3 讨论和结论
在SRES_A2情景下, 马尾松分布区的面积将增
加, 这与以往的研究结果相反(贺庆棠等, 1996; 徐
德应等, 1997); 以往研究与本研究的另一个不同之
处, 是南部分布边界在气候变化后将向北扩展。预
测结果的差异来自3方面的综合作用:
第一, 所采用模型不同。以往的研究采用气候
阈值方法进行(贺庆棠等, 1996; 徐德应等, 1997)。
气候阈值模型只利用物种发生数据进行建模, 并根
据所选择的环境变量建立一个多维空间, 所有落入
此空间的地区都认为是适生区, 而这恰恰忽略了这
个多维空间中也存在物种不发生的地区(Barry &
Elith, 2006)。同时, 气候阈值模型也没有考虑其他
限制物种分布的因子, 因此对物种分布存在过度估
计(Chefaoui & Lobo, 2008)。本文中的6个模型根据
物种发生和不发生数据进行建模, 考虑了气候和土
壤因素对马尾松分布的限制作用。然而, 即使采用
同一套数据, 不同模型对马尾松的模拟预估也存在
迁移距离和面积变化上的差异(表2, 表4), 尤其是
在评价气候变化对马尾松最适宜海拔分布高度的
影响时 (表3)。以往一些研究 (Elith et al., 2006;
Lawler et al., 2006; Wisz et al., 2008)表明, 模型本
身的预测精度以及所预估的物种未来分布区变化
也存在差异, 甚至出现相反(分布区增加和缩小)的
结论(Lawler et al., 2006)。
本文中组合集成学习模型比常规模型预测的
精度高(表1), 这与Elith等(2006)的观点一致, 即模
型预测精度与模型的复杂性相关。本文中的6个模
型预测结果出现差异的原因主要是模型本身的构
建机理不同, 具体体现在: GAM和GLM是基于回归
关系建模, 物种-环境的响应表面是平滑的, 可以有
效地处理物种分布预测中的数据过度离散(over-
dispersion, 数据变异大于模型所能提供的变异范围
时的一种统计现象)的问题, 而组合集成学习模型
及CART是基于算法建模, 在处理数据过度离散问
题时可能产生误差。模型中采用的物种分布与环境
变量之间关系的假设不同, GLM假定响应变量与环
境梯度之间具有一条特定响应曲线, 其他模型则可
以模拟物种发生和环境梯度之间更复杂的关系; 预
测变量之间相关性的处理方法不同, 组合集成学习
模型及CART可以熟练地模拟变量之间的相互作用,
而GAM和GLM不适合; 对变量的选择不同, 如组
1100 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com

审图号: GS(2011)1123号


图2 随机森林预估的马尾松在未来气候条件下潜在分布区的变化。CA、JP和NW见表2。
Fig. 2 Potential distribution area change for Pinus massoniana under future climate as predicted by random forest. CA, JP and NW
see Table 2.


张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1101

doi: 10.3724/SP.J.1258.2011.01091

审图号: GS(2011)1123号

图3 基准气候条件下马尾松6个潜在生境分布模拟的标准差(%) (A)以及未来18个(6个模型 × 3 GCM)潜在生境预估的标准
差(%) (B, 2020s; C, 2050s; D, 2080s)。
Fig. 3 Spatial patterns in standard deviations (%) of potential habitat suitability calculated across six current predictions under
baseline climate (A) and 18 future projections (%) (6 models × 3 GCMs) (B, 2020s; C, 2050s; D, 2080s).


合集成学习模型选取部分变量进行单决策树和
ANN子模型的构建, GAM和GLM通过自动逐步回
归过程选择变量。当物种观测值较少时, GLM、GAM
和CART的模拟结果可信度较差, 而其他模型可以有
效地处理这个问题(Breiman, 2001; O’Hanley, 2009)。
本研究中, 6个模型都具有极好的预测精度(>0.95)
(表1), 看似与模型之间的差异无关, 这可能是由于
采取了不发生数据处理方法, 加之马尾松发生数据
(8 752个)比较多, 从而使马尾松物种发生和不发生
数据之间的差异最大化, 提高了所有模型的识别率。
同时还必须指出, 模型预测精度还与所研究的目标
物种有关, 不同的物种其相应的气候和生态需求的
物理空间(生态位)不同, 目前还没能找到适用于所
有物种的物种-环境一致性关系(Buisson et al., 2010),
也还没有发现一个模型在预测任何物种的时候都能
给出最优预测结果(曹铭昌等, 2005; Elith et al.,
2006)。本文6个模型预测精度的大小关系为; RF >
GBM > NeuralEnsembles > GAM > GLM > CART,
但也有一些研究发现, 模型的预测精度大小打破了
这个排列顺序(曹铭昌等, 2005; Elith et al., 2006; 李
峰等, 2006)。因此, 在预测物种分布时通过多模型比
较选取最优模型十分必要。
第二, 所采用的物种分布区数据不同。以往的
研究(贺庆棠等, 1996; 徐德应等, 1997)在县一级行
政区上收集物种分布资料, 忽略了县行政区内也可
能存在不适宜物种生存的地区, 从而扩大了物种的
实际分布范围, 导致物种分布区的过度预估。本文
采用反映20世纪80–90年代现实物种分布的矢量植
被图数据进行分析, 同时辅以不发生数据取样处
理, 近似最大限度地反映马尾松在空间上的真实分
布。以往一些研究(Hernandez et al., 2006; Lawler et
al., 2006; 邵慧等, 2009)也发现, 即使采用同样的模
型, 根据不同的物种发生数据建模也会导致不同的
模型预测精度。
第三, 可归结为采用的气候情景不同。GCM是
当前我们预测未来气候的最好工具, 然而, 不同模
1102 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com
型内部及模型之间都广泛存在差异, 并且当前也没
有选择最优气候模型的统一标准, 这给预估气候变
化对物种分布影响的研究中气候模型的最终选择
带来了困扰(Beaumont et al., 2008)。不同的气候变
化情景(GCM或SRES)也可导致物种分布区变化预
估的结论不同(Xu & Yan, 2001; 吴建国和吕佳佳,
2009), 甚至得出相反的结论(Xu & Yan, 2001)。本文
所采用的3个GCM在反映气候变化影响程度时也存
在差异(表4)。此外, 我们没有分析其他排放情景
(A1, B1, B2)及其他GCM对模拟结果的影响。
同样, 本文中基准气候和未来气候变化条件下
马尾松不同潜在生境的空间分布图也存在差异, 具
体体现在预估的北部和西部边缘地带分布不一致
(图3), 理解这种不同预估之间的差异对于进一步的
研究很有帮助。虽然多数GCM和SRES情景下中国
气候的变化趋势是一致的, 但也有部分地区气候变
化的幅度和变化细节有差异, 整体来讲, 对降水变
化预估的不确定性大于表面气温变化预估的不确
定性, 并且随着预估时段的增加, 预估结果的不确
定性增大(江志红等, 2008; 李博和周天军, 2010)。
因此, 未来气候预估的不确定性会导致物种分布预
测的不一致, 如不同GCM气候情景下RF预估的马
尾松北部和西部分布区之间的差异(图2)。此外, 预
估不一致的地区正好出现在分布区的边缘地带, 这
正是物种分布区与非分布区之间的过渡地带。理论
上来讲, 马尾松的生境适宜性在这些地区会降低,
在模型预测过程中, 这些地区同时受物种分布存在
区和不存在区的影响, 由于不同的模型识别物种分
布存在区和不存在区的能力不同, 因此会造成预估
结果的不一致, 如不同模型对基准气候条件下马尾
松潜在分布的模拟差异(图1)。提供物种分布预估的
不确定性分布图(包括确定性地区和不确定性地区)
有利于鉴别哪些地区需要加深对气候变化的影响
的理解, 并在管理决策过程中采取确定性的措施。
物种分布模拟中的模型类型、未来气候情景
(GCM ×排放情景)以及用于建模的物种发生数据的
不同, 是导致模型输出结果不确定性的3个主要误
差来源(Buisson et al., 2010), 因此, 以后深入开展
物种分布模拟结果的不确定性分析十分必要, 尤其
是当模型输出结果相反的时候, 可以在了解模拟可
靠性的基础上采取适应气候变化的相应管理和保
护措施。增加模拟可靠性的措施: 首先, 对模型输
入的物种分布数据进行检验, 确保数据能尽可能地
代表物种分布的环境空间。第二, 进行多模型的比
较评估。根据研究目标和模型的可用性, 选取稳健
的模型进行分布区预测, 如查看研究区模型比较的
文献, 选取合适的模型; 或者结合化石记录重建物
种分布区 , 使用倒推法验证选择的模型。第三 ,
GCM和排放情景的选择。针对这一点有许多方法
(Beaumont et al., 2008), 如选取最新的GCM, 选取
能反映研究区气候特征的GCM和排放情景, 对多
个GCM进行平均等。本文的研究建立在全国尺度
上, 只选择了气候和土壤作为预测变量, 但实际条
件下, 地形也是控制物种分布的一个重要因素(Pear-
son & Dawson, 2003), ClimateChina (V 4.4)软件着
重考虑了高程对温度的影响。马尾松最适宜海拔分
布高度的变化对气候变化的响应不一致(表3), 可能
是由于分布区迁移后地形本身的变异导致的, 而不
是由物种本身的生物或生理学特性导致的(Iverson
et al., 2008)。本研究中, 我们模拟的是马尾松的潜
在分布而不是实际分布。未来实际分布的综合性模
拟需要考虑未来的干扰、火灾和外来种入侵, 也包
括物种进化、种间竞争和物种迁移等(Pearson &
Dawson, 2003)。在未来气候条件下, 这些因素会以
异常和不可想象的方式呈现, 由于自然本身的复杂
性和异质性, 不可能利用单个模型甚至复杂模型来
精确地预测时间和空间的每个方面, 实际上, 即使
在当前的气候条件下 , 这些因素也很难预测
(Iverson et al., 2008)。本研究是基于物种分布与环境
之间的静态平衡关系展开的, 实际情况下, 物种的
迁移速度不可能赶上气候变化条件下其潜在分布
区的变化速度, 因此物种的迁移和演替在与环境达
到平衡时存在显著的时间滞后。但是我们可以合理
地推测, 如果未来气候如气候情景预测的一样, 马
尾松的潜在分布会朝着所预测的方向发展。人工辅
助措施可帮助物种赶上气候变化的速率。为了能使
基于生态位的模型更真实地模拟物种的实际分布,
Pearson和Dawson (2003)建议通过一个等级框架结
构, 把不同尺度上影响物种分布的主要因素耦合在
同一个模拟中。如: 为了实现物种实际分布区的模
拟预测, Václavík和Meentemeyer (2009)在模拟入侵
种的分布时, 把物种扩散模型和物种分布模型进行
耦合, 进而成功地预测了物种的实际分布。
本文基于马尾松的潜在分布区比较了6个物种
张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1103

doi: 10.3724/SP.J.1258.2011.01091
分布模型和3个气候模型对模拟结果的影响, 得出
以下结论: 在SRES_A2排放情景下, 气候变化将导
致马尾松分布区逐步北向迁移, 潜在适生区面积逐
步增加, 但是马尾松潜在分布区的迁移距离和面积
增加比例受物种分布模型和GCM类型的共同影响。
由物种分布模型和GCM类型共同导致的物种潜在
分布区预估的不一致性地区主要发生在物种分布
区的边缘地带, 尤其是北部分布区, 并且随着时间
的推移, 不一致地区将增加。模型之间不同的构建
规则以及GCM之间的差异是导致预测结果不一致
的根本原因。马尾松发生与不发生记录之间较大的
识别率是导致模型之间预测精度差异较小且总体
预测精度极高的原因。组合集成学习模型对马尾松
分布区的预测能力高于常规模型, CART的预测能
力最低, RF的预测精度最高且预估的气候变化对马
尾松分布区产生的影响最大。3种气候模式下, NW
模式下的气候变化对马尾松分布区迁移距离和面
积变化的影响幅度要小于JP和CA模式。此外, 气候
变化也将导致马尾松最适宜海拔分布高度的升降
变化, 但是其上升或下降受所采用的模型类型、
GCM类型和未来不同时间段三方面的共同影响。
致谢 国家自然科学基金重大项目(30590383)、林
业公益性行业科研专项(200804001和201104006)、
中国林业科学研究院院所基金海外人才专项
(CAFYBB2008007)、国家科技部国际科技合作项目
(2008DFA32070)和 “十一五 ”国家科技攻关项目
(2006BAD03A04)资助。
参考文献
Allouche O, Tsoar A, Kadmon R (2006). Assessing the acc-
uracy of species distribution models: prevalence, Kappa
and the true skill statistic (TSS). Journal of Applied
Ecology, 43, 1223–1232.
Barry S, Elith J (2006). Error and uncertainty in habitat models.
Journal of Applied Ecology, 43, 413–423.
Beaumont LJ, Hughes L, Pitman AJ (2008). Why is the choice
of future climate scenarios for species distribution
modelling important? Ecology Letters, 11, 1135–1146.
Breiman L (2001). Random forests. Machine Learning, 45,
5–32.
Breiman L, Cutler A (2004). Random forests. http://www.stat.
berkeley.edu/users/breiman/RandomForests/cc_home.htm.
Cited 10 Oct. 2010.
Buisson L, Thuiller W, Casajus N, Lek S, Grenouillet G
(2010). Uncertainty in ensemble forecasting of species
distribution. Global Change Biology, 16, 1145–1157.
Cao MC (曹铭昌), Zhou GS (周广胜), Weng ES (翁恩生)
(2005). Application and comparison of generalized models
and classification and regression tree in simulating tree
species distribution. Acta Ecologica Sinica (生态学报),
25, 2031–2040. (in Chinese with English abstract)
Chefaoui RM, Lobo JM (2008). Assessing the effects of
pseudo-absences on predictive distribution model perfor-
mance. Ecological Modeling, 210, 478–486.
Chuine I, Beaubien EG (2001). Phenology is a major
determinant of tree species range. Ecology Letters, 4, 500–
510.
Clemen RT (1989). Combining forecasts: a review and
annotated bibliography. International Journal of Fore-
casting, 5, 559–583.
Cohen J (1960). A coefficient of agreement for nominal scales.
Educational and Psychological Measurement, 20, 37–46.
Daly C, Gibson WP, Taylor GH, Johnson GL, Pasteris P
(2002). A knowledge-based approach to the statistical
mapping of climate. Climate Research, 22, 99–113.
Editorial Board of Vegetation Map of China, Chinese Academy
of Sciences (中国科学院中国植被图编辑委员会 )
(2001). 1 : 1 Million Vegetation Atlas of China (中国植被
图集 1 : 1 000 000). Science Press, Beijing. (in Chinese)
Elith J, Graham CH, Anderson RP, Dudík M, Ferrier S, Guisan
A, Hijmans RJ, Huettmann F, Leathwick JR, Lehmann A,
Li J, Lohmann LG, Loiselle BA, Manion G, Moritz C,
Nakamura M, Nakazawa Y, Overton JM, Peterson AT,
Phillips SJ, Richardson K, Scachetti-Pereira R, Schapire
RE, Soberón J, Williams S, Wisz MS, Zimmermann NE
(2006). Novel methods improve prediction of species’
distributions from occurrence data. Ecography, 29,
129–151.
Elith J, Leathwick J, Hastie T (2008). A working guide to
boosted regression trees. Journal of Animal Ecology, 77,
802–813.
Fielding AH, Bell JF (1997). A review of methods for the
assessment of prediction errors in conservation presence/
absence models. Environmental Conservation, 24, 38–49.
Friedman JH (2001). Greedy function approximation: a
gradient boosting machine. The Annals of Statistics, 29,
1189–1232.
Granitto PM, Verdes PF, Ceccatto HA (2005). Neural network
ensembles: evaluation of aggregation algorithms. Artificial
Intelligence, 163, 139–162.
Guisan A, Zimmermann NE (2000). Predictive habitat
distribution models in ecology. Ecological Modeling, 135,
1104 植物生态学报 Chinese Journal of Plant Ecology 2011, 35 (11): 1091–1105

www.plant-ecology.com
147–186.
He QT (贺庆棠), Yuan JZ (袁嘉祖), Chen ZB (陈志泊)
(1996). Possible effects of the climate changes on the
distribution of Pinus massoniana and Pinus yunnanensis
in South China. Journal of Beijing Forestry University (北
京林业大学学报), 18(1), 22–28. (in Chinese with English
abstract)
Hernandez PA, Graham CH, Master LL, Albert DL (2006). The
effect of sample size and species characteristics on
performance of different species distribution modeling
methods. Ecography, 29, 773–785.
IPCC (Intergovernmental Panel on Climate Change) (2007).
Summary for policymakers. In: Solomon S, Qin D,
Manning M, Chen Z, Marquis M, Averyt KB, Tignor M,
Miller HL eds. Climate Change 2007: The Physical Sci-
ence Basis. Contribution of Working Group I to the
Fourth Assessment Report of the Intergovernmental Panel
on Climate Change. Cambridge University Press, New
York.
Iverson LR, Prasad AM, Matthews SN, Peters M (2008).
Estimating potential habitat for 134 eastern US tree
species under six climate scenarios. Forest Ecology and
Management, 254, 390–406.
Jiang ZH (江志红), Zhang X (张霞),Wang J (王冀) (2008).
Projection of climate change in China in the 21st century
by IPCC-AR4 Models. Geographical Research (地理研
究), 27, 787–799. (in Chinese with English abstract)
Lawler JJ, White D, Neilson RP, Blaustein AR (2006).
Predicting climate-induced range shifts: model differences
and model reliability. Global Change Biology, 12, 1568–
1584.
Lenoir J, Gégout JC, Marquet PA, de Ruffray P, Brisse H
(2008). A significant upward shift in plant species
optimum elevation during the 20th century. Science, 320,
1768–1771.
Li B (李博), Zhou TJ (周天军) (2010). Projected climate
change over China under SRES A1B scenario: multi-
model ensemble and uncertainties. Advances in Climate
Change Research (气候变化研究进展), 6, 270–276. (in
Chinese with English abstract)
Li F (李峰), Zhou GS (周广胜), Cao MC (曹铭昌) (2006).
Responses of Larix gmelinii geographical distribution to
future climate change: a simulation study. Chinese
Journal of Applied Ecology (应用生态学报), 17, 2255–
2260. (in Chinese with English abstract)
Liaw A, Wiener M (2002). Classification and regression by
randomForest. R News, 2(3), 18–22.
Lü JJ (吕佳佳), Wu JG (吴建国) (2009). Advances in the
effects of climate change on the distribution of plant
species and vegetation in China. Environmental Science &
Technology (环境科学与技术), 32(6), 85–95. (in Chinese
with English abstract)
Mitchell TD, Jones PD (2005). An improved method of
constructing a database of monthly climate observations
and associated high-resolution grids. International Journal
of Climatology, 25, 693–712.
Monserud RA, Leemans R (1992). Comparing global vegeta-
tion maps with the Kappa statistic. Ecological Modelling,
62, 275–293.
Nix HA (1986). A biogeographic analysis of Australian Elapid
snakes. In: Longmore R ed. Atlas of Elapid Snakes of
Australia. Australian Government Publishing Service,
Canberra. 4–15.
O’Hanley JR (2009). NeuralEnsembles: a neural network based
ensemble forecasting program for habitat and bioclimatic
suitability analysis. Ecography, 32, 89–93.
Parmesan C, Yohe G (2003). A globally coherent fingerprint of
climate change impacts across natural systems. Nature,
421, 37–42.
Pearson RG, Dawson TP (2003). Predicting the impacts of
climate change on the distribution of species: Are
bioclimate envelope models useful? Global Ecology &
Biogeography, 12, 361–371.
Peñuelas J, Boada M (2003). A global change-induced biome
shift in the Montseny mountains (NE Spain). Global
Change Biology, 9, 131–140.
R Development Core Team (2010). R: A Language and
Environment for Statistical Computing. R Foundation for
Statistical Computing, Vienna, Austria. ISBN 3-900051-
07-0, http://www.R-project.org.
Ridgeway G (1999). The state of boosting. In: Berk K,
Pourahmadi M eds. Computing Science and Statistics 31.
Interface Foundation of North America, Fairfax Station.
172–181.
Ridgeway G (2007). gbm: generalized boosted regression
models. R Package Version 1.6–3. http://www.i-pensieri.
com/gregr/gbm.shtml.
Root TL, Price JT, Hall KR, Schneider SH, Rosenzweig C,
Pounds JA (2003). Fingerprints of global warming on wild
animals and plants. Nature, 421, 57–60.
Shao H (邵慧), Tian JQ (田佳倩), Guo K (郭柯), Sun OJ (孙
建新) (2009). Effects of sample size and species traits on
performance of Bioclim in predicting geographical
distribution of tree species—a case study with 12
deciduous Quercus species indigenous to China. Chinese
张雷等: 气候变化对马尾松潜在分布影响预估的多模型比较 1105

doi: 10.3724/SP.J.1258.2011.01091
Journal of Plant Ecology (植物生态学报), 33, 870–877.
(in Chinese with English abstract)
Shoo LP, Williams SE, Hero JM (2006). Detecting climate
change induced range shifts: Where and how should we be
looking? Austral Ecology, 31, 22–29.
Swets JA (1988). Measuring the accuracy of diagnostic
systems. Science, 240, 1285–1293.
ter Braak CJF, Looman CWN (1986). Weighted averaging,
logistic regression and the Gaussian response model. Plant
Ecology, 65, 3–11.
Václavík T, Meentemeyer RK (2009). Invasive species
distribution modeling (iSDM): Are absence data and
dispersal constraints needed to predict actual distribu-
tions? Ecological Modeling, 220, 3248–3258.
Wang J (王娟), Ni J (倪健) (2006). Review of modelling the
distribution of plant species. Journal of Plant Ecology
(Chinese Version) (植物生态学报), 30, 1040–1053. (in
Chinese with English abstract)
Wang T, Hamann A, Spittlehouse DL, Aitken SN (2006).
Development of scale-free climate data for Western
Canada for use in resource management. International
Journal of Climatology, 26, 383–397.
Webb T III, Bartlein PJ (1992). Global changes during the last
3 million years: climatic controls and biotic responses.
Annual Review of Ecology and Systematics, 23, 141–173.
Wisz MS, Guisan A (2009). Do pseudo-absence selection
strategies influence species distribution models and their
predictions? An information-theoretic approach based on
simulated data. BMC Ecology, doi:10.1186/1472-6785-
9-8
Wisz MS, Hijmans RJ, Li J, Peterson AT, Graham CH, Guisan
A (2008). Effects of sample size on the performance of
species distribution models. Diversity and Distributions,
14, 763–773.
Wu JG (吴建国), Lü JJ (吕佳佳) (2009). Potential effects of
climate change on the distribution of Dove Trees (Davidia
involucrata Baill) in China. Research of Environmental
Sciences (环境科学研究), 22, 1371–1381. (in Chinese
with English abstract)
Xu DY (徐德应), Guo QS (郭泉水), Yan H (闫洪) (1997). A
Study on the Impacts of Climate Change on Forests in
China (气候变化对中国森林影响研究). China Scientific
and Technical Press, Beijing. (in Chinese)
Xu DY, Yan H (2001). A study of the impacts of climate
change on the geographic distribution of Pinus koraiensis
in China. Environment International, 27, 201–205.


责任编委: 黄建辉 实习编辑: 黄祥忠


_________________________________________________________________________________________________________

作者更正

发表于2010年34卷6期 619–627页的《南北样带温带区栎属树种功能性状间的关系及其对气象因子的响应》中存在一些
错误, 现更正如下:
一、第619页最后一行中的“这时的”应改为“这时, ”;
二、第621页“1.2.4 叶片光合速率测定”一段倒数第3行中的“单位质量的最大净光合速率= Pna × LMA”应改为“单位质量
的最大净光合速率= Pna / LMA”;
三、第623页表2和第625页表3的表头中的“相关系数”应改为“系数”;
四、表3中的“r”均应改为“R2”, 标注中增加“R2, 决定系数”, “R2, coefficient of determination”, 去除r的注释;
五、第626页第一行中的“快速”应改为“慢速”。

作者: 冯秋红
2011年10月10日