选取32个环境地理变量,结合黄顶菊在中国的分布记录,运用GARP、Maxent、ENFA、Bioclim和Domain 5种生态位模型,模拟黄顶菊在中国的潜在适生分布区域,并利用受试者工作特征曲线(ROC)比较不同模型模拟精度.结果表明: Maxent模型的模拟精度最好.采用Maxent模型进行模拟,黄顶菊在我国有7.5%的适生面积,河北中南部、北京、天津、河南、山东、安徽和江苏具有高度潜在入侵风险.
Based on the distribution records of Flaveria bidentis in China, and by using five ecological niche models (GARP, Maxent, ENFA, Bioclim, and Domain), 32 eco-geographical variables were chosen to simulate the potential suitable distribution area of F. bidentis in the country, and the simulation precision of the models was assessed by the method of Receiver Operating Characteristic (ROC) curve analysis. Among the models adopted, Maxent model had the best simulation precision. Its prediction showed that the potential suitable distribution area of F. bidenti in this country accounted for 7.5% of the total, with the central and southern Hebei, Beijing, Tianjin, Henan, Shandong, Anhui, and Jiangsu having high potential invasion risk.
全 文 :采用生态位模型预测黄顶菊在中国的潜在适生区*
曹向锋1 摇 钱国良1 摇 胡白石1 摇 刘凤权1**
( 1 南京农业大学植物保护学院植物病理学系农业部作物病虫害监测与防控重点开放实验室, 南京 210095)
摘摇 要 摇 选取 32 个环境地理变量,结合黄顶菊在中国的分布记录,运用 GARP、Maxent、
ENFA、Bioclim和 Domain 5 种生态位模型,模拟黄顶菊在中国的潜在适生分布区域,并利用受
试者工作特征曲线(ROC)比较不同模型模拟精度.结果表明: Maxent 模型的模拟精度最好.
采用 Maxent 模型进行模拟,黄顶菊在我国有 7郾 5%的适生面积,河北中南部、北京、天津、河
南、山东、安徽和江苏具有高度潜在入侵风险.
关键词摇 黄顶菊摇 潜在适生区摇 生态位
文章编号摇 1001-9332(2010)12-3063-07摇 中图分类号摇 Q948. 13摇 文献标识码摇 A
Prediction of potential suitable distribution area of Flaveria bidentis in China based on niche
models. CAO Xiang鄄feng1, QIAN Guo鄄liang1, HU Bai鄄shi1, LIU Feng鄄quan1 ( 1Ministry of Agri鄄
culture Key Laboratory of Monitoring and Management of Crop Diseases and Pest Insects, Department
of Plant Pathology, College of Plant Protection, Nanjing Agricultural University, Nanjing 210095,
China) . 鄄Chin. J. Appl. Ecol. ,2010,21(12): 3063-3069.
Abstract: Based on the distribution records of Flaveria bidentis in China, and by using five ecologi鄄
cal niche models (GARP, Maxent, ENFA, Bioclim, and Domain), 32 eco鄄geographical variables
were chosen to simulate the potential suitable distribution area of F. bidentis in the country, and the
simulation precision of the models was assessed by the method of Receiver Operating Characteristic
(ROC) curve analysis. Among the models adopted, Maxent model had the best simulation preci鄄
sion. Its prediction showed that the potential suitable distribution area of F. bidenti in this country
accounted for 7郾 5% of the total, with the central and southern Hebei, Beijing, Tianjin, Henan,
Shandong, Anhui, and Jiangsu having high potential invasion risk.
Key words: Flaveria bidentis; potential suitable distribution area; niche.
*公益性行业(农业)科研专项(200803022)资助.
**通讯作者. E鄄mail: fqliu20011@ sina. com. cn
2010鄄06鄄08 收稿,2010鄄09鄄29 接受.
摇 摇 黄顶菊(Flaveria bidentis)属菊科堆心菊族黄菊
属,起源于南美洲,后来扩散到美洲中部、北美洲南
部及西印度群岛,由于引种等原因传播到非洲的埃
及和南非、欧洲的英国和法国、澳大利亚及亚洲的日
本等地. 2001 年,黄顶菊在我国河北省衡水湖及天
津南开大学首次发现,传入途径不详[1] . 目前主要
分布于河北省中南部,包括保定、石家庄、邢台、沧
州、衡水、邯郸、廊坊 7 个市的 54 个县(市、区) [2] .
在天津的 5 个区县和河南省安阳县等地均有零星发
生.黄顶菊的主要危害体现在其可能通过产生化感
物质抑制周围生境中植物的萌发和早期生长,从而
降低这些植物在群落中的多样性. 一旦黄顶菊大面
积、高密度发生,就有可能导致入侵地植物多样性的
降低[3] .自黄顶菊入侵以来,尚未报道其具有天敌.
黄顶菊入侵农田后,不仅与农作物竞争环境资源,而
且根部分泌的化感物质会抑制作物生长[3] .
生态位理论的模型原理主要是利用已有的物种
分布资料和环境数据产生以生态位为基础的物种生
态需求,探索物种已知分布区的环境特征与潜在分
布区域的非随机关系.受试者工作特征曲线(receiv鄄
er operating charaoteristic curve,ROC)分析方法最初
应用于雷达信号接收能力的评价[4],之后被广泛应
用于医学诊断试验性能的评价[5-7] . ROC 曲线分析
通过改变诊断阈值,可获得多对真(假)阳性率值.
以假阳性率为横坐标,真阳性率为纵坐标,绘制而成
的曲线称为 ROC 曲线,ROC 曲线下的面积即为
AUC值(area under curve),以此来反映诊断试验的
价值. AUC 值在 1郾 0 ~ 0郾 5,当 AUC>0郾 5 的情况下,
AUC越接近于 1,说明诊断效果越好. ROC 曲线的
应 用 生 态 学 报摇 2010 年 12 月摇 第 21 卷摇 第 12 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
Chinese Journal of Applied Ecology, Dec. 2010,21(12): 3063-3069
评估标准为:AUC 在 0郾 5 ~ 0郾 6,失败( fail);0郾 6 ~
0郾 7,较差(poor);0郾 7 ~ 0郾 8,一般( fair);0郾 8 ~ 0郾 9,
好(good);0郾 9 ~ 1郾 0,非常好( excellent) [8] . AUC 因
不受患病率和诊断阈值的影响,可对两个诊断试验
的准确度进行综合比较,因而成为目前公认的诊断
试验的最佳评价指标[9] .
GARP( the genetic algorithm for rule鄄set predic鄄
tion)是一种基于遗传算法的规则集合.该模型通过
遗传算法自动搜索与物种分布有关的环境因子,即
规则组合,再把规则组合映射到相关区域来预测物
种的潜在适生区,探索物种已知分布区的环境特征
与研究区域的非随机关系[10-11] . 最大熵模型(maxi鄄
mum entropy, Maxent)是一个密度估计和物种分布
预测模型,是以最大熵理论为基础的一种选择型方
法. Maxent从符合条件的分布中选择熵最大的分布
作为最优分布,首先确定特征空间,即物种已知分布
区域,接着寻找限制物种分布的约束条件(环境变
量),构筑约束集合,最后建立二者之间的相互关
系[12] . ENFA(ecological niche factor analysis, ENFA)
生态位因子分析是基于物种的发生数和一系列生态
地理变量,通过对物种的生态位和生态位幅度及其
与整个研究区域的环境因子的平均状态和变异相互
比较,进而计算物种适生性模型( habitat suitability
model, HS model) [13] . Bioclim 是由 Nix 创立的生物
气候分析和预测系统[14] . Bioclim 的主要假设就是
生物能够生存、定殖在那些气候与它目前分布区的
气候相匹配的地方.因此 Bioclim预测物种分布首先
根据已知的分布区或者物种生长的有关数据产生一
系列被认为具有十分重要的生物学意义并且能够描
述分布区的气候、极端气候及季节性的变量(气候
参数). DOMAIN程序根据环境空间中点邻近程度,
利用点对点的相似矩阵对每一个待选地点赋予分类
值.这是类似于 Booth 提出的 SITESIM(一个评价种
植试验的地点适合性程序)方法[15] . Domain 定义的
气候包络为非连续的. 所有待选的点被赋予相似性
值和用户确定的阈值或者等高距以确定实际的分布
区地图.例如,S逸0郾 90 将会选择与已知分布区的平
均变差不超过 10%的区域.每个特定研究的阈值要
根据专业知识做出,或者根据一些主观的阈值来表
示一定的变化.本文采用上述 5 种常用模型对黄顶
菊在中国的潜在适生区进行分析与比较,并采用
ROC曲线下面积(AUC值)进行有效性验证.
1摇 材料与方法
1郾 1摇 预测模型
本文所使用的模型及相关软件见表 1.
1郾 2摇 分布数据和环境数据
黄顶菊的国外分布数据从 GBIF(Global Biodi鄄
versity Information Facility ) http: / / data. gbif. org /
welcome. htm 下载,国内的数据主要从已发表的文
献和出版物中搜集,然后在 Geonames(http: / / www.
geonames. org / )网站查询发生地的具体坐标.
全球矢量地图下载地址为 http: / / www. diva鄄
gis. org / data / misc / word_adm0. zip,解压缩后可以直
接使用. 从国家基础地理信息系统 ( http: / / nfgis.
nsdi. gov. cn / )下载中国1 颐 400万省级行政区划图作
表 1摇 使用模型及软件列表
Tab. 1摇 List of models and softwares
软件
Software
版本
Version
功摇 能
Function
来源
Source
GARP 1. 1. 6 GARP模型应用
GARP model application
http: / / www. nhm. ku. edu / desktopgarp /
Maxent 3. 3. 1 Maxent模型应用
Maxent model application
http: / / maxent. sourceforge. net /
Biomapper 3郾 2 ENFA模型应用
ENFA model application
http: / / www2. unil. ch / biomapper /
DIVA鄄GIS 7郾 1郾 7 训练点集和验证点集分选,Bioclim 和 Domain 模型应
用,ROC分析 Selecting training and testing sets, Bioclim
and Domain model application, ROC analysis
http: / / www. diva鄄gis. org /
ArcGIS DK鄄9郾 3 地理信息系统应用
Geo鄄information system application
http: / / www. esrichina鄄bj. cn /
Hawths工具包
Hawths tool bag
点提取
Extracting the points
http: / / arcscripts. esri. com /
Av2idrisi 图层文件格式转换
Transforming the format of layers
From Biomapper
Medcalc 11郾 1郾 1郾 0 ROC曲线分析
ROC analysis
http: / / www. medcalcsoftware. com /
4603 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 21 卷
为分析底图.
对 GARP和 Maxent 所要加载的因子进行手动
筛选,主要是采用由 Worldclim(http: / / www. world鄄
clim. org / download)下载的环境数据.共包括生物气
候变量 19 个;气候变量包括月最低气温、月最高气
温、月平均湿度、月平均温度,本文选取决定黄顶菊
种子萌发的 4、5、6 月[3]的气候变量共 12 个;以及海
拔数据层,共计 32 个. Desktop GARP 中的 Dataset
Manager工具可以直接将所用环境变量转换为其可
以使用的. raw格式,其原格式可以直接被 Maxent识
别应用.
由于 ENFA 的筛选功能,在 Biomapper 中可以
直接对这 68 个图层进行分析,生成集成了这些相关
因素的预备图层.在分析中首先确定 EGVs(ecogeo鄄
graphical variable,生态地理变量)间的相互关系,之
后形成这些变量的组合,转化为数量相等的两类不
相关因子[极化因子(marginality factor)和专化因子
(specialization factors)].经 Habitat suitability map模
块运算后,每一栅格都被赋予某一个确定的值———
适生性指数(habitat suitability index,HSI).该值从 0
到 100 变化,HSI值的大小说明适生性的强弱.
Bioclim和 Domain 模块可以在 Diva鄄GIS 中实
现.其加载的图层数据与 GARP 和 Maxent 相同,不
过需要将. asc格式转换为. grd 格式. 此功能可以在
DIVA鄄GIS 中的 Data / Import to Gridfile / Multiple File
实现.
1郾 3摇 预测方法
GARP模型在 Desktop GARP 中实现,需要加载
的图层要在 Desktop GARP 的 Dataset manager 中进
行处理,转换成其可以识别的. raw 格式. 所需的训
练数据在 DIVA鄄GIS中生成后,保存为. csv 文件,此
文件可以直接加载进 Desktop GARP和 Maxent.进行
GARP分析时首先要进行参数设定,包括训练数据
的比例、运算规则、最优模型选择、预测结果的显示
及存储位置.设定训练数据的比例,用这些数据生成
预测模型,再用剩余的数据对生成的模型进行校验.
由于黄顶菊分布数据较少,本文训练数据设定比例
选择为 75% ,使用了 GARP 的全部 4 种运算规则,
以 ARC / INFO Grids的格式输出.
Maxent软件运行界面与 Desktop GARP相似,加
载由 DIVA鄄GIS 产生的训练点集数据和环境变量.
进行 Maxnet分析时首先要进行参数设定,包括运算
参数、运算规则、结果生成项的选者、预测结果的格
式及存储位置.选择自动特征运算规则进行计算,结
果包括模型的验证,适生指数图,刀切法( jackknife)
测定各变量权重,以 ASCII RASTER Grids 类型输出
(为计算 AUC值和 Kappa统计量需转换成. grd格式
输出,可以在 DIVA鄄GIS 中完成),设置完毕后点击
Run运行,预测结果输出在指定的目录下.
ENFA是在 Biomapper软件中实现的,首先加载
训练数据和 68 个环境图层,进行 ENFA 分析,得到
极化值 M和专化值 S;然后筛选专化值(极化值为
一个,必选);筛选后的专化值和极化值既是用于
Biomapper预测的环境层,加载这些环境层和训练数
据运行软件.
Bioclim和 Domain都可以在 DIVA鄄GIS 中进行,
Bioclim和 Domain 所使用的环境层转换为. grd 格
式,预测前要将所用的 32 个图层做成 stack 才可以
使用,在 Stack / Make stack 选项中完成. 在进行 Bio鄄
clim / Domain之前要先加载训练点集才能激活此模
块,选择 CLASS_REP字段作为匹配项.
1郾 4摇 模型验证与对比
由于 DIVA鄄GIS 提供了很方便的分析模块,因
此从数据的分配到 ROC曲线分析都在 DIVA鄄GIS中
完成.但是 DIVA鄄GIS 提供 ROC 曲线分析模块并不
完善,无法对几种软件结果进行对比,因此,在筛选
出每种模型的最佳结果后,再对所有最佳结果进行
比较,采信最佳效果中最好的预测结果,这一过程在
Medcalc软件中进行.
对预测结果的筛选主要是根据 10 组 ROC 曲线
下面积(AUC)的平均值、最大值和标准差的比较.
平均值较高、最大值较高和标准差较小的模型选为
最适合黄顶菊适生区分析的模型.
2摇 结果与分析
2郾 1摇 5 种模型预测结果分布范围的比较
5 种模型对黄顶菊适生区的预测结果见图 1,
ROC曲线下面积(AUC)对比见表 2. 最大值结果排
序为 Domain >Maxent > ENFA >GARP > Bioclim,Do鄄
main、Maxent与 ENFA 之间的最大值相差 0郾 006 和
0郾 002,区分度不大,说明 3 种模型的随机取样最佳
值比较接近.
GARP 的预测结果表明:黄顶菊高度适生区主
要为河北中南部、北京、天津、山东、河南、陕西中南
部、山西南部、安徽、江苏、湖北、重庆中北部、四川东
560312 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 曹向锋等: 采用生态位模型预测黄顶菊在中国的潜在适生区摇 摇 摇 摇 摇
图 1摇 基于 5 种模型预测的黄顶菊在我国的潜在适生区
Fig. 1摇 Prediction of potential suitable distribution of Flaveria bidenti in China based on 5 models.
a)GARP; b)Maxent; c)ENFA; d)Bioclim; e)Domain. 预测结果强度显示从绿色(最差)到红色(最强),红色说明最适宜黄顶菊生存 Prediction
strength was shown as green (weakest) to red (strongest), red meant the most suitable conditions for the species.
部、贵州北部、云南中东部. 边缘以上适生区则包括
新疆塔里木盆地西部、浙江、江西、湖南、福建沿海地
区以及广东境内与福建交界地区.
摇 摇 Maxent的预测结果表明:黄顶菊高度适生区主
要为河北中南部、北京、天津、山东西部和北部以及
山东、河南、安徽、江苏四省的交界处.边缘以上适生
区则包括了河北中南部、北京、天津、山东、河南、安
徽、江苏、湖北中部、四川东部以及云南中部地区.
ENFA的预测结果较为分散,高度适生区面积
很小而且分散,主要包括:河北、山东、河南三省的交
表 2摇 5 种模型预测结果的 AUC值比较
Tab. 2摇 Comparison of AUC of five models prediction
AUC GARP Maxent ENFA Bioclim Domain
10 组预测结果 0郾 788 0郾 962 0郾 950 0郾 555 0郾 928
的 AUC值 0郾 878 0郾 974 0郾 916 0郾 802 0郾 947
AUC of 10 0郾 871 0郾 971 0郾 980 0郾 690 0郾 979
groups results 0郾 893 0郾 977 0郾 945 0郾 737 0郾 950
0郾 866 0郾 961 0郾 963 0郾 835 0郾 988
0郾 869 0郾 958 0郾 858 0郾 750 0郾 928
0郾 890 0郾 982 0郾 951 0郾 687 0郾 959
0郾 876 0郾 963 0郾 893 0郾 669 0郾 969
0郾 810 0郾 980 0郾 958 0郾 663 0郾 968
0郾 895 0郾 977 0郾 970 0郾 636 0郾 988
最小值 Minimum 0郾 788 0郾 958 0郾 858 0郾 555 0郾 928
最大值 Maximum 0郾 895 0郾 982 0郾 980 0郾 835 0郾 988
平均值 Mean 0郾 864 0郾 971 0郾 938 0郾 702 0郾 960
标准差 SD 0郾 036 0郾 009 0郾 038 0郾 082 0郾 022
界处、河北南部地区、安徽、湖北、四川、浙江、江西、
云南等.边缘适生区则包括了河北中部、山西西南部
等区域.
Bioclim的预测结果表明,黄顶菊高度适生区面
积很少,适生区域相对集中.边缘以上适生区主要集
中在山东西北部、河南中部大部分地区、湖北北部以
及山西、陕西有零星分布. Domain 的预测结果表明:
高度适生区包括:河北中南部、北京、天津、陕西南
部、山西南部、山东西北部、河南中部大部分地区以
及山东、河南、安徽、江苏四省的交界处、广西南部、
广东部分沿海地区. 由于分级设定不同,Domain 预
测结果中的适生区即相当于前述几种模型的边缘区
域,主要包括:辽宁大部及吉林、内蒙古交界处、山
西、陕西、内蒙古西部、新疆中部、江苏、安徽、湖北、
四川东部、云南、广西、广东、海南、湖南东部、江西西
部.
2郾 2摇 5 种模型预测结果 ROC曲线的比较
对 5 种模型最大值的预测结果进行单独比较,
生成的 ROC曲线见图 2,虽然重新取样得到的 AUC
值会有不同,但 Domain、ENFA 和 Maxent 依然明显
高于 GARP 和 Bioclim;平均值由高到低的排序为:
Maxent>Domain>ENFA>GARP>Bioclim,标准差由高
到低的排序为:Bioclim>ENFA>GARP>Domain>Max鄄
ent,平均值和标准差的大小可以说明模型的总体水
6603 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 21 卷
图 2摇 5 种模型最佳预测结果的 AUC
Fig. 2摇 AUC of the best prediction by five models.
玉:Garp ( AUC = 0郾 923 ); 域:Maxent ( AUC = 0郾 971 ); 芋: ENFA
(AUC = 0郾 982); 郁:Bioclim (AUC = 0郾 880); 吁:Domain ( AUC =
0郾 981) .
平高低,标准差代表了样本的离散度,标准差值小说
明随机取样对模型的影响小. 平均值较高而标准差
较低则表明预测模型稳定. 比较结果表明,Maxent
的稳定性最好,其次是 Domain.
2郾 3摇 黄顶菊在我国的可能适生分布区
如图 2 所示,5 种模型最佳预测结果的 AUC 分
别为:AUCGARP = 0郾 923,AUCMaxent = 0郾 971,AU鄄
CENFA = 0郾 982,AUCBioclim = 0郾 880,AUCDomain =
0郾 981.综合几项评定,本文选择预测结果稳定性较
好,而且预测值较好的 Maxent作为黄顶菊适生区预
测的模型,并采信 Maxent的最佳值(AUC 为 0郾 971)
作为黄顶菊在我国的可能适生分布区(图 3). 预测
结果表明,黄顶菊在我国的高度适生区占 1郾 6% ,适
生区占 2郾 6% ,边缘适生区占 3郾 3% ,低适生区占
7郾 8% ,非适生区占 84郾 7% (图 4).
图 3摇 黄顶菊在我国的可能适生分布区
Fig. 3摇 Potential suitable distribution of Fleveria bidentis in China.
图 4摇 黄顶菊各适生区所占比例
Fig. 4 摇 The proportion of various potential suitable distribution
of Fleveria bidentis.
玉:高适生区 Highly suitable distribution; 域:适生区 Suitable distribu鄄
tion; 芋:低适生区 Lowly suitable distribution; 郁:边缘适生区 Margin鄄
ally distribution;吁:非适生区 Unsuitable distribution.
3摇 讨摇 摇 论
在本实验室前期研究的基础上[16],利用常用的
5 种模型预测软件对黄顶菊在我国的适生区进行了
预测.并对预测结果进行了筛选,最终采纳了 Max鄄
ent的结果作为黄顶菊适生区预测的结果.预测结果
表明:黄顶菊高度适生区主要为河北中南部、北京、
天津、山东西部和北部以及山东、河南、安徽、江苏四
省的交界处.边缘以上适生区域则包括了河北中南
部、北京、天津、山东、河南、安徽、江苏、湖北中部、四
川东部以及云南中部地区. 其中已经有黄顶菊分布
的天津、河北、山东、河南均处在高度适生区内,其预
测验证结果 AUC值显示也非常好,说明模型与实际
拟合度较好,能更好地模拟黄顶菊在我国的分布,结
果可靠.
本研究采用的 5 种模型各有优势,选择 Maxent
预测结果作为最终的结果只是对黄顶菊的拟合度较
高,当换成其他物种时结果有可能不同.在预测其他
物种的适生区时各个模型表现不一,所以在对一个
物种进行适生区模拟时,要采用多种模型进行预测,
然后筛选出最佳模型作为模拟工具. 目前多数研究
选择适生区分析软件多未经过筛选,由于软件预测
的不确定性使得结果并不稳定,所以多种软件(模
型)结合筛选会提高结果的可靠性.
应用生态位模型的前提是假设物种的生态位需
求是保守的,但是由于入侵物种的生态位有时会发
生漂移,应用原产地的分布数据预测发生漂移后的
入侵物种在入侵地的潜在分布可能会带来偏差[17] .
760312 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 曹向锋等: 采用生态位模型预测黄顶菊在中国的潜在适生区摇 摇 摇 摇 摇
因此,有些研究人员单纯地使用原产地或入侵地的
数据所建立的生态位模型,由于生态位的实际差异,
难以准确地预测出物种的适生分布区[18-19] .由于黄
顶菊已经在我国的部分省市定殖,本文中所用已存
在点数据既包括了原产地也包括了入侵地,可以弥
补用原产地生态环境模拟潜在适生区生态环境的误
差,提高了对黄顶菊在我国可能分布区域预测的可
靠性.但是针对特定的物种,如何选择合适的模型,
应该根据此物种已有的生物学知识和信息,以及研
究者对模型的理解和应用能力综合考虑,同时必须
清楚任何模型都只是一种推测,不能替代普查和试
验结果,每种模型都有其特定的假设和限制性条件,
在应用特定的模型时必须清楚这一点[20] .
模型运算必须要求两类数据:一类是已知物种
分布点;一类是环境因子数据.已知物种分布点的收
集要从已报道文献、官方网站或者实地考察获得.对
于模型来说,分布点收集越多对模型训练越有利.同
样训练数据和验证数据的比例也要根据情况而定,
当已知分布点较少时,应当适当加大训练数据的比
例,如本文中选择 75%就是基于已知分布点较少的
实际情况.
提高验证数据中已知分布点的比例会使 ROC
曲线分析更可靠.环境因子的筛选也是重要的环节,
本文采用了人工筛选和 ENFA 结合的方式,这是基
于已经掌握了黄顶菊的部分生物学资料以及 ENFA
是基于物种生物地理信息,PCA 用于环境因子数降
维时会产生更多的噪声,所以本文未采用 PCA作为
降维方法.
预测结果的验证目前大多采用生成 ROC 曲线
的方式. ROC曲线的取样抽提数据均是机器随机产
生的,但是仍不可避免取样误差.降低这种误差的有
效方式:1)增加验证数据中的已知分布点比例;2)
增加重复试验.本文采用了 10 组对应训练数据和验
证数据,不仅减少了取样误差而且可以比较几种模
型的稳定性.再对每种模型的每组最佳结果进行比
较,筛选出采信结果. 对 AUC 值进行统计分析也是
本文的创新,由于多数预测都采用单一随机取样的
方式,因此无法进行统计分析的比较.采用多组数据
预测的文献也只是提取了最佳模拟结果进行模型间
的横向比较,本文不仅对各个模型最佳值进行了比
较,而且对模型的稳定性也进行了比较.本文采信的
结果是最稳定模型的最佳预测值,比普通预测更为
可信.
根据白艺珍等[16]的研究,黄顶菊在我国已发生
地河北、天津与原产地巴西、波多黎各以及有发生的
美国气候相似性并不高,说明在我国的已发生地与
原产地及入侵地部分地区的气候结构差别较大,有
可能发生了生态位漂移. 黄顶菊在我国分布的具体
生境与美国相似:美国的分布也是倾向于码头、荒地
等被干扰过的生境,但是并未造成农业上的太大损
失,在其他已报道的国家(如澳大利亚)也未将其列
为检疫性有害生物[21] .但是黄顶菊在我国的河北大
面积繁殖,对农业生产的影响很大,可能与其在我国
缺少同生态位竞争生物有关.根据本文预测结果,黄
顶菊的竞争性并不是很强,在我国的可能适生范围
占陆地国土面积的 7郾 5% ,如果进行合理防治完全
可以将其控制在一定范围内甚至完全清除.
参考文献
[1]摇 Liu Q鄄R (刘全儒). Flaveria Juss. (Compositae): A
newly naturalized genus in China. Acta Phytotaxonomica
Sinica (植物分类学报), 2005, 43(2): 178-180 ( in
Chinese)
[2]摇 Li X鄄J (李香菊), Wang G鄄Q (王贵启), Zhang C鄄X
(张朝贤), et al. The distribution, characteristics and
chemical control of alien species Flaveria bidentis. Weed
Science (杂草科学), 2006(4): 58-61 (in Chinese)
[3]摇 Li X鄄J (李香菊), Zhang M鄄R (张米茹), Li Y鄄J (李
咏军), et al. Allelopathy study of aqueous extract of
Flaveira bidentis on seed germination and radicel elonga鄄
tion. Weed Science (杂草科学), 2007(4): 15-19 (in
Chinese)
[4]摇 Leshowitz B. Comparison of ROC curves from one鄄 and
two鄄interval ratingscale procedures. Journal of the
Acoustical Society of America, 1969, 46: 399-402
[5]摇 Goodenough DJ, Rossmann K, Lusted LB. Radiographic
applications of receiver operating characteristic ( ROC)
curves. Radiology, 1974, 110: 89-95
[6]摇 Metz CE. Basic principles of ROC analysis. Seminars in
Nuclear Medicine, 1978, 8: 283-298
[7]摇 Zweig MH, Cambell G. Receiver operating characteris鄄
tic (ROC) plots: A fundamental evaluation tool in clini鄄
cal medicine. Clinical Chemistry, 1993, 39: 561-577
[8]摇 Swets JA. Measuring the accuracy of diagnostic systems.
Science, 1988, 240: 85-93
[9]摇 Vanagas G. Receiver operating characteristic curves and
comparison of cardiac surgery risk stratification systems.
Interactive Cardiovascular and Thoracic Surgery, 2004,
3: 319-322
8603 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 21 卷
[10]摇 Stockwell DRB, Noble IR. Induction of sets of rules
from animal distribution data: A robust and informative
method of data analysis. Mathematics and Computers in
Simulation, 1992, 33: 385-390
[11] 摇 Braunisch V, Suchant R. A model for evaluating the
‘habitat potential爷 of a landscape forcapercaillie Tetrao
urogallus: A tool for conservation planning. Wildlife Bi鄄
ology, 2007, 13: 21-33
[12]摇 Steven JP, Miroslav D, Robert ES. A maximum entropy
approach to species distribution modeling. Proceedings
of the Twenty鄄First International Conference on Machine
Learning. Banff, Alberta, 2004: 655-662
[13]摇 Hirzel AH, Hausser J, Chessel D, et al. Ecological鄄
niche factor analysis: How to compute habitat鄄suitability
maps without absence data. Ecology, 2002, 83: 2027-
2036
[14] 摇 Nix HA. A biogeographic analysis of Australian elapid
snakes / / Longmore R, ed. Atlas of Elapid Snakes of
Australia. Australian Flora and Fauna Series Number 7.
Canberra: Australian Government Publishing Service,
1986: 4-15
[15]摇 Booth TH. A climatic analysis method for expert systems
assisting tree species introductions. Agroforestry Sys鄄
tems, 1990, 10: 33-45
[16]摇 Bai Y鄄Z (白艺珍), Cao X鄄F (曹向锋), Chen C (陈
晨), et al. Potential distribution areas of alien invasive
plant Flaveria bidentis (Asteraceae) in China. Chinese
Journal of Applied Ecology (应用生态学报), 2009, 20
(10): 2377-2383 (in Chinese)
[17]摇 Broennimann O, Treier UA, M俟ller鄄Sch覿rer H, et al.
Evidence of climatic niche shift during biological inva鄄
sion. Ecology Letters, 2007, 10: 701-709
[18]摇 Welk E. Constraints in range predictions of invasive
plant species due to non鄄equilibrium distribution pat鄄
terns: Purple loosestrife ( Lythrum salicaria) in North
America. Ecological Modelling, 2004, 179: 551-567
[19]摇 Mau鄄Crimmins TM, Schussman HR, Geiger EL. Can
the invaded range of a species be predicted sufficiently
using only native range data? Lehmann lovegrass (Er鄄
agrostis lehmanniana ) in the southwestern United
States. Ecological Modelling, 2006, 193: 736-746
[20]摇 Wang Y鄄S (王运生), Xie B鄄Y (谢丙炎), Wan F鄄H
(万方浩), et al. Potential geographic distribution of
Radopholus similis in China. Scientia Agricultura Sinica
(中国农业科学), 2007, 40 (11): 2502 - 2506 ( in
Chinese)
[21]摇 Federal Register of Legislative Instruments. Quarantine
Proclamation 1998[EB / OL]. (2006鄄12鄄06) [2010鄄07鄄
02 ]. http: / / www. comlaw. gov. au / comlaw / manage鄄
ment. nsf / lookupindexpagesbyid / IP200400881? Open鄄
Document
作者简介摇 曹向锋,男,1985 年生,硕士研究生.主要从事外
来有害生物预警研究. E鄄mail: caoxf119@ 126. com
责任编辑摇 张凤丽
960312 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 曹向锋等: 采用生态位模型预测黄顶菊在中国的潜在适生区摇 摇 摇 摇 摇