免费文献传递   相关文献

Forest lighting fire forecasting for Daxing’anling Mountains based on MAXENT model.

基于MAXENT模型的黑龙江大兴安岭森林雷击火火险预测


黑龙江大兴安岭是森林雷击火的高发地区,急需研发精确的火险预测模型对该区森林火灾进行预测.本文基于大兴安岭地区森林雷击火灾数据及环境变量数据,采用MAXENT模型进行森林雷击火的火险预测.首先对各环境变量进行共线性诊断,再利用累积正则化增益法和Jackknife方法评价了环境变量的重要性,最后采用最大Kappa值和AUC值检测了MAXENT模型的预测精度.结果表明: 闪电能量和中和电荷量的方差膨胀因子(VIF)值分别为5.012和6.230,与其他变量之间存在共线性,不能用于模型训练.日降雨量、云地闪电数量及云地闪回击电流强度是影响森林雷击火发生的3个最重要因素,日平均风速和坡向的影响较小.随着建模数据比例的增加,最大Kappa值和AUC值均有增大趋势.最大Kappa值都大于0.75,平均值为0.772; AUC值都大于0.5,平均值为0.859.MAXENT模型的预测精度达到中等精度,可应用于大兴安岭地区的森林雷击火火险预测.

Daxing’anling Mountains is one of the areas with the highest occurrence of forest lighting fire in Heilongjiang Province, and developing a lightning fire forecast model to accurately predict the forest fires in this area is of importance. Based on the data of forest lightning fires and environment variables, the MAXENT model was used to predict the lightning fire in Daxing’anling region. Firstly, we studied the collinear diagnostic of each environment variable, evaluated the importance of the environmental variables using training gain and the Jackknife method, and then evaluated the prediction accuracy of the MAXENT model using the max Kappa value and the AUC value. The results showed that the variance inflation factor (VIF) values of lightning energy and neutralized charge  were 5.012 and 6.230, respectively. They were collinear with the other variables, so the model could not be used for training. Daily rainfall, the number of cloudtoground lightning, and current intensity of cloudtoground lightning were the three most important factors affecting the lightning fires in the forest, while the daily average wind speed and the slope was of less importance. With the increase of the proportion of test data, the max Kappa and AUC values were increased. The max Kappa values were  above 0.75 and the average value was 0.772, while all of the AUC values were  above 0.5 and the average value was 0.859. With a moderate level of prediction accuracy being achieved, the MAXENT model could be used to predict forest lightning fire in Daxing’anling Mountains.


全 文 :基于 MAXENT模型的黑龙江大兴安岭
森林雷击火火险预测*
孙摇 瑜1 摇 史明昌1**摇 彭摇 欢1 摇 朱沛林1 摇 刘思林1 摇 吴石磊1 摇 何摇 诚2 摇 陈摇 锋1
( 1北京林业大学, 北京 100083; 2南京森林警察学院, 南京 210023)
摘摇 要摇 黑龙江大兴安岭是森林雷击火的高发地区,急需研发精确的火险预测模型对该区森
林火灾进行预测.本文基于大兴安岭地区森林雷击火灾数据及环境变量数据,采用 MAXENT
模型进行森林雷击火的火险预测.首先对各环境变量进行共线性诊断,再利用累积正则化增
益法和 Jackknife方法评价了环境变量的重要性,最后采用最大 Kappa 值和 AUC 值检测了
MAXENT模型的预测精度.结果表明: 闪电能量和中和电荷量的方差膨胀因子(VIF)值分别
为 5. 012 和 6. 230,与其他变量之间存在共线性,不能用于模型训练.日降雨量、云地闪电数量
及云地闪回击电流强度是影响森林雷击火发生的 3 个最重要因素,日平均风速和坡向的影响
较小.随着建模数据比例的增加,最大 Kappa 值和 AUC 值均有增大趋势. 最大 Kappa 值都大
于 0. 75,平均值为 0. 772; AUC值都大于 0. 5,平均值为 0. 859. MAXENT模型的预测精度达到
中等精度,可应用于大兴安岭地区的森林雷击火火险预测.
关键词摇 森林雷击火摇 MAXENT模型摇 火险预测摇 Kappa值摇 AUC值
文章编号摇 1001-9332(2014)04-1100-07摇 中图分类号摇 S762. 2摇 文献标识码摇 A
Forest lighting fire forecasting for Daxing爷 anling Mountains based on MAXENT model.
SUN Yu1, SHI Ming鄄chang1, PENG Huan1, ZHU Pei鄄lin1, LIU Si鄄lin1, WU Shi鄄lei1, HE
Cheng2, CHEN Feng1 ( 1Beijing Forestry University, Beijing 100083, China; 2Nanjing Forestpolice
College, Nanjing 210023, China) . 鄄Chin. J. Appl. Ecol. , 2014, 25(4): 1100-1106.
Abstract: Daxing爷anling Mountains is one of the areas with the highest occurrence of forest lighting
fire in Heilongjiang Province, and developing a lightning fire forecast model to accurately predict
the forest fires in this area is of importance. Based on the data of forest lightning fires and environ鄄
ment variables, the MAXENT model was used to predict the lightning fire in Daxing爷anling region.
Firstly, we studied the collinear diagnostic of each environment variable, evaluated the importance
of the environmental variables using training gain and the Jackknife method, and then evaluated the
prediction accuracy of the MAXENT model using the max Kappa value and the AUC value. The re鄄
sults showed that the variance inflation factor ( VIF) values of lightning energy and neutralized
charge were 5. 012 and 6. 230, respectively. They were collinear with the other variables, so the
model could not be used for training. Daily rainfall, the number of cloud鄄to鄄ground lightning, and
current intensity of cloud鄄to鄄ground lightning were the three most important factors affecting the
lightning fires in the forest, while the daily average wind speed and the slope was of less impor鄄
tance. With the increase of the proportion of test data, the max Kappa and AUC values were in鄄
creased. The max Kappa values were above 0. 75 and the average value was 0. 772, while all of the
AUC values were above 0. 5 and the average value was 0. 859. With a moderate level of prediction
accuracy being achieved, the MAXENT model could be used to predict forest lightning fire in Dax鄄
ing爷anling Mountains.
Key words: forest lightning fire; MAXENT model; lightning fire forecast; Kappa value; AUC
value.
*中央高校基本科研业务费专项资金(LGZD201401)和国家林业局 948 引进项目(2008鄄4鄄51)资助.
**通讯作者. E鄄mail: shimc@ dtgis. com
2013鄄09鄄06 收稿,2014鄄01鄄20 接受.
应 用 生 态 学 报摇 2014 年 4 月摇 第 25 卷摇 第 4 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
Chinese Journal of Applied Ecology, Apr. 2014, 25(4): 1100-1106
摇 摇 火是森林生态系统的重要干扰因子,全世界每
年有几百万公顷的森林遭到林火破坏[1-2] . 林火按
照火源可分为自然火和人为火,雷击是引发森林火
灾的主要自然火源[1] . 在黑龙江大兴安岭地区,雷
击火占近 40 年该地区发生森林火灾总数的 30%以
上.雷击引发的森林火灾损失与危害极大,常常导致
成片森林被毁[1-3] .因此,在雷击发生后及时进行火
险预报,对森林雷击火的管理具有重要意义.
预报森林雷击火的火险的方法主要有两大类:
火险指数法和数学模型方法. 建立火险指数通常先
选取影响雷击火发生的环境因子,再确定影响因子
的权重,最后得到一个综合指标.早期通常只采用气
象因子作为影响影子,得到的指数称为火险天气指
标.郭文等[4]选用每日最高气温、每日最小相对湿
度、每日最大风速、日降雨量作为火灾影响因子建立
了内蒙古大兴安岭森林火险天气指标. 随着雷电定
位技术的成熟,综合考虑天气、雷击等因素来建立指
标成为可能. 高永刚等[5]采用权重分析法综合天
气、雷击、可燃物因子建立了大兴安岭森林雷击火综
合指标.火险指数法简单易用,但无法定量描述雷击
火发生与各环境因子的关系.近年来,国内外学者应
用各种数学模型来进行森林雷击火的火险预测,如
最小二乘回归模型(OLS) [6]、二元逻辑斯蒂回归模
型[7-10]、元 胞 自 动 机 模 型[11]、 证 据 权 重 模 型
(weights鄄of鄄evidence approach) [12]、广义线性模型
(GAM) [13]、负二项和零膨胀负二项回归模型[14]等.
但大部分模型都有一些应用前提,如最小二乘回归
模型中,雷击火发生数据的分布要满足等方差和正
态分布的条件;负二项和零膨胀负二项回归模型要
求雷击火分布的方差大于均值. 而 MAXENT 模型
中,历史雷击火发生的概率分布形式可以是未知的,
没有任何限制条件.
MAXENT模型是一种基于最大熵原理的物种
分布模型,主要应用于物种的潜在生境预测[15-19] .
MAXENT模型将研究区内的所有像元作为物种的
可能分布空间,将已知物种分布点的像元作为样点,
根据样点像元的环境变量如气候变量、海拔、土壤类
型、植被类型得出约束条件,并认为在此约束条件下
熵最大时的物种出现概率分布最接近物种的实际分
布.森林雷击火的发生受到多个环境变量的影响,以
历史火灾发生点为样点,根据样点的环境变量可计
算熵最大时的雷击火概率分布. 这个最大熵概率分
布是否可以模拟真实的森林雷击火分布还有待于研
究.国外已有学者尝试将 MAXENT 模型应用于森林
火灾的研究. Parisien 和 Moritz[20]使用 MAXENT 模
型在 3 个空间尺度上研究了林火与环境因子的关
系,结果表明 MAXENT模型及其有关概念可以应用
于研究林火与环境因子的关系. Renard等[21]进一步
将 MAXENT 模型应用于印度南部的林火发生预测
上,得到了区域林火预测模型.本文则基于历史森林
雷击火灾数据和环境因子数据,应用 MAXENT 模型
进行黑龙江大兴安岭地区森林雷击火火险预测,探
究该模型在森林雷击火火险预报中的适用性,为森
林雷击火的火险预测提供支持.
1摇 研究地区与研究方法
1郾 1摇 研究区概况
黑龙江省大兴安岭林区位于 50毅10忆—53毅33忆 N,
121毅12忆—127毅00忆 E,面积 8. 46伊104 km2 . 该区属寒
温带大陆性季风气候,年均气温-2. 8 益,最高气温
39. 0 益,年降水量 350 ~ 500 mm, 降水集中于 7—8
月.冬季有长达 5 个月的积雪期,林内雪深达 30 ~
50 cm.土壤以棕色针叶林土和暗棕壤为主. 全区山
势较平缓, 海拔 300 ~ 1400 m, 15毅以内的缓坡占
80%以上.该区夏季雷暴活动频繁,为我国森林雷击
火灾的高发区,森林雷击火灾数量和森林受害面积
居全国之首.
1郾 2摇 数据来源
本文使用的数据包括黑龙江大兴安岭地区
1968—2010 年 627 个历史雷击火灾记录(起火点地
理坐标、发生时间和过火面积等);2005—2010 年的
雷电定位数据(落雷时间、经度、纬度、电流强度、电
荷量等);2005—2010 年的日气象数据(日最高温
度、日平均相对湿度、日平均风速、日降雨量);森林
二类调查小班数据;90 m 分辨率的数字高程模型
(digital elevation model, DEM)数据. 历史雷击火灾
记录来自于黑龙江省大兴安岭林业集团公司森林防
火部.雷电定位数据来自国家气象局布设在大兴安
岭地区的闪电定位仪监测系统. 气象数据(10 个气
象观测站日观测数据,研究区内 5 个,研究区附近 5
个)来自国家气象数据共享网的每日气象数据集.
小班数据来自于黑龙江省大兴安岭林业集团公司.
DEM 数据来自于 SRTM (NASA shuttle radar topogra鄄
phy mission)的 DEM数据产品.
1郾 3摇 模型原理
熵是描述客观事物无序性的参数,代表事物不
确定的程度.最大熵理论认为,在没有外力作用下事
物总是朝着最随机、最不确定的方向发展.在只掌握
10114 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 孙摇 瑜等: 基于 MAXENT模型的黑龙江大兴安岭森林雷击火火险预测摇 摇 摇 摇 摇 摇
未知分布的部分信息时,关于未知概率分布最合理
的推断就是在已知信息约束下的最随机、最不确定
的推断.即熵最大时的概率分布才是最接近真实状
态的分布,任何其他选择都意味着增加了其他的约
束和假设,这些约束和假设根据已掌握的信息是无
法得出的.
在本文中,研究区被划分为有限个数的像元集,
称为 X.每一个像元 x沂X被分配了 1 个非负的概率
值 p(x),代表该像元发生森林雷击火的危险程度,
所有像元的概率值之和为 1. 这样就构建了一个雷
击火在研究区的概率分布,称之为 仔. 仔 是未知的,
最大熵原理认为熵最大时的概率分布 p是最接近真
实状态的分布. 为了求解 p,首先,要构建分布 p 的
约束条件.关于未知的分布 仔,我们所掌握的信息就
是历史火灾发生信息及火灾发生点的环境信息. 因
此,构造一种函数来代表环境因子的信息,称为特征
函数 fx(…).特征函数的形式可以是多种的.本研究
采用的形式是 MAXENT软件自带的形式,即:
fx(…)= 酌1 f1+酌2 f2+酌3 f3+酌4 f4……+酌i f i
式中:酌 是一组参数;f i 为像素 x 位置的第 i 个环境
因子的值.已知信息可以表达为所有发生火灾像元
的特征函数值的平均值: e = 1m移
m
1
fxi(…) . 式中:m
是历史火灾的次数;fxi(…)是第 i 次火灾所在像元
的特 征 函 数. 分 布 p 的 环 境 因 子 期 望 E =
移 x沂Xp(x) fx(…) 需无限接近于 e. 所以,分布 p 的
约束条件为 | e鄄E | <茁,式中:茁 为任意小的正常数.
Della等[22]证明最大熵分布通常具有以下形式:
p(x)= e
f x(…)
Z
式中:p(x)是第 x像元的概率值;Z是一个确保所有
像元的概率值之和为 1 的常数.通过正则化变换后,
约束条件可以表达为使下式的值最小:
lnZ姿 -
1
m移
m
i = 1
fxi(…)+移
j
茁 j姿
式中:m为历史火灾的次数;姿是特征函数中的一组
参数;茁 j 为任意小的正常数.上式被称为 log loss.只
要确定参数 姿,使 log loss 的值最小,最大熵概率分
布 p即可确定.为了确定系数 姿,MAXENT模型使用
了机器语言学习中的经典算法连续迭代算法. 在迭
代开始时,系数 姿 被赋予初始值 姿 = (0,0…0,),即
每一个环境因子的作用是相同的.然后,连续调整 姿
值使上式的值减小,直到迭代次数达到用户指定的
次数或 log loss的值不再显著变小时停止迭代.此时
的 姿值即是最终的 姿值. Phillips等[15]开发的 MAX鄄
ENT软件实现了上述算法.模型训练时需在历史火
灾记录中随机选取一定比例的数据作为验证数据,
不参与模型训练,剩下的数据可用于模型训练.
1郾 4摇 预测精度评价方法
预测模型通常会产生两类错误:第一类是过低
估计, 将实际有火灾发生的区域预测为低火险区,
为假阴性; 第二类错误是过高估计, 将实际并没有
火灾发生的区域预测为高火险区域, 为假阳性(表
1).这两类错误都与阈值的选择密切相关. 研究者
通常使用以下模型评价指标来评价模型的准确性:
总体准确度、真阳性率、真阴性率、Kappa 统计量、受
试者工作特征曲线下面积值(AUC)(表 2). 总体准
确度易受火灾次数的影响,容易产生偏差.真阳性率
反映了预测火灾发生的能力,但容易受第二类错误
的影响.真阴性率反映了预测火灾不发生的能力,易
受第一类错误的影响. Kappa 统计量综合考虑了真
阳性率和真阴性率,但易受阈值的影响.通常选用系
列阈值中最大的值即最大 Kappa值来做判断. Kappa
统计量取值范围为(-1,1),最大 Kappa值越接近 1,
表示模型的预测效果越理想,等于或小于 0 则表示
模型预测效果不比随机分布模型效果好. 受试者工
作特征曲线( receiver operating characteristic curve,
ROC)分析通过改变诊断阈值, 可获得多对真(假)
阳性率值.以假阳性率为横坐标, 真阳性率为纵坐
标,绘制而成的曲线称之为 ROC 曲线. AUC 值是
ROC曲线下的面积. 一般认为 AUC 值为 0. 5 ~ 0. 7
时模型准确率较低;为0 . 7 ~ 0 . 9时模型准确率中
表 1摇 评价模型错误矩阵
Table 1 摇 An error matrix used to evaluate the predictive
accuracy of models
预测
Predict
实际 Actual
发生
Presence
不发生
Absence
发生 Presence a b
不发生 Absence c d
a: 真阳性 True positive; b: 假阳性 False positive; c: 假阴性 False
negative; d: 真阴性 True negative. 下同 The same below.
表 2摇 常用模型评价指标的计算公式
Table 2摇 Equation of assessment indicator of common model
指标
Indicator
公式
Equation
总体准确度 Overall accuracy (a+d) / n
真阳性率 Proportion of true positives a / (a+c)
真阴性率 Proportion of true negatives d / (b+d)
n=a+b+c+d.
2011 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 25 卷
等;大于 0. 9 时模型准确率较高. AUC 值不受阈值
的影响,是公认的较理想的评价指标[23] . 本研究选
用最大 Kappa值和 AUC值来评价模型精度.
1郾 5摇 环境变量选择及数据处理
森林雷击火是在多种环境要素共同作用下发生
和发展的.云地闪电是森林雷击火发生的必要条件,
云地闪次数、云地闪回击电流强度、云地闪能量、中
和电荷量是表征闪电特性的参数,也是决定闪电能
否点燃森林可燃物的主要影响因子. 森林可燃物的
含水率是决定闪电能否点燃森林可燃物的另一重要
因子.森林可燃物含水率与气象条件的关系密切,尤
其是降雨量直接影响了可燃物的含水率. 闪电引燃
森林可燃物后,火能否蔓延最终形成火灾则受到气
象条件、可燃物类型、地形等的综合影响. 风速影响
了林火的初始蔓延速度. 不同可燃物类型有不同的
燃烧特性,影响了燃烧速率.地形影响林火蔓延的方
向和速度.因此,本研究使用 4 类共 10 个环境变量
来构建模型(表 3).
环境变量之间可能存在相互影响,在建模前要
尽可能排除彼此间存在较密切线性关系的环境变
量.为此,本研究对所有选取的环境因子进行多重共
线性检验(multi鄄collinearity diagnostics) .根据环境变
量的方差膨胀因子(variance inflation factor, VIF)值
来判断,VIF值越大,说明该变量与其他变量的相关
性越大.通常选用 VIF值等于 5 作为判断阈值,当某
一变量 VIF值大于 5 时,可将该变量剔除. MAXENT
软件要求输入软件的环境变量必须是 ESRI ASCII
grid格式的栅格图层或csv格式的Excel文件 . 本研
表 3摇 用于构建模型的环境变量
Table 3 摇 Environmental variables used in model develop鄄
ment
变量类型
Variable type
变量代码
Variable code
描述
Description
气象因子 DMT 日最高温度 Daily maximum temperature
Meteorological DR 日降雨量 Daily rainfall
factor DAH 日平均湿度 Daily average humidity
DAWS 日平均风速 Daily average wind speed
闪电因子 LN 云地闪电数量 Cloud鄄to鄄ground lightning number
Lightning factor LCI 云地闪回击电流强度 Current intensity of
cloud鄄to鄄ground lightning
NC 中和电荷量 Neutralized charge
LE 闪电能量 Lightning energy
可燃物因子
Fuel factor
FT 可燃物类型 Fuel type
地形因子 ALT 海拔 Altitude
Landform factor SLO 坡度 Slope
ASP 坡向 Aspect
究所有的环境变量都是以空间分辨率 1 km 的
ASCII grid格式栅格图层的形式输入软件.栅格图层
的生成全在 ESRI公司的 ArcGIS 10. 0 软件中完成.
气象因子栅格数据由气象站点观测数据经克里金空
间插值得到.坡度、坡向栅格数据由 DEM 数据计算
得到.可燃物类型栅格图层是按照小班数据中的林
型来划分.可燃物类型共分为 6 类:落叶松林;樟子
松林;落叶松与白桦、柞树等针阔混交林;樟子松与
白桦、柞树等针阔混交林;草地;其他.
1郾 6摇 环境变量的重要性评价
本文采用累积正则化增益法和 Jackknife 方法
来评价环境变量的重要性. 累积正则化增益法指在
每次迭代过程中,当 log loss 值减小时,导致 log loss
减小的每个环境变量都要加上 log loss 减小值的绝
对值;当 log loss值增加时,导致 log loss值增加的每
个环境变量都要减去 log loss增加值的绝对值.在迭
代结束后,每个环境变量获得的增益值越大,表示该
环境变量的重要性越高. Jackknife 方法的原理是在
只包含和不包含某一环境变量两种情况下,分别进
行模型训练并计算 AUC值.当只包含某一变量时的
AUC值较包含全部变量时的 AUC 值没有明显减
小,或当不包含某一变量时的 AUC值较包含全部变
量时的 AUC值明显减小,表示该环境变量的重要性
越高.
环境变量中的图形制作在 SigmaPlot 10. 0 软件
中完成.
2摇 结果与分析
2郾 1摇 多重共线性检验
由表 4 可以看出,闪电因子中的中和电荷量、闪
电能量的 VIF 值均大于 5,说明这两个变量与其他
变量存在密切的共线性关系.这可能因为闪电能量、
中和电荷量与云地闪回击电流强度间存在相互影
响.其他环境变量的 VIF值均小于 5 ,说明它们之间
没有明显共线性,可同时用于建模.
2郾 2摇 环境变量重要性评价
由图 1 可以看出,日降雨量、云地闪电数量、云
地闪回击电流强度获得的累积正则化增益值明显高
于其他环境变量.说明在模型迭代过程中,这 3 个环
境变量是使 log loss值变小的主要影响因子.也就是
说,在使概率分布的熵值达到最大的过程中,这 3 个
环境变量的贡献率最大. 其他变量获得的累积正则
化增益值都较小,从大到小排序依次为日最高温度、
日平均相对湿度、坡度、可燃物类型、日平均风速、坡
30114 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 孙摇 瑜等: 基于 MAXENT模型的黑龙江大兴安岭森林雷击火火险预测摇 摇 摇 摇 摇 摇
表 4摇 多重共线性检验
Table 4摇 Multi鄄collinearity diagnostics
序号
Number
特征值
Eigenvalue
方差比例 Proportion of variation
DMT DAH DAWS DR FT ALT ASP SLO LCI LN LE FT
1 7. 9109 0. 0009 0. 0003 0. 0021 0. 0018 0. 0040 0. 0021 0. 0026 0. 0034 0. 0029 0. 0017 0. 0034 0. 0041
2 1. 2141 0. 0015 0. 0004 0. 0003 0. 0879 0. 0045 0. 0001 0. 0265 0. 0019 0. 0142 0. 0691 0. 0019 0. 0009
3 0. 4866 0. 0009 0. 0008 0. 0013 0. 0158 0. 2986 0. 0002 0. 0632 0. 2489 0. 0332 0. 0031 0. 2489 0. 1024
4 0. 3721 0. 0070 0. 0006 0. 0592 0. 0849 0. 1518 0. 0346 0. 0147 0. 3160 0. 0207 0. 0285 0. 0160 0. 1160
5 0. 2961 0. 0006 0. 0000 0. 0000 0. 0701 0. 4884 0. 0356 0. 0629 0. 0110 0. 2739 0. 0652 0. 0110 0. 1240
6 0. 2386 0. 0047 0. 0002 0. 0815 0. 2360 0. 0163 0. 0526 0. 4088 0. 0107 0. 1538 0. 0187 0. 0107 0. 0136
7 0. 1722 0. 0025 0. 0001 0. 3634 0. 1452 0. 0184 0. 0016 0. 0734 0. 0391 0. 2179 0. 3864 0. 0391 0. 0362
8 0. 1392 0. 0776 0. 0313 0. 2372 0. 1332 0. 0004 0. 0003 0. 0100 0. 0889 0. 1297 0. 1600 0. 0889 0. 0089
9 0. 1148 0. 0035 0. 0006 0. 0405 0. 0027 0. 0033 0. 8566 0. 3194 0. 2663 0. 1412 0. 0208 0. 5663 0. 5361
10 0. 0467 0. 8403 0. 1031 0. 0012 0. 0576 0. 0001 0. 0137 0. 0169 0. 0138 0. 0117 0. 2459 0. 0138 0. 0246
11 0. 0088 0. 0605 0. 8626 0. 2134 0. 1649 0. 0141 0. 0025 0. 0014 0. 0000 0. 0009 0. 0006 0. 0000 0. 0000
方差膨胀因子 VIF 1. 9530 1. 7850 1. 1860 2. 0630 1. 2540 1. 1480 1. 5340 1. 7900 1. 3220 2. 6440 5. 0120 6. 2310
各参数的含义请参见表 3 Meaning of each parameter was same as Table 3.
向.由 Jackknife方法得到的环境变量重要性从大到
小依次为:日降雨量、云地闪回击电流强度、云地闪
电数量、日平均相对湿度、可燃物类型、坡度、日最高
温度、日平均风速、坡向(图 2).当不包含日降雨量、
云地闪回击电流强度、云地闪电数量时,模型训练得
到的 AUC 值较包含全部变量时的 AUC 值显著减
少.说明包含了这 3 个变量的模型比不包含这 3 个
变量的模型的预测准确率显著提高. 对于其他环境
变量,当不包含它们时,AUC 值没有显著减少;但当
只包含它们时,AUC 值都明显减少. 说明这些环境
变量对模型的预测准确率没有显著贡献. 比较两种
评价方法的结果可以发现,环境变量重要性的排序
在大体上一致,但有几个变量的排序是不同的.日降
雨量、云地闪电数量、云地闪回击电流强度这 3 个环
境变量在两种方法里的重要性排名都是前 3 位. 可
见,这 3 个环境变量是森林雷击火灾发生的主要影
响因子.日平均风速和坡向在两种方法里的重要性
图 1摇 环境变量累积正则化增益
Fig. 1 摇 Regularized training gain of the environmental varia鄄
bles.
变量含义请参见表 3 Meaning of each parameter were same as table 3.
下同 The same below.
排名都是最后,表明这 2 个环境变量对森林雷击火
灾发生的影响不大.
2郾 3摇 模型应用与预测精度
闪电数据无法在雷击发生前预测,所以结合闪
电数据的森林雷击火火险预报是在雷击发生后进
行.在雷电定位系统探测到闪电数据后,将所有环境
变量数据以栅格图层的形式输入到 MAXENT 软件
中,软件会自动计算出每个单元网格的概率值,并以
栅格图层的形式输出. 概率值在 0 ~ 1 之间,代表发
生森林雷击火灾的危险程度,被称为火险指数.将火
险指数分成 5 个区间:极低火险(0 ~ 0. 2)、低火险
(0. 2 ~ 0. 4),中等火险(0. 4 ~ 0. 6),高火险(0. 6 ~
0. 8)、极高火险(0. 8 ~ 1). 不同的火险等级用不同
颜色显示,即可得到火险等级图.闪电数据在一天当
中是动态变化的,所以火险等级图也随着闪电数据
的更新而动态更新.由基于 2010 年 9 月 26 号的环境
数据得到的火险等级与真实火灾发生对比图(图3)
图 2摇 基于 Jackknife 法的模型变量重要性评价
Fig. 2 摇 Jackknife estimations of variable importance for the
model.
玉: 不含该变量 Excluding the variable; 域:包含全部变量 All the var鄄
iables; 芋: 只含该变量 Only the variable.
4011 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 25 卷
图 3摇 火险等级与火灾发生
Fig. 3摇 Fire danger class and occurrence of fire.
表 5摇 预测精度评价表
Table 5摇 Estimations of prediction accuracy
验证数据比例
Proportion of test data (% )
AUC 最大 Kappa值
Maximum Kappa
50 0. 837 0. 752
45 0. 844 0. 758
40 0. 851 0. 764
35 0. 858 0. 767
30 0. 866 0. 782
25 0. 875 0. 789
20 0. 883 0. 792
可以发现,该日共发生 7 次森林雷击火灾,且火灾发
生地点的火险等级都是极高火险或者高火险.
模型运行得到 姿 = (0. 023、 - 3. 801、0. 652、
0郾 033、1. 211、0. 152、2. 876、0. 060、0. 937、0. 003).
选取不同的验证数据的比例时,模型的最大 Kappa
值和 AUC值也不同(表 5).随着建模数据比例的增
加,最大 Kappa值和 AUC 值都呈现出增大趋势. 而
且,所有的最大 Kappa 值都在 0. 75 以上,平均值为
0. 772;所有的 AUC 值都在 0. 5 以上,平均值为
0郾 859.两个评价指标都反映出 MAXENT 模型的预
测效果比随机预测的结果好,预测精度达到了中等
准确率.
3摇 讨摇 摇 论
本文利用历史森林雷击火灾数据和影响森林雷
击火灾发生的环境变量数据,分析了 MAXENT 模型
在大兴安岭森林雷击火火险预报中的适用性. 结果
表明,随着建模数据比例的增加,最大 Kappa 值和
AUC值都呈现出增大趋势.这可能是由于本研究的
历史火灾数据量不多,当用于验证的数据比例提高
后,导致建模样本过少所致. 总体上 MAXENT 模型
预测森林雷击火灾的准确率达到了中等精度,模型
评价指标最大 Kappa 值和 AUC 值分别为 0. 772 和
0. 859. Parisien和 Moritz[20]在加利福尼亚州的研究
中,平均 AUC值达到 0. 871,好于本研究结果.在全
美尺度的研究中,平均 AUC 值为 0. 850,与本研究
结果相近. Renard 等[21]在印度 Western Ghats 地区
的研究中,平均 AUC 值达 0. 921,比本研究及 Pa鄄
risien和 Moritz[20]的结果都好,这可能与样本量有
关,Renard等[21]的历史火灾数据达到 7438 个,远高
于本研究的样本量.
在本研究中,最大 Kappa值和 AUC值没有达到
0. 9 以上,这受到多方面的影响. 首先,MAXENT 模
型的应用关键是特征函数的选择. 特征函数代表森
林雷击火灾对环境变量的响应. 本研究选用了
MAXENT软件自带的特征函数,这些特征函数是基
于物种分布与环境变量的关系而得到. 森林雷击火
灾的发生与环境变量之间的关系非常复杂,这些特
征函数并不能完全反映出来. 通过进一步研究环境
变量与森林雷击火灾的关系,得到适用于森林雷击
火灾的特征函数,可能会提高 MAXENT 模型的预测
精度.其次,由于大兴安岭地区在 2005 年才建设了
雷电定位系统,受到历史雷击数据的限制,本研究只
使用了 2005—2010 年共 122 个历史火灾数据.样本
量的限制也影响了模型精度. 随着数据的积累,
MAXENT 模型的预测精度也可以进一步提高. 再
有,气象数据的精度也影响了模型的准确率.研究区
内的气象站点只有 5 个,空间覆盖严重不足.建模使
用的栅格数据是由气象站点数据空间插值得到,插
值的精度受到了气象站点数量的影响.
本研究对拟选用的环境变量进行多重共线性检
验,结果表明,闪电中和电荷量、闪电强度与其他闪
电因子存在共线性关系,其他环境变量不存在明显
的共线性关系.将不存在共线性关系的环境变量用
于建模并进行环境变量重要性评价的结果表明:日
降雨量、云地闪电数量、云地闪回击电流强度是影响
森林雷击火发生最主要的环境影子. 这与雷小丽
等[24]对大兴安岭雷击火与闪电关系的研究结果一
致.雷小丽等[24]研究表明,日尺度的森林雷击火在降
水量>5 mm 时与闪电关系不明显,但当降水量<5 mm
时,雷击火与闪电次数呈正相关.海拔、坡度、坡向 3
个地形因子在环境变量重要性排名中都较靠后,这可
能与环境变量数据的空间尺度有关系.受雷电定位空
间精度的影响,本研究中环境变量栅格数据的空间分
辨率为1 km,这导致1 km范围内的地形差异被平滑,
而 1 km之内的地形通常存在较大差异.
雷击发生后及时评估雷击引发森林火灾的危险
50114 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 孙摇 瑜等: 基于 MAXENT模型的黑龙江大兴安岭森林雷击火火险预测摇 摇 摇 摇 摇 摇
程度具有重要意义.应用本研究的方法,可以根据雷
击发生的情况动态得到森林雷击火险等级图. 林火
管理人员可以根据火险等级的空间分布,有针对性
地配置人力、物力,从而提高林火管理工作的科学性
和工作效率.本研究只使用了黑龙江大兴安岭地区
的历史火灾数据和环境数据来建模,证明 MAXENT
模型可用于黑龙江大兴安岭地区的森林雷击火火险
预报.如将 MAXENT 模型应用于其他地区,需用当
地的数据进行模型适用性的验证.
参考文献
[1]摇 Du C鄄Y (杜春英), Li S (李摇 帅), Liu D (刘摇 丹),
et al. Spatiotemporal distribution of lightning鄄caused for鄄
est fires in Daxing爷anling area. Journal of Natural Dis鄄
asters (自然灾害学报), 2010, 19(3): 74 -78 ( in
Chinese)
[2]摇 Tian X鄄R (田晓瑞), Shu L鄄F (舒立福), Wang M鄄Y
(王明玉), et al. Spatial and temporal distribution of
lightning fire and forecasting model for Daxing爷anling re鄄
gion. Forest Research (林业科学研究), 2009, 22
(1): 18-24 (in Chinese)
[3]摇 Yu J鄄L (于建龙), Liu N鄄A (刘乃安). Lightning
caused wildland fire weather danger rating in Daxing爷an鄄
ling region. Fire Safety Science (火灾科学), 2010, 19
(3): 131-137 (in Chinese)
[4]摇 Guo W (郭摇 文), Yang B鄄C (杨宝成), Sun X鄄Q (孙
学庆) , et al. Research and application on forest fire
risk grade forecast of Daxing爷 anling Mountains in Inner
Mongolia. Meteorology Journal of Inner Mongolia (内蒙
古气象), 2010(3): 5-7 (in Chinese)
[5]摇 Gao Y鄄G (高永刚), Gu H (顾摇 红), Zhang G鄄Y (张
广英). Integrated index study on forest lightning fire for
Daxing爷 anling Mountains. Chinese Agricultural Science
Bulletin (中国农学通报), 2010, 26(6): 87-92 ( in
Chinese)
[6]摇 Miller AJ. Algorithm AS 274: Least squares routines to
supplement those of gentleman. Journal of the Royal
Statistical Society C: Applied Statistics, 1992, 41: 458-
478
[7] 摇 Andserson K. A model to predict lightning鄄caused fire
occurrences. International Journal of Wildland Fire,
2002, 11: 163-172
[8]摇 Vilar L, Nieto H, Martin MP. Integration of lightning鄄
and human鄄caused wildfire occurrence models. Human
and Ecological Risk Assessment, 2010, 16: 340-364
[9]摇 Castedo鄄Dorado F, Rodriguez鄄Perez JR, Marcos鄄Menen鄄
dez JL, et al. Modelling the probability of lightning鄄in鄄
duced forest fire occurrence in the province of Leon
(NW Spain). Forest Systems, 2011, 20: 95-107
[10]摇 Magnussen S, Taylor SW. Prediction of daily lightning鄄
and human鄄caused fires in British Columbia. Interna鄄
tional Journal of Wildland Fire, 2012, 21: 342-356
[11]摇 Krenn R, Hergarten S. Cellular automaton modelling of
lightning鄄induced and man made forest fires. Natural
Hazards and Earth System Sciences, 2009, 9: 1743 -
1748
[12]摇 Dickson BG, Prather JW, Xu YG, et al. Mapping the
probability of large fire occurrence in northern Arizona,
USA. Landscape Ecology, 2006, 21: 747-761
[13]摇 Albert鄄Green A, Dean CB, Martell DL, et al. A metho鄄
dology for investigating trends in changes in the timing
of the fire season with applications to lightning鄄caused
forest fires in Alberta and Ontario, Canada. Canadian
Journal of Forest Reserch, 2013, 43: 39-45
[14]摇 Guo F鄄T (郭福涛), Hu H鄄Q (胡海清), Jin S (金摇
森), et al. Relationship between forest lighting fire oc鄄
currence and weather factors in Daxing爷anling Mountains
based on negative binomial model and zero鄄inflated neg鄄
ative binomial models. Chinese Journal of Plant Ecology
(植物生态学报), 2010, 26(6): 87-92 (in Chinese)
[15]摇 Phillips SJ, Anderson RP, Schapire RE. Maximum en鄄
tropy modeling of species geographic distributions. Eco鄄
logical Modelling, 2006, 190: 231-259
[16]摇 Elith J, Phillips SJ, Hastie T, et al. A statistical expla鄄
nation of MaxEnt for ecologists. Diversity and Distribu鄄
tions, 2011, 17: 43-57
[17]摇 Qi Z鄄X (齐增湘), Xu W鄄H (徐卫华), Xiong X鄄Y
(熊兴耀), et al. Assessment of potential habitat for
Ursus thibetanus in the Qinling Mountains. Biodiversity
Science (生物多样性), 2011, 19(3): 75-84 (in Chi鄄
nese)
[18]摇 Li B鄄N (李白尼), Wei W (魏 摇 武), Ma J (马 摇
骏), et al. Maximum entropy niche鄄based modeling
(Maxent) of potential geographical distributions of fruit
flies Dacus bivittatus, D. ciliates and D. vertebrates. Ac鄄
ta Entomologica Sinica (昆虫学报), 2009, 52(10):
66-75 (in Chinese)
[19]摇 Yang G (杨摇 光), Shu L鄄F (舒立福), Di X鄄Y (邸雪
颖). Change trends of summer fire danger in Great
Xing爷 an Mountains forest region of Heilongjiang Prov鄄
ince, Northeast China under climate change. Chinese
Journal of Applied Ecology (应用生态学报), 2012, 23
(11): 3157-3163 (in Chinese)
[20]摇 Parisien MA, Moritz MA. Environmental controls on the
distribution of wildfire at multiple spatial scales. Ecolo鄄
gical Monographs, 2009, 79: 127-154
[21]摇 Renard Q, P佴lissier R, Ramesh BR, et al. Environ鄄
mental susceptibility model for predicting forest fire
occurrence in the Western Ghats of India. International
Journal of Wildland Fire, 2012, 21: 368-379
[22]摇 Della PS, Della PV, Lafferty J. Inducing features of
random fields. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 1997, 19: 380-393
[23]摇 Wang Y鄄S (王运生), Xie B鄄Y (谢丙炎), Wan F鄄H
(万方浩), et al. Application of ROC curve analysis in
evaluating the performance of alien species爷 potential
distribution models. Biodiversity Science (生物多样
性), 2007, 15(4): 365-372 (in Chinese)
[24]摇 Lei X鄄L (雷小丽), Zhou G鄄S (周广胜), Jia B鄄R (贾
丙瑞), et al. Relationships of forest fire with lightning
in Daxing爷 anling Mountains,Northeast China. Chinese
Journal of Applied Ecology (应用生态学报), 2012, 23
(7): 15-22 (in Chinese)
作者简介摇 孙摇 瑜,男,1988 年生,硕士研究生.主要从事 3S
技术在资源环境中的应用研究. E鄄mail: bjfusunyu@ 163. com
责任编辑摇 杨摇 弘
6011 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 应摇 用摇 生摇 态摇 学摇 报摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 25 卷