免费文献传递   相关文献

Relationship between forest lighting fire occurrence and weather factors in Daxing’an Mountains based on negative binomial model and zero-inflated negative binomial models

基于负二项和零膨胀负二项回归模型的大兴安岭地区雷击火与气象因素的关系



全 文 :植物生态学报 2010, 34 (5): 571–577 doi: 10.3773/j.issn.1005-264x.2010.05.011
Chinese Journal of Plant Ecology http://www.plant-ecology.com
——————————————————
收稿日期Received: 2009-11-02 接受日期Accepted: 2010-01-13
* 通讯作者Author for correspondence (E-mail: huhq@nefu.edu.cn)
基于负二项和零膨胀负二项回归模型的大兴安岭
地区雷击火与气象因素的关系
郭福涛1 胡海清1* 金 森1 马志海2 张 扬1
1东北林业大学林学院, 哈尔滨 150040; 2美国纽约州立大学环境与林业科学学院, 锡拉丘兹 13210
摘 要 雷击火的发生与气象因子之间存在着密切的关系。该文选用符合大兴安岭地区林火发生数据结构的负二项(negative
binomial, NB)和零膨胀负二项(zero-inflated negative binomial, ZINB)两种模型对大兴安岭林区1980–2005年间雷击火的发生与
气象因素间的关系进行建模分析, 并与以往研究中所使用的最小二乘(OLS)回归方法相对比。使用SAS和R-Project统计软件进
行模型拟合运算, 计算得出模型各参数。结果表明, NB和ZINB模型对数据拟合较好, 模型内各气象因子显著性水平较高, 对
雷击火发生次数均具有较好的预测能力。运用AIC和Vuong等检验方法, 进一步比较了NB和ZINB模型对数据的拟合水平以及
模型预测水平, 结果表明ZINB模型无论在数据拟合还是模型预测上都要优于NB模型。提出了大兴安岭地区林火发生与气象
因子关系的最优模型。
关键词 林火, 负二项模型, 气象因子, 零膨胀负二项模型
Relationship between forest lighting fire occurrence and weather factors in Daxing’an Moun-
tains based on negative binomial model and zero-inflated negative binomial models
GUO Fu-Tao1, HU Hai-Qing1*, JIN Sen1, MA Zhi-Hai2, and ZHANG Yang1
1School of Forestry, Northeast Forestry University, Harbin 150040, China; and 2College of Environmental Science and Forestry, State University of New York,
Syracuse 13210, USA
Abstract
Aims Much research has been carried out on the relationship between forest fire occurrence and weather factors
by use of modeling in recent years. However, the data organization used in past research can not satisfy the re-
quirements of models well. Our aims are to determine the regression model that best fits the forest fire data set
and provides a new model theory for research on forest fire and its influencing factors in order to forecast lighting
fire occurrence.
Methods We used negative binomial (NB) and zero-inflated negative binomial (ZINB) models to describe the
relationship between lighting fire occurrence and weather factors in the Daxing’an Mountains for 1980–2005 us-
ing SAS 9.1 version and R-Project statistic software and comparing results from these models by use of AIC and
Vuong methods.
Important findings Both NB and ZINB models produced results with high significance for each weather factor.
Comparison of the two models according to AIC, Vuong and other methods showed that the fitting ability and
predictive power of ZINB model are better than those of the NB model. The advantage was also found when we
compared the modeling results with Ordinary Least Squares. Then we obtained the best model for the relationship
between lighting fire and weather factors.
Key words forest fire, negative binomial model, weather factor, zero-inflated negative binomial model

雷击火的发生受气候因素影响较大, 其与气候
变化之间的关系是当前国内外学者广泛关注的课
题。应用模型手段分析建模更是研究此问题最常用
的手段。从研究的发展历程上看, 普通最小二乘回
归(ordinary least squares, OLS) (Alan, 1992)是以往
国内外学者普遍采用的研究雷击火发生与气象因
素关系的方法。回归模型体现的是雷击林火的发生
与各气象因子之间的线性关系。但是随着研究的深
572 植物生态学报 Chinese Journal of Plant Ecology 2010, 34 (5): 571–577

www.plant-ecology.com
入, 学者们发现, 由于发生在很多地区的雷击林火
都是处于离散分布, 一般情况下林火都集中在某几
个月份(在我国大兴安岭地区林火的发生一般集中
在6–9月), 因此就雷击火发生数据本身的分布形式
来看, 并不满足普通最小二乘回归模型的应用前
提, 即数据要满足等方差和正态分布。在这种数据
结构下, 应用普通最小二乘回归模型模拟雷击火的
发生与气象因子之间的关系显然并不适宜。近年来
有学者选择Poisson (Jesper & Igor, 2006)和零膨胀
Poisson (zero-inflated poisson, ZIP) (Mullahy, 1986;
Lambert, 1992; van den Broek, 1995)这两个在生物
学和医疗卫生领域应用比较广泛的模型来模拟林
火发生与气象因素的关系(缪柏其等, 2008)。此二者
均适合离散分布的数据, 后者是前者的延伸。这两
个模型在大多数情况下能得到较理想的研究结论。
但是, 随着研究的深入, 有学者发现, 上述两种模
型虽适合对离散数据进行建模分析, 但其应用前提
是要求因变量数据结构中的方差和均值相等, 而在
二者不等时Poisson和零膨胀Poisson回归模型对数
据的拟合效果不太理想(Dean & Lawless, 1989)。本
文统计求得大兴安岭地区雷击火的发生次数即数
据因变量的方差为0.840 4, 大于均值0.231 8, 因此
从数据结构角度看Poisson和零膨胀Poisson回归模
型并非最优选择。鉴于以上原因, 本文选用经济学
和医疗卫生领域使用的负二项回归模型(negative
binomial (NB) model)和零膨胀负二项回归模型
(zero-inflated negative binomial (ZINB) model)来分
析我国大兴安岭地区雷击火的发生与气象因子间
的关系。此二者可以满足因变量数据结构过度离散
的情况。其应用假设为数据方差大于均值, 符合本
文数据结构特点。另外, ZINB模型更是着力解决数
据中“0”现象过多的问题(Hall, 2000; Martin et al.,
2001; Kelvin et al., 2003)。本文应用此二种模型对大
兴安岭地区雷击数据进行了依次模拟, 并对比分析
选取了最佳模型。研究结论对建立科学准确的雷击
火发生预测模型具有重要的理论意义。
1 研究地区概况
研究区位于黑龙江省大兴安岭林区(50°10′–
53°33′ N, 121°12′–127°00′ E), 面积8.35 × 106 hm2。
该区属寒温带季风气候, 年平均气温–2 ℃– 4 ,℃
最低气温–52.3 , ℃ 最高气温39.0 ℃。年降水量350–
500 mm, 降水集中于7–8月。相对湿度70%– 75%,
积雪期长达5个月, 林内雪深30–50 cm。土壤以棕色
针叶林土和暗棕壤为主。全区山势较平缓, 海拔
300–1 400 m, 15°以内的缓坡占80%以上。大兴安岭
林区属寒带针叶林区 , 森林类型主要为杜鹃
(Rhododendron simsii)-落叶松(Larix gmelinii)林、杜
香(Ledumpalnstre)-落叶松林、草类-落叶松林、杜鹃
-樟子松 (Pinus sylvestris)林、白桦 (Betula platy-
phylla)-落叶松林、白桦-杜鹃林、蒙古栎(Quercus
mongolica)-胡枝子(Lespedeza bicolor)、蒙古栎-白桦
林。该区为我国森林火灾高发区, 年平均森林过火
面积居全国之首, 是我国森林火灾危害最严重的地
区。
2 研究方法
2.1 数据来源
从大兴安岭加格达奇防火办公室获得1980–
2005年大兴安岭地区雷击火发生情况的数据(起火
地理坐标、发生时间和过火面积等)。气象数据源于
1980–2005年塔河、漠河、呼玛和加格达奇4个气象
站(国家基本气象站点), 气象站编号分别为50246、
50136、50353和50442。气象数据主要包括月平均
风速(monthly average wind speed, MAWS)、月平均
降水量(monthly average precipitation, MAP)、月平均
温度(monthly average temperature, MAT)、月相对湿
度(monthly relative humidity, MRH)和月平均蒸发量
(monthly average evaporation, MAE)。由于本文中的
气象数据均以月为单位, 为保证林火发生与气象因
素一一对应, 统计林火发生次数时, 以月为计数单
位。本次共统计730个样本, 随机选取其中的584个
样本用于建模, 另外146个样本数据作为预测检验。
由图1可见, 林火发生次数的数据格式不服从正态
分布, 离散程度较大。
2.2 模型数学原理简介
2.2.1 负二项回归(negative binomial, NB)模型方法
负二项分布是一个连续的混合泊松分布, 其允
许泊松均值服从γ分布, 其概率分布表达式为(1):

其中λ = E(Y), τ为模糊参数, 表示过度离散数。Y是
因变量也叫响应变量。Y的方差为λ + λ2/τ。另外当τ
郭福涛等: 基于负二项和零膨胀负二项回归模型的大兴安岭地区雷击火与气象因素的关系 573

doi: 10.3773/j.issn.1005-264x.2010.05.011


图1 雷击火发生次数分布情况。
Fig. 1 Distribution of number of lighting fire occurrence.

趋于无穷大时(没有过度离散)负二项分布接近于泊
松分布。
负二项分布有一个很简单的性质, 即其方差大
于均值。NB模型的表达式和我们相对比较熟悉的泊
松回归模型非常相似, 模型如(2)和(3)所示:
ln (μ) = int ercept + b1 * X1+ b2 * X2+ … + bm Xm (2)
μ = exp (int ercept + b1 * X1+ b2 * X2+ … + bm Xm) (3)
式中, μ是自变量的指数函数, 负二项方差为μ+kμ2,
其中k ≥ 0为离散参数。应用最大似然方法估计离
散参数和回归方程log(μ)中各相关参数(Cameron &
Trivedi, 1998)。
2.2.2 零膨胀负二项回归 (zero-inflated negative
binomial, ZINB)模型方法
零膨胀负二项分布由一个负二项分布和一个
离散零分布组成, 公式如(4)所示:

均值和方差分别为E(Y) = (1–p)λ和var(Y) =
(1–p) λ(1 + pλ + λ/τ)。当τ→∞和p→0时, 分别服从零
膨胀泊松和负二项分布。ZINB模型把p和λ联系起来
成为协变量, 表达式为(5):
ln (λi) = x′i β,

其中xi和zi分别为一定尺度的特征向量, 在此
表示第i个协变量。β和γ为回归方程协相关系数的特
征向量。ZINB对数似然值的计算表达式如下:

式中X = (x1, …, xn)和Z = (z1, …, zn)。
参数估计方法参见Nocedal和Wright (1999)。
2.3 数据处理方法
本文主要采用SAS 9.1和R-project两个统计软
件进行模型的拟合计算, SAS 9.1主要用来拟合NB
模型, 由于SAS 9.1版本不能进行ZINB计算, 因此
选用R-project软件进行计算。
3 结果和分析
3.1 多重共线性检验
本文选取MAWS、MAP、MAT、MRH和MAE
5个主要气象因子来建模并模拟雷击火的发生次
数。为了提高模型模拟的精度, 需尽可能排除彼此
间有较密切线性关系的气象因子, 为此建模前对所
选取的气象因子进行了多重共线性诊断 (multi-
collinearity diagnostics)。依据是变量的方差膨胀因
子(variance inflation factor, VIF)值越大, 说明相关
系数之间的共线性越大, 通常情况下VIF值小于10
表示各变量间没有明显的相关性。由表1可以看出,
各气象因子的VIF值均小于10, 说明它们之间没有
明显共线性, 可同时用于模型拟合。
3.2 NB模型的拟合结果分析
模型模拟的变量选择主要遵循以下3个原则:
1)模型中各变量的显著水平较高; 2)模型整体的
AIC (Akaike Information Criterion)值最小(Akaike,
1974); 3)在满足前两个原则下, 模型中的变量个数
越少越好。本文依据以上原则, 应用NB模型对黑龙
江大兴安岭地区雷击火与气候因子间的关系进行
建模分析, 经过反复的模型筛选, 最后确定了以
MAP、MAT和MRH为变量的模型。表2是NB模型
的二次模型参数检验, 结果显示模型中MAP在0.05
574 植物生态学报 Chinese Journal of Plant Ecology 2010, 34 (5): 571–577

www.plant-ecology.com
表1 多重共线性诊断
Table 1 Multicollinearity diagnostics
气象因子
Weather factor
月平均风速
Monthly average
wind speed (MAWS)
月平均降水
Monthly average
precipitation (MAP)
月平均温度
Monthly average
temperature
(MAT)
月相对湿度
Monthly relative
humidity (MRH)
月平均蒸发量
Monthly average
evaporation (MAE)
方差膨胀因子
Variance inflation factor
1.685 7 2.726 8 5.686 1 2.212 1 4.712 3



表2 负二项回归模型参数检验
Table 2 Parameter estimates of negative binomial model
参数
Parameter
自由度
df
估值
Estimate
标准误差
Standard error
卡方值
Chi-Square 2χ
p
截距 Intercept 1 2.737 9 1.105 4 6.14 0.013 3*
月平均降水 MAP 1 –0.010 1 0.005 1 3.96 0.046 5*
月平均温度 MAT 1 0.224 6 0.030 6 54.03 < 0.000 1***
月相对湿度 MRH 1 –0.090 9 0.020 1 20.41 < 0.000 1***
离差 Dispersion 1 3.029 4 0.743 3 – –
*, p < 0.05; **, p < 0.01; ***, p < 0.001. MAP, MAT, and MRH see Table 1.



表3 广义估计方程参数分析
Table 3 Analysis of generalized estimating equations parameter estimates
参数
Parameter
自由度
df
估值
Estimate
标准误差
Standard error
Z 值
Z value
p
截距 Intercept 1 2.654 4 0.423 6 6.08 < 0.006 1**
月平均降水 MAP 1 –0.014 6 0.010 0 –4.86 < 0.003 1**
月平均温度 MAT 1 0.235 8 0.017 4 5.41 0.000 1***
月相对湿度 MRH 1 –0.067 3 0.004 8 –30.54 < 0.000 1***
*, p < 0.05; **, p < 0.01; ***, p < 0.001. MAP, MAT, and MRH see Table 1.


水平上显著, MAT和MRH两个气象因子均在0.000 1
水平上显著(p < 0.001)。根据参数估计结果, 得到下
列回归方程:

在用于建模的统计数据中, 选用4个气象站的
气象数据, 同时对这4个气象站各自所覆盖面积内
的火灾发生次数进行统计。我们在样本提取过程中
没有考虑相同气象站内提取的林火发生样本和不
同气象站内提取的林火发生样本之间的差异, 而这
种差异又是客观存在的。为了减少林火发生过程中
这种不确定因素或者说削弱某一因子内部的相互
作用, 我们运用广义估计方程(generalized estimat-
ing equations, GEE)模型对NB模型进行再次模拟
计算, 并获得更为合理的NB模型相关系数标准误
差。
表3为GEE估计的方程参数, 健全的标准差用
于调试模型中的异质性, 从而使标准差更加合理。Z
检验结果显示, 截距和MAP在回归方程中显著水平
有所提高, 并在0.05水平下显著, MAT和MRH的显
著性水平变化不明显, 仍表现为0.000 1水平上显著
相关。根据参数估计值得到以下回归方程:

除了知道回归模型中各自变量回归系数水平
显著外, 还需要进一步验证模型的整体模拟情况,
这里我们选取的是全模型(full model)与零模型(null
model)对比方法进行验证。全模型的对数似然值
(log likelihood)为–214.834, 零模型的对数似然值为
–277.414, 根据卡方(Chi-squared)检验公式:
Chi-squared = 2*(log likelihood of full model–
log likelihood of null model) = 2*(–214.834 +
郭福涛等: 基于负二项和零膨胀负二项回归模型的大兴安岭地区雷击火与气象因素的关系 575

doi: 10.3773/j.issn.1005-264x.2010.05.011
277.414) = 125.16。本文我们选取了3个气象因子作
为回归模型中的自变量, 因此自由度为3, 根据卡
方表查询得出p < 0.000 1, 说明NB模型拟合数据的
能力显著强于零模型, 模型有意义。
3.3 ZINB模型的拟合结果分析
表4是ZINB模型的回归参数, 模型参数分为两
部分, 第一部分是模型的点部分估计参数, 包括参
数标准误差、Z检验和显著性水平检验。第二部分
是模型的零膨胀部分, 实际上这是用Logistic模型
来预测模型中大多数因变量为零的情况, 模型参数
与第一部分相同, 包括标准误差、显著性水平等。
经过多次变量迭代以及筛选(原则参见3.2), 最终确
定最优拟合模型。其中参数拟合结果显示, MAT和
MAE在模型第一部分, 即点部分显著性水平高, 而
MRH是影响膨胀部分的主要因子且显著性水平较
高。表4显示ZINB模型内各气象因子均具有很高的
显著性水平, ZINB模型表达式为:
log (λ = E(Y)) = –3.637929 + 0.124678MAT
+ 0.010395MAE

log it(p) = –72.175944 + 0.962976MARH (9)
同样为了检验零膨胀模型整体模拟情况, 看其
整体是否有意义, 我们同样运用全模型与零模型对
比检验法, 方法同上。得出卡方值为165.108, 自由
度为3, 查表得p < 0.000 1。说明模型拟合结果显著,
模型有意义。
3.4 模型预测效果对比
为了比较ZINB模型和NB模型对大兴安岭地区
林火发生与气象因素关系拟合的优度, 我们选用
AIC值对比法和Vuong检验方法两种方法来进行模
型间的比较。AIC的计算公式为AIC = –2 log like-
hood + 2(s), 其中s为模型中随机变量的总数, 本文
选取3个气象因子, 故s = 3。AIC值越小说明模型拟
合程度越好(Akaike, 1974), 经计算, 求得ZINB模型
的AIC值为401.17, NB模型的AIC值为439.66, 说明
前者模拟效果好于后者。
Vuong检验可以用来衡量非嵌套的模型之间的
选择, 也可以用来比较Poisson、ZINB或者ZIP、NB
模型之间的好坏; Vuong检验是用估计的参数对每
一个样本观测的因变量发生的概率做比较得出的,
它是比较能反映模型拟合的好坏的, 因此常用此方
法进行模型评价。另外, Vuong检验的结果是分正负
的, 如果落在下侧拒绝域, 则说明模型2比较好, 落
在上侧拒绝域则是模型1比较好, 如果不能拒绝则
两个模型间的优劣无法判断(Vuong, 1989)。本文的
检验值为–1.5896, p = 0.008 6 < 0.05, 结果也说明
ZINB模型模拟效果优于NB模型。
模型拟合水平检验是验证所建模型适用与否
的最直接方法。即选取一部分未用于建模的数据,
对已经建成的模型进行验证, 并将通过模型求算得
出的雷击火发生次数与实际雷击火发生次数进行
对比, 从而判断模型的拟合准确率。本文随机选取
了总雷击火样本数的20%作为验证样本数据, 对
146个验证样本数据进行模型拟合计算得出各自的
模型预估值, 并与样本的实际值进行比较。根据预
估值分别求出两个模型对大兴安岭地区雷击火的
发生与气象因素关系模拟结果的残差, 并作图分析
比较。图2和图3分别为NB和ZINB模型预测值与实
际值的对比, 图中显示, ZINB模型的模型预测值与
实际火灾发生值比较接近 , 模型估计准确率为
76.38%。图4为NB和ZINB模型的残差对比图, 由图
可以看出, ZINB模型的残差绝对值基本上都小于
NB模型。进一步数量化比较模型预估水平, 本文分
别计算了NB模型和ZINB模型的均方误差MSE
(mean square error), 为1.587 7和0.586 1, 从数值上
比较, ZINB模型要优于NB模型, 这也和前面的模


表4 零膨胀负二项回归模型参数分析
Table 4 Analysis for parameters of zero-inflated negative binomial model
模型类型
Model types
估值
Estimate
标准误差
Standard error
Z 值
Z value
p
截距 Intercept –3.637 9 0.429 3 –8.47 < 0.000 1***
月平均温度 MAT 0.124 6 0.025 3 4.92 < 0.0001***
点模型
Count model
月平均蒸发量 MAE 0.010 4 0.002 8 3.74 0.000 2***
截距 Intercept –72.175 9 25.676 4 –2.810 0.004 9 ** 零膨胀模型
Zero-inflation model 月相对湿度 MRH 0.962 9 0.338 9 2.840 0.004 5 **
*, p < 0.05; **, p < 0.01; ***, p < 0.001. MAE, MAT, and MRH see Table 1.
576 植物生态学报 Chinese Journal of Plant Ecology 2010, 34 (5): 571–577

www.plant-ecology.com



图2 负二项模型预测值与实际值对比。
Fig. 2 Predicted value of negative binomial (NB) model vs.
observed value.





图3 零膨胀负二项模型预测值与实际值对比。
Fig. 3 Predicted value of zero-inflated negative binomial
(ZINB) model vs. observed value.





图4 负二项回归和零膨胀负二项回归模型预测结果的残差
图。
Fig. 4 Residual of predict result between negative binomial
(NB) and zero-inflated negative binomial (ZINB) model.


型拟合检验结果相一致, 说明在拟合大兴安岭林区
林火发生与气象因子关系的问题上, ZINB模型是最
优选择。
4 结论和讨论
选择适合大兴安岭地区雷击火数据结构的模
型可更科学准确地探讨其与气象因素的关系。为预
测预报提供更有利的技术和理论支持。NB模型和
ZINB模型的应用条件符合大兴安岭地区雷击火发
生的数据模式, 因此本文应用此两种模型对我国大
兴安岭地区雷击火的发生与气象因素间的关系进
行了探索性研究。以上两种模型在国内还没有用于
林业领域, 国外在经济学和医疗卫生领域有所应
用,林火发生和影响因素关系的研究上仅检索到个
别报道(Quintanilha & Ho, 2006; Krawchuk et al.,
2009)。本文研究结果显示NB和ZINB模型在模拟大
兴安岭地区雷击火的发生与气象因素间的关系上
效果很好, 都得到了与检验样本较为接近的结果,
具有较好的预测能力, 同时模型内各气象因子显著
性水平较高。研究得到大兴安岭林火发生次数预报
模型分别为


ln (λ = E(Y)) = –3.6379 + 0.1247MAT + 0.0104MAE
log it(p) = –72.1759 + 0.9629MRH
NB模型表明MAP、MAT和MRH是影响雷击火
发生的3个重要气象因子, 其中MAP和MRH与雷击
火的发生成负相关, MAT与雷击火发生成正相关。
ZINB模型由点模型和零膨胀模型两部分结合而成,
模型显示, MAT和MAE对雷击火发生次数的多少
有着显著的影响, 而MRH是决定雷击火是否能够
发生的关键因素。运用AIC和Vuong等检验方法, 进
一步比较NB和ZINB模型对数据的拟合水平以及模
型预测水平, 结果表明ZINB模型无论在数据拟合
还是模型预测上都要优于NB回归模型。此外为了证
明此两种模型确实明显优于传统的OLS模型, 本文
也对OLS模型进行了拟合求算 , 求算结果显示 ,
MAWS、MAP、MAT和MRH各气象因子的显著水
平均不高, 只有MAE在0.001水平上显著。另外 R2
= 0.258 6, 说明模型整体拟合程度比较低。因此, 运
用OLS回归模型模拟大兴安岭地区林火发生与气象
因子间的关系是不合适的。
本文运用模型对大兴安岭地区近30年的雷击
火数据和气象数据进行拟合, 结果得到了一个广义
郭福涛等: 基于负二项和零膨胀负二项回归模型的大兴安岭地区雷击火与气象因素的关系 577

doi: 10.3773/j.issn.1005-264x.2010.05.011
(global)模型, 即整个大兴安岭地区的雷击火发生预
测模型。但是由于大兴安岭地区面积较大, 植被类
型分布种类多样, 各区域地质土壤条件也不相同,
因此一个反映整个区域的预测模型在局部地区的
应用上还存在一定缺陷。此外雷击火的发生不仅受
气象因素影响, 雷击次数、林型、坡度坡向等因素
也对雷击火的发生产生影响, 因此单考虑气象因
素, 在预测效果和精确度上会受到相应的影响,要
弥补这一不足,还需充分考虑各空间的影响因素,
并建立空间区域模型(local spatial model), 进而提
高模型的广泛适用性和预测的准确性, 这也是继续
研究的方向。
致谢 国家科技支撑计划(2008BAD95B10)、林业
公益性行业科研专项(200804002)、黑龙江省科技计
划(GA09B201-06)资助项目。在本研究模型理论应
用与建模分析过程中得到了纽约州立大学环境与
林业科学学院张连军教授的指导, 在此深表感谢。
参考文献
Akaike H (1974). A new look at the statistical model
identification. IEEE Transactions on Automatic Control,
19, 716–723.
Cameron AC, Trivedi PK (1998). Regression Analysis of Count
Data. Cambridge University Press, Cambridge, UK.
Dean CB, Lawless JF (1989). Tests for detecting
over-dispersion in Poisson regression models. Journal of
the American Statistical Association, 84, 467–472.
Hall DB (2000). Zero-inflated Poisson and binomial regression
with random effects: a case study. Biometrics, 56,
1030–1039.
Jesper R, Igor R (2006). A note on estimation of intensities of
fire ignitions with incomplete data. Fire Safety Journal,
41, 399–405.
Kelvin KW, Wang YK, Lee AH (2003). Zero-inflated negative
binomial mixed regression modeling of over-dispersed
count data with extra zeros. Biometrical Journal, 45,
437–452.
Krawchuk MA, Cumming SG, Flannigan MD (2009). Pre-
dicted changes in fire weather suggest increases in light-
ning fire initiation and future area burned in the mixed-
wood boreal forest. Climatic Change, 92, 83–97.
Lambert D (1992). Zero-inflated Poisson regression with an
application to defects in manufacturing. Technometrics,
34, 1–14.
Martin R, John H, Clarice GB (2001). A score test for testing a
zero-inflated poisson regression model against zero-
inflated negative binomial alternatives, Biometrics, 57,
219–223.
Miao BQ (缪柏其), Wei J (韦剑), Song WG (宋卫国), Tan CC
(谭常春) (2008). Logistic and ZIP regression model for
forest fire data. Fire Safety Science (火灾科学), 17,
143–149. (in Chinese with English abstract)
Miller AJ (1992). Algorithm AS 274: Least squares routines to
supplement those of gentleman. Journal of the Royal
Statistical Society, Series C (Applied Statistics), 41, 458–
478.
Mullahy J (1986). Specification and testing of some modified
count data models. Journal of Econometrics, 33, 341–365.
Nocedal J, Wright S (1999). Numerical Optimization.
Springer-Verlag. USA.
Quintanilha JA, Ho LL (2006). Analyzing wildfire threat
counts using a negative binomial regression model. Envi-
ronmetrics, 17, 529–538.
van den Broek J (1995). A score test for zero zero-inflation in a
Poisson distribution. Biometrics, 51, 738–743.
Vuong QH (1989). Likelihood ratio tests for model selection
and non-nested hypotheses. Econometrica, 57, 307–333.


责任编委: 周广胜 实习编辑: 黄祥忠