全 文 :第 14卷第 2期
2016年 3月
生 物 加 工 过 程
Chinese Journal of Bioprocess Engineering
Vol 14 No 2
Mar 2016
doi:10 3969 / j issn 1672-3678 2016 02 012
收稿日期:2015-03-18
基金项目:国家自然科学基金(31271896、31371776);上海市科委重点支撑项目(13430502400);上海市科委长三角科技联合攻关领域项目
(15395810900)
作者简介:董庆利(1979—),男,山东临沂人,博士,副教授,研究方向:畜产品质量与安全控制,E⁃mail:dongqingli@ 126.com
冷却猪肉阴性样品中气单胞菌概率分布的影响与优选
董庆利1,宋筱瑜2,丁 甜3,刘 箐1
(1. 上海理工大学 医疗器械与食品学院,上海 200093; 2. 国家食品安全风险评估中心,北京 100021;
3. 浙江大学 生物系统工程与食品科学学院,浙江 杭州 310058)
摘 要:探讨不同阴性样品中致病菌污染水平对定量风险评估结果的影响。 以冷却猪肉中气单胞菌定量暴露评估
为例,设定阴性样品中致病菌为零值和最大值(检测限)2 种极端场景,由此预测冷却猪肉中因气单胞菌导致食物
中毒的概率分别为 33 6%和 69 3%,显著高于根据 Jarvis经典公式模拟阴性样品的结果(22 1%,P<0 01)。 同时,
应用赤池信息量准则(AIC)、贝叶斯信息准则(BIC)和卡方检验(X2)等评价参数,对阴性样品污染水平的不同连续
型概率分布进行了比较,表明上述两种极端场景下应用指数分布最优,AIC分别为-41 24和-135 62,低于逻辑、正
态、三角、均匀分布等结果,但与离散型概率分布预测食物中毒概率的差异不显著。 建议今后的微生物定量风险评
估研究中,必须考虑阴性样品中致病菌的存在,并应选择合适的概率分布用以描述阴性样品中致病菌的污染水平。
关键词:阴性样品;气单胞菌;概率分布;风险评估
中图分类号:TS 201 3;TS 251 44 文献标志码:A 文章编号:1672-3678(2016)02-0064-06
Effect and optimization of Aeromonas spp probability distribution in
negative samples of chilled pork
DONG Qingli1,SONG Xiaoyu2,DING Tian3,LIU Qing1
(1 School of Medical Instrument and Food Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China;
2 China National Center for Food Safety Risk Assessment,Beijing 100021,China;
3 College of Biosystems Engineering and Food Science,Zhejiang University,Hangzhou 310058,China)
Abstract:This study was designed to verify the effects of pathogen in the negative samples on quantitative
microbiological risk assessment (QMRA). Previous research on QMRA of Aeromonas spp. in chilled pork
was taken as an example,and two scenarios of Aeromonas spp. in the negative samples,zero and maximum
value (detection limit),respectively,were simulated in quantitative exposure assessment. The predictive
food⁃poison probability of the two scenarios was 33 6% and 69 3%,respectively,and these values were
higher than the previous results of 22 1% based on Jarvis function to estimate the possible pathogen
distribution in negative samples significantly (P<0 01). Moreover,Akaike Information Criterion (AIC),
Bayesian Information Criterion (BIC), X2, and other parameters were applied for evaluating pathogen in
negative sample with different continuous probability distributions. Exponential distribution proved to be
better than Logistic,Normal,Triangle and Uniform with AIC values equaling to - 41 24 and - 135 62
under the two simulated scenarios, respectively, lower than the results of other distributions. In
conclusion,pathogen distribution in negative sample should be noted and further optimized during QMRA
in future.
Keywords:negative sample; Aeromonas spp.; probability distribution; risk assessment
微生物定量风险评估(quantitative microbiologi⁃
cal risk assessment,QMRA)可用于评估特定致病菌
对人群健康 (发病率或爆发率)的定量影响[1]。
QMRA包括 4 个步骤:危害识别、危害特征描述、暴
露评估和风险特征描述。 其中,暴露评估是微生物
定量风险评估的研究核心。 在已完成的定量暴露
评估研究中,冷却猪肉中的气单胞菌[2]、即食凉拌
菜中的单增李斯特菌[3]和蒸煮米饭中的蜡样芽胞
杆菌[4]等样品,受检测方法所限,初始污染水平高
于检测限的样品认定为阳性样品,如冷却猪肉中气
单胞菌为 0 78 lg(CFU / g);相应地,低于此检测限
的认定为阴性样品。 为使 QMRA 研究中的致病菌
初始污染水平更能接近实际,研究中常假定阴性样
品的污染水平分布以 Jarvis 的经典公式推测,并用
反向偏斜累积均匀分布(Uniform)描述阴性样品中
的致病菌浓度[2-4]。 但这种方法和致病菌的实际分
布有较大差距,如冷却猪肉中气单胞菌的阴性结果
得到最小值、平均值和最大值分别为-5 22、-2 22
和 0 78 lg(CFU / g) [2],意为低于检测限的阴性样品
中致病菌实际数量出现概率一致,这与一般微生物
在食品中随机分布的常识不符,因此得到的暴露评
估结果可靠性有待商榷。
提高 QMRA 评估结果可靠性的最根本方法之
一是提高微生物检测方法的精度,由此得到致病菌
的真实分布,作为评估的输入值,得到风险评估结
果为风险管理和交流提供理论基础[5]。 另外,在现
有研究水平上,不同阴性样品分布的假设,必定对
QMRA的结果产生较大影响,量化这种影响有待于
明确。
本研究中,笔者以冷却猪肉中气单胞菌定量评
估为例[2],首先分析不同阴性样品污染水平的假设
(包括为零值和检测限值 2 种极端场景)对定量暴
露评估结果的影响,特别是导致不同的食物中毒概
率比较;分析不同阴性样品污染水平应用不同连续
型概率分布(贝塔、指数、伽马、逻辑和正态等)的差
异,并通过不同评价参数比较确定最优分布,进而
比较离散型和连续型概率分布对致病菌最终污染
水平的差异,由此为今后微生物风险评估研究考虑
阴性样品的定量影响提供理论参考。
1 数据来源与分析方法
1 1 数据来源
本研究引用气单胞菌的相关数据来源于文献
[2]中的定量暴露评估,为某市 2009—2010 年以随
机抽样的方式从超市中采集冷却猪肉共计 100份样
品,按国标法进行检测后的结果,近似认为是冷却
猪肉中气单胞菌的初始污染量。
1 2 场景设定及概率分布模拟
设定以下 5种场景,分别描述如下。
场景 1(S1):冷却猪肉中阴性样品(Ln)的气单
胞菌以 Jarvis 公式分布,即符合累计概率分布
Cumulative ( - 5 22,0 78, { - 5 22, - 2 22,0 78},
{0 01,0 50,0 99}),阳性样品(Lp)分布代表的污
染率(Pp)同文献[2],冷却猪肉的初始污染水平仍
按综合阳性和阴性样品的离散概率分布 Discrete
(Lp:Ln,Pp:(1-Pp))设定。
场景 2(S2):冷却猪肉中全部阴性样品的气单胞
菌设定为 0,初始污染不分阳性和阴性,按离散概率
分布 Discrete (0,4,{0,0 78,1 00,1 33,1 60,1 85,
2 33, 2 41, 2 48, 2 59, 2 71, 3 26, 3 36}, { 0 86,
0 01,0 02,0 01,0 01,0 01,0 02,0 01,0 01,0 01,
0 01,0 01,0 01})设定。 此场景假设低于检测限的
阴性样品中实际没有致病菌的极端情况。
场景 3(S3):冷却猪肉中全部阴性样品的气单
胞菌污染水平设定为 0 78 lg(CFU / g),即最大值或
检测限值,初始污染不分阳性和阴性,按离散概率
分布 Discrete (0,4,{0 78,1 00,1 33,1 60,1 85,
2 33,2 41,2 48,2 59,2 71,3 26,3 36}, { 0 87,
0 02, 0 01, 0 01, 0 01, 0 02, 0 01, 0 01, 0 01,
0 01,0 01,0 01})设定。 此场景假设低于检测限
的阴性样品中实际全部在检测限值的极端情况。
场景 4(S4):对 S2按常见的连续型概率分布函
数分别拟合,如表 1所示。
场景 5(S5):对 S3按常见的连续型概率分布函
数分别拟合,如表 1所示。
进而采用蒙特卡罗(Monte Carlo)模拟方法,运
用@ RISK 6 0 风险评估软件(美国 Palisade 公司)
对上述不同场景的设定参数进行模拟分析,迭代
56 第 2期 董庆利等:冷却猪肉阴性样品中气单胞菌概率分布的影响与优选
10 000次后比较不同气单胞菌最终污染水平对应的
累积概率。 以气单胞菌 5 lg(CFU / g)为导致食物中
毒的风险阈值[2],计算 S1、S2和 S3场景对应的超过
风险阈值的概率。
表 1 常用连续概率分布函数表达式
Table 1 The Selected typical continuous probability distributions
概率分布 参数意义
贝塔分布 Beta(α1, α2) α1和 α2为形状参数
指数分布 Expon(β) β为衰减常量
伽马分布 Gamma(α2, β2) α2和 β2分别为形状参数和尺度参数
逻辑分布 Logistic(α3, β3) α3和 β3分别为位置参数和尺度参数
正态分布 Normal(m1,sd1) m1和 sd1分别为正态分布的平均值和标准差
波特分布 Pert(min1,most1,max1) min1、most1和 max1分别为波特分布的最小值、最可能值和最大值
三角分布 Triang(min2,most2,max2) min2、most2和 max2分别为三角分布的最小值、最可能值和最大值
均匀分布 Uniform(m2,sd2) m2和 sd2分别为均匀分布的平均值和标准差
1 3 概率分布的评价参数
应用@ RISK软件中 RiskFit 函数对 S4 和 S5 场
景按常见概率分布分别拟合,选择 3 个评价参数
如下[5-6]:
赤池信息量准则 AIC= 2k1-2ln L (1)
贝叶斯信息准则 BIC= k2 ln n-2ln L (2)
式中:L是似然函数,k1和 k2分别是拟合的估计参数
数量,n是样本数。
卡方检验 X2 =∑ ki = 1
(Ni - E i) 2
E i
(3)
式中:k为将 x 轴分成数据段的个数,Ni为第 i 个数
据段中观测的样本数,E i为第 i 个数据段中期望的
样本数。
2 结果与讨论
2 1 不同场景的阴性样品污染水平的概率模拟
对设定的 3 种场景 S1、 S2 和 S3 分别通过
@ RISK软件模拟分析,求得最终的气单胞菌菌数
的累积概率分布,结果如图 1 所示。 由计算得知,
S1、S2 和 S3 场景下超过 5 lg(CFU / g)的概率分别
为 22 1%、33 6%和 69 3%,三者之间差异显著
(P<0 01)。 图 1 表明设定的阴性样品中气单胞
菌值越高,越接近检测限(如 S3 将所有阴性样品
设定为 0 78 lg(CFU / g)),估计的超过风险阈值的
概率越高,导致食物中毒的可能性越高,这与预想
一致。
2 2 不同阴性样品概率分布的评价比较
对设定的 2种场景 S4和 S5按照常见的连续型
图 1 阴性样品污染水平对气单胞菌定量
暴露评估的影响
Fig 1 Effects of pathogen distribution in negative sample
on the quantitative exposure assessment of
Aeromonas spp
概率分布函数分别拟合,并通过计算 AIC、BIC 和 X2
等参数进行评价,结果如表 2 所示。 其中 Beta、
Gamma和 Pert分布无法收敛,未列在表 2中。
从表 2可知:对同一场景,AIC和 BIC 的结果非
常相近,两者的理论基础均依赖于贝叶斯分析,是
从贝叶斯先验概率的不同假设得出的 2 种不同形
式,如式(1)和(2)所示。 AIC 和 BIC 都属于“信息
标准”检验,专门设计用于模型选择。 AIC和 BIC实
际值并非代表特定拟合的绝对优度,所以只有比较
才有意义[7]。 而 X2检验在评价方面应用广泛,但较
依赖于选择数据段数目和位置,应用@ RISK软件基
于等概率数据段,即对表 1 中的连续型概率分布拟
合时尝试使每个数据段包含相等的概率量,由此获
得较高的评价依据。
66 生 物 加 工 过 程 第 14卷
表 2 不同阴性样品连续概率分布的评价(S4和 S5)
Table 2 Evaluation of continuous probability distributions in negative sample (S4 and S5)
概率分布
S4 S5
AIC BIC X2 AIC BIC X2
Expon -41 24 -36 16 735 12 -135 62 -130 53 746 34
Logistic 191 41 196 49 735 12 102 65 107 74 746 34
Normal 238 02 243 11 725 66 164 46 169 55 742 16
Triang 149 03 156 60 718 84 89 73 97 30 737 10
Uniform 250 51 255 60 716 86 197 68 202 77 735 34
表 2 结果表明:通过 X2检验的值差别不大,以
均匀分布(Uniform)为最优。 但根据经验可知,微生
物在食品中的污染水平符合均匀分布的可能性较
小,不予考虑。 而 AIC 和 BIC 优选的阴性样品概率
分布都为指数分布(Expon),对应的 S4 和 S5 场景
的气单胞菌概率密度图分别如图 2 和图 3 所示,其
中拟合求出的指数分布中衰减参数(β)分别为 0 29
和 0 18,根据定义[8],S4和 S5场景的气单胞菌菌数
的期望值 E[Nt]分别为 1 / 0 29 和 1 / 0 18,即 3 45
lg(CFU / g)和 5 56 lg(CFU / g)。
图 2 应用 Expon函数拟合 S4场景的气单胞菌概率密度
Fig 2 Aeromonas spp probability density of Scenario 4
fitted by Exponential function
图 3 应用 Expon函数拟合 S5场景的气单胞菌概率密度
Fig 3 Aeromonas spp probability density of Scenario 5
fitted by Exponential function
假设 S4和 S5选择指数分布(Expon)作为气单
胞菌的初始污染水平,与上述的 S2和 S3类似,通过
软件模拟分析,求得最终的气单胞菌菌数超过 5
lg(CFU / g)的概率分别为 32 4%和 59 0%,这分别
与 S2 和 S3 的结果(33 6%和 69 3%)差异不显著
(P>0 05),但与 S1 的结果(22 1%)差异显著(P<
0 01)。 由此可知,致病菌初始污染水平的概率分
布选择离散型(S2和 S3)或者连续型(S4 和 S5),不
是影响定量暴露评估结果的显著因素。
另外,通过安德森 达林(A D)检验按照表 1
列出的概率分布,对 S4和 S5进行评价,结果都分别
为正态分布(Normal)最优;通过 K S 检验为逻辑
分布(Logistic)最优(数据未列出)。 A D 检验和
K S检验最初都是为拟合验证而开发的检验,有观
点认为适合于数据点较多的情况,不可直接作为确
定替代分布的工具[9]。 因此优选概率分布的标准
仍以 AIC和 BIC为准。
2 3 离散分布与连续分布的选择
离散分布和连续分布是概率统计常用的两类
变量分析。 简单地说,符合离散分布的变量可以一
一列举,而符合连续分布的不能一一列举,但变量
充满某一空间。 从已有的 QMRA 研究来看,大多数
设定致病菌符合离散分布,比如世界卫生组织
(WHO)、联合国粮食及农业组织(FAO)完成的不同
食品中沙门菌、单增李斯特菌、阪崎肠杆菌、弧菌、
病毒等的定量风险评估研究[10],主要依据是对致病
菌污染水平采用定量检测方法,如 CFU / mL 或
CFU / g,并假设检测结果是独立和离散的,采用离散
分布更能代表实际污染情况。 但当前有些致病菌
的检测方法采用最大可能数(MPN / g或 MPN / mL),
本身即为概率方法,基于这类方法开展 QMRA 分析
需特别谨慎[11],推荐选用连续分布。
76 第 2期 董庆利等:冷却猪肉阴性样品中气单胞菌概率分布的影响与优选
另外,CFU 和 MPN 是并非可以互相换算的微
生物计数方法,有专门研究二者之间的统计关
系[12],但并非通用于所有的病源性微生物;同时,与
CFU方法原理不同,MPN方法不存在阴性样品的问
题,其原理可参考 Cochan 的经典论述[13]。 本研究
的数据基于 CFU的菌落计数方法,故选用离散分布
对阴性样品中致病菌的数量进行描述( S1、S2 和
S3),同时还利用连续分布对致病菌的数量进行描
述(S4、S5),并探讨了设定不同分布的结果差异,结
果表明离散分布和连续分布计算得到的食物中毒
发病率差异不显著(S2 和 S4 之间、S3 和 S5 之间)。
可能原因是样本数较大(文献[2]中的 100 个),但
是如果样本数过小,比如低于 30 个,仍建议选用离
散分布,更符合实际检测结果。
2 4 评价概率分布的参数选择
不同连续概率分布表达式代表的意义差别较
大(表 1),如何选择适合 QMRA 研究的概率分布对
结果影响较大。 优选可通过专家意见 ( Expert
opinion)、历史经验(Previous experience)或统计分
析(Statistical analysis)而实现[14],本研究主要基于
统计分析的几种评价参数(AIC、BIC 和 X2而选定指
数分布(Expon)模拟致病菌的初始污染水平(图 2
和图 3)。
对概率分布的优选,常用的评价方法包括赤池
信息量准则(AIC)、贝叶斯信息准则(BIC)、卡方检
验(X2)、安德森 达林检验(A D)、科尔莫戈罗夫
斯米尔诺夫检验 ( K S ) 和均方根误差检验
(RMSE)等[15]。 其中 AIC 和 BIC 统计量是利用简
单表达式,使用对数似然函数计算得出的,一般认
为 AIC假设“真”模型不在候选集中,应用均方误差
最小原则,渐进于最优模型,这种假设更符合实际
情况[16],因此首选 AIC 作为判断依据。 另外,卡方
检验也可用于连续型或离散型样本数据的拟合优
度检验,一般通过任意选择数据段进行观测值和期
望值的比较,可通过等概率数据段的方式来消除数
据段选择的任意性(如@ RISK 软件)。 作为类似的
模型“信息标准”检验参数,AIC 和 BIC 结果类似,
AIC 基于渐进最优的假设,而 BIC 不是,按照
Yang[16]的分析,AIC趋向于对强度弱于 BIC 的参数
数量进行惩罚,AIC 更易于使概率分布获得收敛。
而其他几种检验参数(X2、A D和 K S)都为常用
评价方法,各有优缺点,可作为评价概率分布参数
选择的辅助参考。
同时,专家意见和历史经验在选择概率分布也
是非常重要的参考依据,比如 QMRA 研究中常涉及
的冰箱温度、贮藏时间等,多为符合正态分布
(Normal),这些参数可以直接选用合适的概率分布
来描述。
2 5 阴性样品的概率分布对风险评估结果的影响
当前食品风险评估发展迅速,许多学者也质疑
此类研究数据缺乏和假设过多[17]。 解决此类难题
的方法有很多,如前述提高微生物检测精度,如果
能得出微生物的真实污染水平,对风险评估模型的
输出值可靠性会大大提高。 但是,风险评估本身就
是一个概率问题[5],很难真正完全按照定值评价的
模式来实现,而概率模式对食品安全控制和风险管
理更有实际意义(比如本文场景 S1 的最终污染水
平导致食物中毒的概率为 22 1%),已证实比单纯
依靠点估计模式更优[18]。 需要注意的是,用概率方
法进行风险评估,为提高风险特征描述的严谨性,
模型本身的不确定性和变异性需要区别对待[19]。
本研究结果表明不同阴性样品污染水平的假
设对定量暴露评估结果的影响显著,设定为零值的
S2和设定为检测限值的 S3,预测得到的食物中毒概
率分别为 33 6%和 69 3%,如果直接用来作为风险
管理和控制的理论参考,势必严重失实并造成公众
恐慌。 因此考虑阴性样品(低于检测限)的致病菌
分布情况或者改进现在常用的 Jarvis经典公式[2-4],
提高风险评估的科学性和严谨性非常必要。
3 结论
阴性样品分布对微生物定量风险评估结果影
响显著,以冷却猪肉中气单胞菌研究为例,设定阴
性样品全为零值或全为最高值(检测限),由此预测
得到的食物中毒概率显著高于常规的 Jarvis 公式方
法。 再以常用的连续型概率分布拟合上述 2种极端
的场景,通过 AIC、BIC 等评价参数进行比较,表明
指数分布(Expon)作为气单胞菌的初始污染水平最
优。 今后微生物定量风险评估研究不应忽略阴性
样品分布的设定,以此提高风险评估结果的可靠性。
参考文献:
[ 1 ] CAC. Working principles for risk analysis for food safety for
application by governments [ EB / OL ]. [ 2015⁃03⁃18 ] . http: / /
www.codexalimentarius.net / web / more_info.jsp? id_sta = 10751.
[ 2 ] 董庆利,高翠,郑丽敏,等.冷却猪肉中气单胞菌的定量暴露
评估[J] .食品科学,2012,33(15):24⁃27.
86 生 物 加 工 过 程 第 14卷
[ 3 ] 董庆利,郑丽敏.即食凉拌菜中单增李斯特菌的定量暴露评
估[J] .生物加工过程,2013,11(5):55⁃60.
[ 4 ] 董庆利.蒸煮米饭中蜡样芽胞杆菌的定量暴露评估[ J] .食品
科学,2013,34(21):306⁃310.
[ 5 ] DONG Q,BARKER G C,GORRIS L G M,et al.Status and future
of quantitative microbial risk assessment in China [ J] . Trends
Food Sci Technol,2015,42(1):70⁃80.
[ 6 ] 美国 Palisade公司.@ RISK Microsoft Excel 风险分析和模拟
插件用户指南[M].6版.New York:Palisade Corporation,2013.
[ 7 ] FELLER W. An introduction to probability theory and its
applications[M].3rd ed.New York:John Wiley & Sons,Inc.1968.
[ 8 ] KNUTH D E.The art of computer programming,Volume 2:semi⁃
numerical algorithms[M].3rd ed.Boston:Addison⁃Wesley,2009:
133⁃134.
[ 9 ] HASTIE T, TIBSHIRANI R, FRIEDMAN J. The elements of
statistical learning: data mining, inference, and prediction [ M].
New York:Springer⁃Verlag:120⁃127.
[10] WHO / FAO. Risk Analysis [ EB / OL ]. [ 2015⁃03⁃18 ] . http: / /
www.who.int / foodsafety / micro / riskanalysis / en /
[11] POUILLOT R, HOELZER K, CHEN Y, et al. Estimating
probability distributions of bacterial concentrations in food based
on data generated using the most probable number ( MPN)
method for use in risk assessment [ J] . Food Control, 2013, 29
(2):350⁃357.
[12] SARTORY D P,GU H,CHEN C H.Comparison of a novel MPN
method against the yeast extract agar (YEA) pour plate method
for the enumeration of heterotrophic bacteria from drinking water
[J] .Water Res,2008,42(13):3489⁃3497.
[13] COCHRAN W G.Estimation of bacterial densities by means of the
″Most Probable Number″[J] .Biometrics,1950,6(2):105⁃116.
[14] USDA / FSIS / EPA. Microbial risk assessment guideline:
pathogenic organisms with focus on food and water[M].[ s. l.]:
FSIS Publication,2012.
[15] VOSE D.Risk analysis:a quantitative guide[M].3rd ed.London:
John Wiley & Sons,Ltd.,2008.
[16] YANG Y.Can the strengths of AIC and BIC be shared: a conflict
between model identification and regression estimation [ J ] .
Biometrika,2005,92(4):937⁃950.
[17] ROMERO⁃BARRIOS P, HEMPEN M, MESSENS W, et al.
Quantitative microbiological risk assessment ( QMRA) of food⁃
borne zoonoses at the European level[ J] .Food Control,2013,29
(2):343⁃349.
[18] 董庆利,王忻,王海梅,等.冷却猪肉中气单胞菌暴露评估的
不确定性和变异性[J] .食品科学,2014,35(15):101⁃104.
[19] POUILLOT R, CHEN Y, HOELZER K. Modeling number of
bacteria per food unit in comparison to bacterial concentration in
quantitative risk assessment: impact on risk estimates [ J] . Food
Microbiol,2015,45(2):245⁃253.
(责任编辑 管 珺)
96 第 2期 董庆利等:冷却猪肉阴性样品中气单胞菌概率分布的影响与优选