免费文献传递   相关文献

基于Logistic回归的中国牛蒡子资源分布



全 文 :15
第 1 2 卷 第 2 期
2010 年 2 月
辽 宁 中 医 药 大 学 学 报
JOURNAL OF LIAONING UNIVERSITY OF TCM
Vol. 12 No. 2
Feb . ,2010
中药是中华文明的瑰宝 , 华夏民族经过数千年
的不断探索和积累 , 形成了博大精深的中医药理论
体系 , 为人类健康做出了巨大贡献。然而 , 随着人
类需求的不断增加 , 以及不合理和过度开发利用 ,
中药资源与其它生物资源一样 , 面临着前所未有的
生态危机 , 如资源数量骤减、质量明显下降、生态环
境严重破坏、物种濒危灭绝。加之长期重利用研究、
轻保护研究 , 重应用研究、轻基础研究 , 重生产投
入、轻保护投入等一系列问题 , 导致中药资源的生
物多样性遭受严重威胁。据有关专家估计 , 目前世
界已认知的药用植物总数的 20% 正处于濒危和灭
绝状态 , 其中许多属于中药资源 , 这给我国中医药
业带来了不良的国际影响 [1]。过度的采挖和保护措
施的缺乏,是导致大多数药材的野生资源严重匮乏
的主要原因,对中药资源的分布与区划进行研究是
保护的重要内容和前提,也是新兴的中药资源生态
学的重要内容 [2-3]。
牛蒡子为两年生菊科植物牛蒡(Arctium lappa
L.)的干燥成熟果实,又名大力子。其种子和根均可
入药,也可食用。牛蒡在全国各地均有分布,多生于
山野路旁、沟边、荒地、山坡向阳草地、林边和村镇附
近。牛蒡子收载于历版《中华人民共和国药典》,以
辽宁为主东北产者为关大力,以浙江为主华东产者
为杜大力,以四川为主西南产者为川大力,以湖北为
主华中产者为泽大力。有关牛蒡子的道地药材产区
目前存在争议,牛蒡子过去认为以浙江一带所产的
为好,目前牛蒡子被认为是关药,以东北产地为佳[4]。
科学研究牛蒡子资源的分布,对牛蒡的引种栽培和
资源保护具有重要的实践指导意义。
Logistic 回 归 方 法 在 自 然 科 学 和 工 程 科 学 方
面具有广泛的应用,如:滑坡敏感性分析 [5-6];生物
资源分布研究 [7];疾病和害虫分布研究 [8-9];城市
扩展及驱动力分析等 [10-11]。以上的研究结果表明
Logistic 回归方法对于资源分布研究有着较好的结
果和预测精度。本研究基于实地采样数据和地理信
息系统技术,应用 Logistic 回归对牛蒡子分布与生态
因子的关系进行了分析,探讨牛蒡子资源在中国的
分布情况。
1 材料和方法
1.1 野外调查和采样方法
2007 年 9 月 15 日—10 月 15 日期间,采用随机取
样的方法,对牛蒡子进行了采集,样方大小为 2m×
基于Logistic回归的中国牛蒡子资源分布
刘 淼 1,常 禹 1,胡远满 1,陈宏伟 1,窦德强 2,康廷国 2,许 亮 2
(1.中国科学院沈阳应用生态研究所,辽宁 沈阳 110016;2.辽宁中医药大学,辽宁 沈阳 110032)
摘 要:本研究运用Logistic回归统计方法在地理信息系统技术支持下来确定影响牛蒡子分布各生态因子,建
立牛蒡子的Logistic模型,预测了牛蒡子资源在我国分布情况。结果表明:(1)Logistic回归建立的模型满足统计学
检验,能够有效对牛蒡子的资源分布进行有效预测。(2)预测结果为牛蒡子资源分布沿西南-东北方向呈现条带状
分布,主要分布在东北、华北和西南地区。(3)部分区域与药典记载不一致,其原因可能为人为干扰和气候变化。
关键词:牛蒡子; Logistic回归; 地理信息系统; 资源分布
中图分类号:R195.1 文献标识码:A 文章编号:1673-842X (2010) 02- 0015- 04
收稿日期:2009-08-19
基金项目:国家科技支撑项目(2006BAI09B02-6);国家自然科学基金项目(40801069)
作者简介:刘淼(1979-),男,辽宁沈阳人,助理研究员,研究方向:景观生态学和 3S 技术应用。
通讯作者:常禹(1965-),男,内蒙古察右前旗人,研究员,博士,主要从事景观生态学、地理信息系统和遥感应用、干扰生态学研究。E-mail:
Changyu@iae.ac.cn。
Chinese Burdock Resources Distribution Based on Logistic Regression
LIU Miao1, CHANG Yu1, HU Yuan-man1, CHEN Hong-wei1, DOU De-qiang2, KANG Ting-guo2, XU Liang2
(1.Shenyang Institute of Applied Ecology, Chinese Academy of
Sciences, Shengyang 110016, Liaoning, China;
2. Liaoning University of Traditional Chinese Medicine, Shengyang 110032, Liaoning, China)
Abstract:This article analyzed the ecological effect factors of burdock based on logistic regression
approach and GIS, built logistic regression model, predicted the burdock resources distribution in China.
The results showed that (1) The logistic model passed the statistic test. The model can predict the burdock
resources distribution effectively. (2) The predicted results showed that burdock resources distribute from
southwest to northeast. Northeast, north and southwest are main distribution areas. (3) The predicted results
are different with harmacopoeia in some areas. The reason may be the human disturbance and climate change.
Key words:burdock; logistic regression; GIS; resources distribution
· 基金项目纵览 ·
DOI:10.13194/j.jlunivtcm.2010.02.17.lium.066
16
辽 宁 中 医 药 大 学 学 报 1 2 卷
2m。在样方内及其周围附近采集成熟的果实(至少
500g)、选取 30 株牛蒡的叶,共采集到 51 个样点。样
点分布于黑龙江(7 个)、吉林(11 个)、辽宁(12 个)、
河北(1 个)、河南(2 个)、山东(1 个)、陕西(3 个)、甘
肃(5 个)、四川(2 个)、浙江(3 个)、湖北(3 个)和江
苏(1 个)共 12 个省。
1.2 生态因子选取
生态因子包括:(1)地形因子:包括 1:100 万中
国数字高程图(DEM),分辨率为 1km;由数字高程
图生成坡度图和坡向图;由数字高程数据基于地理
信息系统得到,分辨率为 1km。
为了更好地评估生态地理分布,引入了等效纬
度概念。等效纬度反映了地表潜在直接太阳辐射的
差异,在研究冻土的分布中有过成功的应用案例[12]。
等效纬度由实际纬度、坡向和坡度计算而来,具体公
式为:
φel = arcsin (sink cosh cosφal + cosk sinφal) 公式 1
其 中,φel 为 等 效 纬 度(rad);k 为 地 表 坡 度
(rad);h 为地表坡向 (rad);φal 为实际纬度 (rad)。
(2)气候因子:包括年均温、1 月最低温、7 月最
高温、平均降水量。气候因子数据为 1971— 2000
年平均值,来源于中国自然资源数据库,分辨率为
1km。
(3)土壤因子:土壤因子中,选取了 1:100 万的
土壤沙粒、粉沙含量、土层厚度和土壤有机质,分辨
率为 2km,数据来源于中国科学院南京土壤研究所。
1.3 Logistic回归
Logistic 回归模型是对二分类因变量(即 y=0 或
y=1)进行回归分析时最为普遍应用的多元量化分
析方法。它在过去的研究中广泛应用于社会科学研
究中,近几年开始被引入到自然科学研究。其函数
形式为:
i,nni,22i,11
i
i
X.....XX)
P1
P
(Log ββββ ++++=− 0 公式 2
式中 Pi 为事件发生的概率,在本研究中表示每
个栅格可能出现耕地的概率 , 其值在 0 和 1 之间;X
表示各候选因素;1-Pi 为事件不发生的概率,Pi/(1-
Pi) 为事件发生比(Y)。Logistic 函数是一个累积分
布函数,具有 S 型增长曲线,自变量在不同的区间发
生变化时,对应的 P 值增长是不同的:当自变量极大
或极小时,对 P 的影响较小;当自变量居中时,对 P
的影响较大。这种非线性的函数能够很好地拟合社
会或自然中的许多实际情况。
Logistic 回归模型系数被解释为对应自变量一
个单位的变化所导致的量上的变化。Logistic 回归
模型的系数如果是正值且统计显著,意味着在控制
其他自变量的条件下,对数发生比随对应自变量值
增加而增加。相反,一个显著的负系数代表对数
发生比随对应自变量增加而减少。如果系数的统
计性不显著,说明对应自变量的作用在统计上与
0 无差异。由于 Logistic 回归的因变量不是常规变
量,而是 logit{ 即对数发生比 ln[P/(1-P)]},那么对应
每个自变量的估计系数便是该自变量对 logit 的作
用。尽管这种解释直截了当,但是其实十分含糊,因
为 logit 或对数发生比没有直接含义。通常,较方便
的方法是将 logit 进行转换后再进行解释,而不是直
接解释系数本身,最常用的方法是取自然指数。那
么,Logistic 回归模型系数变成了 eβ,称为发生比率
(Odds Rate)。由公式 2 变换可知,发生比率为事件
发生的频数与不发生的频数之比。当发生比率大于
1 时,自变量每增加一个单位值时,发生比会相应增
加;当发生比率小于 1 时,自变量每增加一个单位值
时,发生比会相应减小;当发生比等于 1 时,自变量
无论如何变化,发生比不会发生改变,即对因变量没
有影响。
1.4 模型评价
评价所组建的 Logistic 模型主要从 3 个方面进
行 :
(1)拟 合 优 度 ( Goodness of fit):即 模 型 预 测
值与实际观测值之间的差别,指标包括皮尔逊 Χ2
(Pearson Χ2) 、偏差 (Deviance ) 、Hosmer Lemeshow 检
验指标和信息测度指标 ( Information measures) 。本
研究采用 Hosmer and Lemeshow 检验指标进行评价。
该种检验方法根据预测概率值将数据分成大致相同
规模的 10 个组,而不管模型中有多少协变类型。将
观测数据按其预测概率做升序排列。通过皮尔逊
Χ2 来概括这些分组中事件结果的观测数和预测数,
Χ2 检验不显著表示模型拟合数据较好,相反,Χ2 检
验显著表示模型拟合不好。
(2)预测准确性 (Predictive accuracy): 本研究采
用预测概率与观测值间的关联法评价所建 Logistic
模型的预测准确性。如果一个模型中 4 个序次相关
指标 (Somers`D、Gamma、Tau-a 和 C) 的值较高 , 表明
其有较强的预测能力,即预测概率与观测反应变量
之间的关联较为紧密。反之,序次相关指标较低 ,
说明模型的预测能力较差 [9, 13]。
(3)模型预测能力评价:采用Pontius等人提出
ROC(Relative Operating Characteristics)方法进行检验,
当ROC值大于0.75时可以认为所确定的生态因子具
有较好的解释能力,模型具有较好的预测能力 [14]。
2 结 果
2.1 Logistic回归结果
应用采样点数据,在 GIS 软件 ARCGIS9.0 的扩
展模块 Spatial analysis 支持下提取各采样点对应的
生态因子,生成统计表。应用统计软件 SAS 进行二
元 Logistic 回 归,方 法 采 用 正 向 逐 步 选 择 ( forward
stepwise) 方法,结果如表 1。Logistic 回归模型的系
数的符号表明自变量对因变量影响的方向;系数数
值大小表明对因变量影响的程度,发生比率数值与
1 差距越大表明影响越大。
Logistic 回归系数无异常大或小的数值,发生比
率均与 1 接近,表明不存在一种或几种生态因子对
牛蒡子的分布起到决定性影响作用,同时也说明牛
蒡子为广布种。在各生态因子中坡度、等效纬度、1
月最低温、粉沙含量和土壤沙粒对牛蒡分布存在正
相关,表明其对牛蒡子的分布存在着正向影响。有
机质含量存在比较明显的负相关,这是因为采的样
品为野生样品,而农田和林地有机质含量较高区域
非牛蒡子的适宜生态环境,农民通常将其视为杂草
予以铲除。
2.2 模型检验
2.2.1 拟合优度 Hosmer and Lemeshow 检验指标
17
1 2 卷 辽 宁 中 医 药 大 学 学 报
结果可看出 ( 表 2), 其指标值为 1.5923, 统计不显著
(P=0.9911), 因而不能拒绝关于模型拟合数据很好的
假设 , 即模型能很好地拟合了数据。
表 1 Logistic 回归结果
项目 参数β
发生比率
Odds rate
显著性
Sig.
高程 -0.0134 0.9866 0.0061
坡度 0.1158 1.1228 0.0054
坡向 0.0037 1.0037 0.0468
等效纬度 0.1895 1.20865 0.0025
平均温度 -0.0992 0.9056 0.0421
7 月最高温 -0.3367 0.7142 0.0100
1 月最低温 0.1185 1.1258 0.0321
平均降雨量 -0.0151 0.9850 0.0409
粉沙含量 0.2111 1.2351 0.0113
土壤沙粒 0.1190 1.1263 0.0441
土层厚度 -0.0072 0.9928 0.0067
土壤有机质 -0.4534 0.6355 0.0246
常量 128.0907 0.0150
表 2 Logistic 模型的 Hosmer and Lemeshow 检验指标
组别 log = 0 log = 1 总计Observed Expected Observed Expected
1 9 8.9999 0 0.0001 9
2 9 8.9971 0 0.0029 9
3 9 8.9418 0 0.0582 9
4 7 7.8893 2 1.1107 9
5 5 4.2053 4 4.7947 9
6 1 0.6887 8 8.3113 9
7 0 0.2292 9 8.7708 9
8 0 0.0426 9 8.9574 9
9 0 0.0061 9 8.9939 9
10 0 0.0002 6 5.9998 6
  Chi-square df Sig.    
  1.5923 8 0.9911    
2.2.2 预 测 准 确 性  准 确 性 指 标 计 算 结 果 为
Somers`D=0.6431,Gamma=0.6630,Tau-a=0.2748,
C=0.7492,由此可以判断所建立的预测模型具有较
好的准确性。
2.2.3 模型预测能力 Logistic 回归模型驱动力因
子均显著(95% 置信区间),可以用来解释自变量对
因变量的影响。ROC 值为 0.8635,大于 0.75,表明结
果可以接受。
2.3 牛蒡子分布预测
应 用 Logistic 回 归 结 果,基 于 生 态 影 响 子 图,
在 ARCIGS9.0 的支持下对牛蒡子的分布进行预测。
Logistic 回归预测的结果图为 0~1 的概率分布图,取
概率 >0.85 为适宜分布区。
牛蒡子资源分布区沿西南至东北方向呈现条
带状分布,主要分布在东北、华北和西南地区。其结
果与《中华人民共和国药典》中记载的产区(辽宁、
浙江、四川、湖北)基本相近。但是,笔者的研究结
果与药典记载也存在差异,华北(包括北京、天津、
河北、山西、内蒙古东部)和西北(宁夏南部、青海、
陕西、甘肃)也是牛蒡子的集中分布区;原来以浙江
为主的华东产区,但现在几乎没有分布,而是以山东
为主;东北地区的辽宁、吉林和黑龙江也是牛蒡子
的主产区;西南地区牛蒡子的产区除了四川和重庆
外,还包括云南西部部分区域;在华南和华中地区
的分布较少。
3 讨 论
3.1 采样中存在的问题
野外采样工作集中于 2007 年 9 月 15 日— 10 月
15 日期间,样点分布于 12 个省,其布设主要依据为
《中华人民共和国药典》的记载,在采样过程中发现
许多药典记载的产品现在已很难发现牛蒡子,咨询
当地农民也未有发现。四川成都、重庆、湖北和浙江
都存在这种情况,其原因为当地土地利用开发程序
很高,农民视牛蒡子为有害植物予以铲除,特别是由
于除草剂的使用使牛蒡子在这些地区消失,目前在
这些地区很难发现野生的牛蒡子。同时由于工作量
巨大,在采样过程中也可能存在漏采的可能性。
3.2 牛蒡子的适宜产区问题
据《中华人民共和国药典》记载,牛蒡子在全国
的分布以辽宁、浙江、四川和湖北为主。笔者的研究
结果与药典记载存在差异,华北(包括北京、天津、河
北、山西、内蒙古)和西北(宁夏、新疆、陕西、甘肃)
也是牛蒡子的集中分布区;原来以浙江为主的华东
产区,现在以山东为主;东北地区的吉林和黑龙江
也是牛蒡子的主产区;西南地区牛蒡子的产区除了
四川和重庆外,还包括云南;在华南和华中地区的
没有分布。根据采样实地调查和实地走访当地居民,
造成不一致或产地变化的原因最为可能的原因是人
为干扰,如:人为拔除、除草剂的大量使用等。同时,
气候变化也可能影响因素,如原来以浙江为主的华
东产区,现在以山东为主,但气候变化的影响还有待
于进一步验证。
3.3 误差分析
研究中采用的空间数据精度为 1km, 而牛蒡子
主要生长在河流和道路的两旁,极少存在连续大面
各分布,因此,牛蒡子的真实的分布面积可能比本研
究的结果要小,要想解决这一问题,需要更精确的空
间数据的支持。
由于时间和经济的问题,采样时不可能全国所
有省市都进行采样,所以得到的结果可能会在少数
地区存在不准确的现象。
3.4 方法讨论
本研究结果表明 Logistic 回归能够有效且准确
地模拟和预测中药材在我国的分布情况,其预测结
果能够通过精度检验。表明将 Logistic 回归和 GIS
技术引入到中药材资源分布研究中对其研究进展有
一定的推动作用。◆
参考文献
[ 1 ] 陈士林 , 肖培根 . 中药资源可持续利用导论 [ M ] . 北京 : 中国
医药科技出版社 , 2006.
[ 2 ] 王新生 . 中药资源学研究进展 [ J ] . 资源保护与综合利用 ,
1994 ( 4 ):27-29.
[ 3 ] 杨利民 . 中药资源生态学及其科学问题 [ J ] . 吉林农业大学学
报 , 2008, 30 ( 4 ):506-510.
[ 4 ] 胡世林 . 中国道地药材 [ M ] . 哈尔滨:黑龙江科学技术出版
社 , 1989.
[ 5 ] Chen ZH, Wang JF. Landslide hazard mapping using logistic
regression model in Mackenzie Valley, Canada[ J ] .Natural
Hazards, 2007, 42: 75-89.
[ 6 ] 李雪平 , 唐辉明 , 陈实 . 基于 GIS 的 Logistic 回归在区域滑坡空
间预测中的应用 [ J ] . 公路交通科技 , 2005, 22 ( 6 ):350-353.
[ 7 ] Flantua SGA, Boxel JH, Hooghiemstra H, et al. Application of GIS
18
第 1 2 卷 第 2 期
2010 年 2 月
辽 宁 中 医 药 大 学 学 报
JOURNAL OF LIAONING UNIVERSITY OF TCM
Vol. 12 No. 2
Feb .,2010
and logistic regression to fossil pollen data in modelling present
and past spatial distribution of the Colombian savanna[ J ] .Climate
Dynamics, 2007, 29:697-712.
[ 8 ] Matthews AG, Finkelstein DM, Betensky RA. Multivariate logistic
regression for familial aggregation in age at disease onset [ J ] .Life-
time Data Analysis, 2005, 13:191-209.
[ 9 ] 季 荣 , 高 增 祥 , 谢 宝 瑜 , 等 . 沿 海 蝗 区 东 亚 飞 蝗 ( Locusta
migratoria manilensis) 产卵场所选择的 Logistic 回归模型 [ J ] .
生态学报 , 2007,27 ( 12 ):304-313.
[ 10 ] 姜文亮,张晓通,李霖,等 . 基于 GIS 和空间逻辑回归模型的
城市空间扩展预测——以深圳市龙岗区为例 [ J ] . 测绘科学 ,
2008, 33 ( 4 ):370-372.
[ 11 ] 刘淼,胡远满,常禹,等 . 岷江上游汶川县耕地景观变化及空
间驱动力研究 [ J ] . 应用生态学报 , 2007, 18 ( 3 ):569-574.
[ 12 ] Yoshikawa K, Hinzman LD, Gogineni P. Ground Temperature
and Permafrost Mapping Using an Equivalent Latitude/ Elevation
Model[ J ] .Journal of Glaciology and Geocryology, 2002, 24
( 5 ):526-531.
[ 13 ] 王济川 , 郭志刚 . Logistic 回归模型:方法与应用 [ M ] . 北京:
科学出版社 , 2001.
[ 14 ] Pontius GR, Laura C. Land-cover change model validation
by an ROC method for the Ipswich watershed, Massachusetts,
USA[ J ] .2001, Agriculture, Ecosystem and Environment, 85
( 2 ):239-248.
苦参素注射液是以氧化苦参碱为原料 , 经配制
消毒等生产工序而制得的 , 对肿瘤放疗引起的白细
胞低下及乙肝具有治疗作用。注射剂中的热原主要
是细菌内毒素,为革兰阴性菌外壁层的脂多糖物质,
此类物质具有耐热性和化学稳定性,不易被去除。
目前注射剂生产常用活性炭吸附法除热原 , 去
除效率并不能保证 , 且存在有效成分被吸附损失的
问题。超滤法是一种较理想的除热原方法 , 已有文
献报道 [1-2] 超滤技术可有效去除细菌内毒素。对苦
参素注射液细菌内毒素检查方法已有研究,但未曾
报道过通过超滤技术去除苦参素注射液中细菌内毒
素。
本研究参照 2005 年版《中华人民共和国药典》
二部 [3] 中细菌内毒素检查法中的动态浊度法定量检
测自制苦参素注射液经截留分子量为 10kDa 超滤膜
超滤前后细菌内毒素的含量,以此评价超滤技术去
除苦参素注射液中细菌内毒素的效果。
1 仪器与试药
1.1 仪器
超 滤 设 备:板 框 超 滤 膜(PS,截 留 分 子 量
MWCO=10KDa 大 连 屹 东 膜 工 程 设 备 有 限 公 司),
Millipore 蠕 动 泵,Millipore 板 框(平 板 式)超 滤 器
(Waters 公 司)。BET-16M 细 菌 内 毒 素 测 定 仪 ( 天
津市天大天发科技有限公司 ),蜗旋混合仪 ( 天津市
超滤技术去除苦参素注射液的细菌内毒素
宫凯敏,李红阳,尹 楠,彭国平,李存玉
(南京中医药大学药学院,江苏 南京 210046)
收稿日期:2009-08-19
基金项目:国家科技支撑计划课题(2006BAI06A04)
作者简介:宫凯敏(1985-),男,山西忻州人,硕士,主要从事中药化学产物的研究。
通讯作者:彭国平,男,博士生导师。E-mail:guopingpeng@sohu.com。
摘 要:目的:考察超滤技术去除苦参素注射液中细菌内毒素的效果。方法:采用 10KDa 截留分子量超滤膜
对苦参素注射液进行超滤,以动态浊度法定量检测超滤前后苦参素注射液中细菌内毒素的含量。结果:样液超滤前
细菌内毒素为 8.0540EU/mL,超滤后为 0.3024EU/mL,内毒素去除率为 96.24%,其有效成分氧化苦参碱的透过率为
96%。结论:超滤技术可以很好的去除苦参素注射液中细菌内毒素,有效成分损失少,可提高其用药安全性。
关键词:超滤;苦参素注射液;细菌内毒素
中图分类号:R2-03 文献标识码:A 文章编号:1673-842X (2010) 02- 0018- 02
Elimination of Bacterial Endotoxins in Kushensu Injection by Ultrafiltration Device
GONG Kai-min,LI Hong-yang,YIN Nan, PENG Guo-ping,LI Cun-yu
(College of Pharmacy,Nanjing University of Chinese Medicine,Nanjing 210046,Jiangsu,China)
Abstract:Objective:To studies the elimination effect of bacterial endotoxins in Kushensu injection by
ultrafiltration device. Method:Kushensu injection was ultrafiltrated with molecular weight cut-off (MWCO)
10k ultrafitration membrane. The kinetic-turbidimetric method was used to determine the content of bacterial
endotoxins in Kushensu injection before and after using the ultrafiltration. Result:The content of bacterial
endotoxins was 8.0540EU/mL before ultrafitration, and 0.3024EU/mL after ultrafitration.The elimination
efficiency of bacterial endotoxins was 96.24%, the transmittance of effective constituent of Oxymatrine was
96%. Conclusion:Bacterial endotoxins in Kushensu injection can be well eliminated by ultrafiltration, the
effective constituent was little missed, and the safety of drug could be improved.
Key words:ultrafiltration; Kushensu injection; bacterial endotoxins