全 文 :基于 MaxEnt的南丹参在中国的潜在分布区预测及适生性分析
何淑婷,白碧玉,但佳惠,赵静滢,高馨琪,景鹏飞* (陕西师范大学生命科学学院,陕西西安 710062)
摘要 [目的]对南丹参在中国的潜在分布区进行预测,并对适生性进行分析。[方法]通过收集中草药南丹参的分布信息,利用最大熵
模型( MaxEnt) 与地理信息系统( ArcGIS),综合相关 68项环境因子,分析南丹参在中国的分布信息。[结果]全国适合于南丹参分布的
地区主要集中在湖南、江西、浙江和福建等地,其高适生区面积依次为湖南省( 319. 44 km2 )、江西省( 251. 39 km2 )、浙江省( 122. 92 km2 )、
福建省( 62. 5 km2 ) ;刀切法( Jackknife)分析显示,南丹参分布主要受到降水的影响。[结论]该研究结果为南丹参的野生资源利用及其
他南丹参相关研究提供了一定技术手段和理论依据。
关键词 南丹参( Salvia bowleyana Dunn. ) ;潜在适生区;MaxEnt; ArcGIS;生态位
中图分类号 S567. 5 + 3 文献标识码 A 文章编号 0517 -6611( 2014) 08 -02311 -04
Prediction of Potential Distribution Areas of Salvia bowleyana Dunn. in China Based on MaxEnt and Suitability Analysis
HE Shu-ting,JING Peng-fei et al ( School of Life Science,Shaanxi Normal University,Xi’an,Shaanxi 710062)
Abstract [Objective]To predict potential distribution area of Salvia bowleyana Dunn. in China and analyze its suitability. [Method]The dis-
tribution information of Salvia bowleyana Dunn. and 68 related environmental factors were collected. The potential suitable distribution range of
Salvia bowleyana Dunn. in China was analyzed by the software of MaxEnt and ArcGIS. [Result]The results showed that Salvia bowleyana Dunn’
s suitable distribution areas are mainly concentrated in Hunan,Jiangxi,Zhejiang,Fujian. The high suitable area of province above are as fol-
lows: Hunan Province( 319. 44 km2 ),Jiangxi Province ( 251. 39 km2 ),Zhejiang Province ( 122. 92 km2 ),Fujian Province ( 62. 5 km2 ) . Jack-
knife analysis showed that precipitation has obvious influence on Salvia bowleyana Dunn’s distributions. [Conclusion]The results can provide
reference for Salvia bowleyana Dunn’s wild resource utilization and study.
Key words Salvia bowleyana Dunn. ; Potential distribution; MaxEnt; ArcGIS; niche
基金项目 国家大学生创新创业计划项目创新训练国家级项目,项目
编号 201310718075。
作者简介 何淑婷( 1990 - ) ,女,广东佛山人,本科,专业: 生物科学。
* 通讯作者,硕士研究生,研究方向:遗传学。
收稿日期 2014-02-18
南丹参(Salvia bowleyana Dunn.)系唇形科(Labiaceae)
鼠尾草属(Salvia)多年生草本植物,根肥厚入药,功效同丹
参,可代中药丹参(S. salviae)入药,具有祛瘀、活血、调经和抗
氧化等功效;主产于浙江、湖南、江西、福建、广东和广西等南
部地方;生于山地、山谷、路旁、林下或水边,海拔 30 ~ 960
m[1 -3],在浙江和江西等一些南方地区南丹参作丹参药
用[4 -5]。施天慧等对云南产的丹参资源植物化学成分进行
测定,结果显示南丹参中总酚酸的含量为 4. 53%,丹酚酸 B
为 41. 33 μg /g,与丹参中含的量接近,具有较高的利用价
值[7]。根据《中国药典》2005版中用丹酚酸 B作为评价丹参
药材中的酚酸类成分的指标,并规定丹参中丹酚酸 B的含量
不低于 30 mg /g[8]。虽然南丹参还没有被药典收录,但有研
究表明南丹参(浙江产)中丹酚酸 B含量(82. 52 mg /g)较高,
不仅符合药典的规定,而且比丹参(云南产)中丹酚酸 B 含
量(45. 38 mg /g)高,是丹参药材中的优良品种[9]。南丹参在
常用 8种丹参品系中生长冠幅最大,单株产量及有效成分含
量(丹参素)最高,根的优质品最高,抗根结线虫病能力为中
度感病,属 3级,是最为适宜推广种植的种质(品种)[10]。
最大熵理论(the principle of maximum entropy)是一种基
于有限的已知信息对未知分布进行无偏推断的预测方法。
对其预测结果进行 AUC(areas under curve)分析后显示,其
结果要优于同类预测模型如 GARP、Climex 和 BIO-CLIM,特
别是在物种分布数据不全的情况下,MaxEnt 仍然能得到较
为满意的结果[17 -21]。目前,该模型已成功应用于预测保护
物种、入侵种、以及有害生物和药用植物的潜在生境
分布[21 -24]。
随着近年来心脑血管疾病患者的增加及南丹参新的药
理学活性的逐步发现,其利用价值和需求量也明显提高[12]。
为了充分利用南丹参的野生资源,适应南丹参的收集和生产
开发需要,笔者对南丹参的潜在分布区进行预测,并对其适
生性进行分析,以期为南丹参的野生资源利用及其他南丹参
相关研究提供理论依据。
1 数据收集
1. 1 南丹参分布数据收集和处理 试验需要的所有南丹参
分布数据来源于中国数字标本馆(CVH) (http:/ /www. cv h.
or g. cn /cms /)、中国自然保护区资源平台(http:/ /www.
papc. cn /)、全球生物多样性信息平台(GBIF) (http:/ /www.
gbif. org /)、教学标本标准化整理整合与资源共享平台(ht-
tp:/ /mnh. scu. edu. cn /)和中国国内 21所高校及研究所标本
馆(华中师范大学 CCNU、中科院成都生物所 CDBI、湖北中医
药大学 ECM等)。经过对以上平台南丹参数据的收集,将处
理所得的所有数据转换为经纬度坐标。对于没有记录经纬
度坐标的分布点,均以最小可查的行政单位为准。根据Max-
Ent 软件要求,将实际分布点按物种名、分布点经度和纬度顺
序储存成后缀名为. csv 格式的文件,其中东经和北纬为正,
西经和南纬为负。
1. 2 环境变量及相关地理信息数据 查询世界气候数据库
(http:/ /www. worldclim. org) ,精度 2. 5弧分 (2. 5 km) ,得到
研究所需的气候环境图层数据,共 6 类,即地形因子:alt(海
拔) ;生物气候因子:bio1(年均温)、bio2(昼夜温差月均值)、
bio3(等温性[(Bio2 / Bio7)×100])、bio4(温度季节性变化
的标准差)、bio5(最暖月最高温)、bio6(最冷月最低温)、bio7
(年均温变化范围)、bio8(最湿季度平均温度)、bio9(最干季
安徽农业科学,Journal of Anhui Agri. Sci. 2014,42(8) :2311 - 2314 责任编辑 石金友 责任校对 况玲玲
DOI:10.13989/j.cnki.0517-6611.2014.08.071
度平均温度)、bio10(最暖季度平均温度)、bio11(最冷季度平
均温度)、bio12(年均降水量)、bio13(最湿月降水量)、bio14
(最干月降水量)、bio15(降水量变异系数)、bio16(最湿季度
降水量)、bio17(最干季度降水量)、bio18(最暖季度降水量)、
bio19(最冷季度降水量) ;单月因子:tmax1 - tmax12(1 ~ 12月
最高温) ;tmean1 ~ tmean12(1 ~ 12 月平均气温) ;tmin1 ~
tmin12(1 ~ 12 月最低气温) ;prec1 ~ prec12(1 ~ 12 月降雨
量)。在国家地理信息系统网站(http:/ /nfgis. nsdi. gov. cn /)
下载研究所采用的 1:400万中国地图及中国行政区划图。
2 研究方法
2. 1 数据处理 将获得的南丹参分布数据和相应的环境数
据按相应的格式转换后导入 MaxEnt,之后随机选取 25%的
分布点作为测试集(test data) ,剩余的作为训练集(training
data) ,其他参数均为软件默认值。
2. 2 模型预测评价 设定环境图层导入的每个环境因子选
择离散(categorical)变量模式,用刀切法将 68 项环境因子在
模型中按训练得分排列后,选出得分较高的前 15 项进行进
一步分析,评价影响南丹参分布的最关键因素。
采用 MaxEnt软件中受试者工作曲线方法进行模型精度
检验,Hanley(1882)阐释了 ROC曲线的意义及使用方法,曲
线下的面积(AUC 值)代表着模型的测试能力[19]。AUC 值
在 0. 5 ~0. 6,表明模型模拟效果为失败;0. 6 ~ 0. 7 表明效果
较差;0. 7 ~0. 8表明模拟效果一般;0. 8 ~ 0. 9表明模拟效果
好;0. 9 ~1. 0表明模拟效果非常好[20]。
2. 3 环境因子权重分析 用刀切法分析各个环境因子对预
测结果的影响程度,来对影响物种分布的环境因素进行权重
排序。该方法用所有的变量建立模型(深灰色条带表示) ;单
独用每一变量建立模型(黑色条带表示) ;每次排除一个变
量,用剩余的变量建立模型(浅灰色条带表示) ,观察这个模
型(浅灰色条带)与所有变量都存在的模型(深灰色条带)之
间的变化,如果变化大,说明排除的那个变量含有很重要的
信息,反之,有用信息少[24]。
3 结果与分析
3. 1 南丹参在中国潜在分布和分析 利用 GIS的空间分析
工具,采用人工(Manual)分级方法分析得到南丹参在中国的
分布图(图 1) ,以南丹参在中国的潜在分布图(ESRI ASCII
格式)为底图,掩膜抽提各省(市﹑自治区)的分布图,采用
Manual分级方法将各个省份的潜在分布区面积进行详细统
计(表 2)。图 1表明,南丹参在我国的适生范围主要集中在
华南、华中和东南地区,高适生范围分布在地处 24° ~ 31°N,
109° ~120°E的湖南东南部,江西西北部,浙江北部和福建东
北部,同时西藏、陕西、新疆和甘肃等西北地区也有少量分
布。由表 2可知,高适生区依次为湖南省(319. 44 km2)、江
西省(251. 39 km2)、浙江省(122. 92 km2)、福建省(62. 5 km2)
和广西省(46. 53 km2) ;较适宜生长区包括湖南省(1 421. 25
km2)、江西省(1 272. 22 km2)、浙江省(591. 67 km2)、安徽省
(445. 83 km2)和福建省(268. 75 km2) ;内蒙古、吉林、天津、辽
宁、青海和黑龙江等省区则基本没有其适生区分布。其中,
湖南省的高适生区和较适宜生长区主要分布在长沙市长沙
县、浏阳县和岳阳市岳阳县境内;江西省主要分布在东乡县、
九江县以及宜丰县境内;浙江省主要分布在萧山市、绍山市
和富阳县、建德县境内;福建省主要分布在福州市、崇安县、
建宁县境内。
图 1 南丹参在中国的潜在分布概况
表 2 我国 12个行政区不同等级适生区面积
地区
高适生
区面积
km2
较适宜生
长区面积
km2
边缘适生
区面积
km2
低适生
区面积
km2
湖南 319. 44 1 421. 25 4 448. 61 187 710. 0
江西 251. 39 1 272. 22 4 632. 64 146 619. 0
浙江 122. 92 591. 67 2 163. 19 88 747. 2
福建 62. 50 268. 75 928. 47 106 704. 0
安徽 56. 25 445. 83 1 657. 64 131 493. 0
广西 46. 53 239. 58 910. 42 207 519. 0
重庆 45. 14 211. 11 639. 58 76 280. 6
广东 18. 06 122. 91 643. 75 152 037. 0
湖北 13. 89 248. 61 1 180. 56 174 186. 0
四川 13. 19 36. 11 110. 42 455 179. 0
上海 3. 47 23. 61 57. 64 4 692. 4
3. 2 预测结果评价 经受试者工作曲线检验,MaxEnt 模型
的 ROC曲线下面积训练集和测试集的 AUC值依次为 0. 975
和 0. 968,接近于1,表明MaxEnt模型对南丹参中国潜在分布
区的预测效果非常好(图 3)。
图 2 训练集和测试集的 ROC曲线
3. 3 影响南丹参分布的不同环境因子的权重评价和相关性
分析 对最初的 68 项环境因子进行刀割法分析,其中测试
2132 安徽农业科学 2014 年
得分最高的前 15 项得分由高到低依次为:温差季节性变化
标准差(bio4)、年均降水量(bio12)、最湿季节降水量
(bio16)、海拔(alt)、最冷季节降水量(bio19)、4 月平均降水
量(prec4)、5 月平均降雨量(prec5)、3 月平均降雨量
(prec3)、6月平均降雨量(prec6)、最干月降水量(bio14)、2
月平均降雨量(prec2)、最干季度降水量(bio17)、9 月份最低
温(tmin9)、最暖季度降水量(bio18)、最干季度平均温度
(bio9) (图 4)。这 15项环境因子对预测结果有较大的影响。
结果表明,与降雨量相关的环境变量对南丹参的地理分布有
重要影响,比如温差季节性变化标准差、年均降水量、最湿季
节降水量等。
鉴于环境因子之间存在相关性,试验利用 ArcGIS 中的
Band Collection Statistics工具对得分较高的几项环境因子进
行了相关性分析。由于年均降水量(bio12)、最湿季节降水
量(bio16)、最冷季节降水量(bio19)、4月平均降水量(prec4)
这几项环境因子的相关性较高,所以选择相关性较低而权重
较高的几项环境因子进行分析,得出对南丹参适宜生长区域
生态位影响较大的环境因子是:温度季节性变化的标准差
(bio4)700 ~850;最干季度降水量(bio17)15 ~ 20 mm;海拔
(alt)0 ~200 m;9月份最低温(tmin9)20. 5 ~ 22. 0 ℃;最干季
度平均温度(bio9)10 ~14 ℃。
4 结论与讨论
试验利用 MaxEnt模型与地理信息系统对南丹参在我国
的适生区进行预测,直观且定量地获得了南丹参在我国的潜
在分布区,其预测结果经 ROC曲线分析法验证,得到模型的
AUC值为 0. 968,预测效果相当好。经 Jacknife 对环境因子
分析后得出,与降雨量相关的环境变量对南丹参的地理分布
有关键性的影响。预测结果得出,南丹参的高适生区主要分
布于湖南、江西、浙江和福建等地;较适宜生长区主要分布在
华东和华南地区(浙江、安徽、广西、广东和福建等) ;四川省、
重庆市以及陕西省等西北和西南地区也有分布。预测结果
与南丹参主要产地(浙江、湖南、江西、福建和广东)相吻合,
表明这些地区的气候适合南丹参生长繁殖,南丹参在这些地
区的野生资源也可能比较丰富。
试验得出南丹参在浙江省适生区面积为91 624. 98 km2,
高适生面积为 122. 92 km2,云南省只有低适生区,面积为
341 688 km2。而施天慧等对云南产的南丹参化学成分测定,
结果显示其丹酚酸 B为 41. 33 μg /g[7]。李旻辉等人对浙江
产南丹参中测定丹酚酸 B含量为 82. 52 mg /g[9],得出浙江产
南丹参的丹酚酸 B含量比云南产的南丹参要高。故推测南
丹参在潜在适生区生长,其个体发育状况会比其非适生区
好,且有效活性物质的积累量会更高。因此建议:采收和使
用南丹参时可以参考研究中得出的南丹参野生资源理论分
布点;积极推广、扩大、保护南丹参野生药用资源。研究得到
南丹参药材的适生区可以对其进行野生资源保护,生态环境
保护,合理采购、并且结合其生长生理特性进行可持续资源
开发利用。
综上所述,研究采集了相当数量的南丹参分布数据,基
图 3 刀切法的环境变量重要性分析
本考虑到绝大多数南丹参的实际生态位,从理论上明确了南
丹参的具体适生区,可以为南丹参野生资源的收集利用,保
护资源活动和科学研究提供参考。研究中的不足之处是仅
考虑了气候和地区的影响,而没有考虑土壤类型和人类活动
范围以及社会的城镇化发展对其分布的影响。
参考文献
[1]林来官.福建植物志.第 4卷[M].福州:福建科学技术出版社,1989:
560.
[2]沈建芳,王强,汪红,等.南丹参化学成分研究[J].中国野生植物资源,
313242卷 8期 何淑婷等 基于 MaxEnt的南丹参在中国的潜在分布区预测及适生性分析
2006,25(2):55 -58.
[3]杨庆华,周翔宇,魏宇昆,等.华东区系鼠尾草属药用植物资源[J].中
国野生植物资源,2011,30(2):21 -26.
[4]严玉平,由会玲,徐树楠,等.丹参种源分布及道地性研究[J].时珍国
医国药,2007,18(8):1882 -1883.
[5]汪红,王强.丹参及鼠尾草属植物的 rDNAITS序列分析[J].中草药,
2005,36(9):1381 -1385.
[6]施天慧,王强,袁理春,等.云南丹参资源植物的成分测定与质量评价
[J].植物资源与环境学报,2005,15(2):73 -74.
[7]国家药典委员会.《中华人民共和国药典》2005版,一部[S].北京:化学
工业出版社,2005:52 -53.
[8]李旻辉,陈建民,彭勇,等.中国鼠尾草属酚酸类活性成分的分布规律
研究[J].世界科学技术:中医药现代化,2008,10(5):46 -52.
[9]舒志明,梁宗锁,孙群,等.不同丹参种质生物学性状比较与评价[J].
西安文理学院学报:自然科学版,2007,10(2):24 -29.
[10]刘晓龙,王晓明.安徽鼠尾草属药用植物资源及开发利用[J].中国中
药杂志,1996,21(2):73 -75.
[11]段英姿,客绍英,曹静,等.秋水仙碱诱导南丹参多倍体的研究[J].中
国中药杂志,2006,31(6):445 -448.
[12]段英姿,牛应泽,彭朝忠,等.南丹参离体快速繁殖与多倍体诱导[J].
植物生理学通讯,2003,39(3):201 -205.
[13]严玉平,由会玲,徐树楠,等.丹参种源分布及道地性研究[J].时珍国
医国药,2007,18(8):1882 -1883.
[14]PHILLIPS S J,ANDERSON R P,SCHAPIRE R E. Maximumentropymod-
eling of species geographic distributions[J]. Ecological Modelling,2006,
190:231 -259.
[15]王运生,谢丙炎,万方浩,等. ROC曲线分析在评价入侵物种分布模型
中的应用[J].生物多样性,2007,15(4):365 -372.
[16]WISZ M S,HIJMANS R J,LI J,et al. Effects of sample size on the per-
formance of species distribution models[J]. Diversity and Distributions,
2008,14(5):763 -773.
[17]SWETS J A. Measuring the accuracy of diagnostic systems[J]. Science,
1988,240:1285 -1293.
[18]陈新美,雷渊才,贾宏炎,等.样本量对模型预测物种分布精度和稳定
性的影响[J].林业科学,2012,48(1):53 -58.
[19]陈林,程登发,田喆,等.多种生物潜在分布预测分析软件功能对比分
析[C]/ /第一届全国生物入侵学术研讨会论文摘要集.福州,2012:53
-59.
[20]徐卫华,罗翀. MaxEnt模型在秦岭川金丝猴生境评价中的应用[J].森
林工程,2010,26(2):1 -3.
[21]张海娟,陈勇,黄烈健,等.基于生态位模型的薇甘菊在中国适生区的
预测[J].农业工程学报,2011,27(5):413 -419.
[22]常志隆,周益林,赵遵田,等.基于MaxEnt的小麦印度腥黑穗病在中国
的适生性分析[J].植物保护,2010,36(3):
檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪
110 -112.
( 上接第 2275页)
该方法的成功之处。
综上所述,RNA simple Total RNA Kit方法可提取芹菜茎
组织的总 RNA,且所得 RNA质量高,满足满足后续分子生物
学试验的要求,也可能为其他植物组织总 RNA 提取的方法
提供借鉴参考。
图 4 扩增 4CL产物测序结果与 GENEBANK登陆 4CL序列比对结果
参考文献
[1]黄正明,杨新波,曹文斌,等.中药水芹的现代研究与应用[J].解放军
药学学报,2001,17(5):266 -269.
[2]RIZZO V,MURATORE G. Effects of packaging on shelf life of fresh celery
[J]. Journal of Food Engineering,2009,5(90):124 -128.
[3]赵宏亮. MassrI在香蕉果实采后不同时期的表达及功能分析[D].儋
州:华南热带农业大学,2006.
[4]罗志娇.双孢蘑菇褐变相关 PPO基因的克隆及表达分析[D].郑州:河
南农业大学,2011.
[5]赵锦,刘中成,代丽,等.枣不同器官和组织 RNA提取方法的研究[J].
植物遗传资源学报,2009,10(1):111 -117.
[6]孟丽,周琳,张明姝,等.一种有效的花瓣总 RNA提取方法[J].生物技
术,2006,16(1):38 -40.
[7]蒋倩,王枫,候喜林,等.芹菜非特异性脂转移蛋白基因的克隆与表达
分析[J].园艺学报,2012,39(7):1293 -1302.
[8]王荣,李红菊.半定量RT-PCR法在检测基因表达水平中的应用[J].阜
阳师范学院学报,2007,24(1):49 -52.
4132 安徽农业科学 2014 年