免费文献传递   相关文献

Influencing factors of non-point source pollution of watershed based on boosted regression tree algorithm.

基于增强回归树的流域非点源污染影响因子分析


地表水的非点源污染在点源污染不断得到控制的前提下已经成为水环境污染的首要问题.非点源污染影响因子的复杂性及不确定性一直是流域非点源污染研究的重点和难点.本文利用SWAT(Soil and Water Assessment Tool)模型,以辽河子流域汎河流域为例,模拟了2003—2012年的非点源污染状况,对其空间分布状况进行了分析,并应用增强回归树的方法定量分析各种影响因子(坡度、土地利用类型、高程和土壤类型)对该流域非点源污染的贡献率.结果表明: 在汎河流域,非点源污染呈现较高的空间异质性,其中总氮的空间分布差异较大,总磷的空间分布差异较小.坡度因子与载体泥沙、总氮和总磷均呈极显著正相关关系(P<0.01),对泥沙和总磷有显著影响,其贡献率分别为46.5%、38.2%;土地利用因子对载体泥沙、总磷的负荷量有重要影响,其贡献率分别达到27.2%、35.3%;高程较低、坡度较缓的耕地地区易产生较高的总磷负荷量;褐色土壤最易流失总磷,而草甸土易流失总磷,且易受泥沙侵蚀.本研究利用增强回归树模型克服了流域非点源污染影响因子的复杂性,可加深对非点源污染产生机制的理解.

Non-point source (NPS) pollution has become a key water pollution problem under the condition of point source pollution was controlled. The complexity and uncertainty research of NPS pollution influential factors has always been important and difficult.  This paper simulated NPS pollution of the Fanhe River watershed in 2003-2012 by the soil and water assessment tool (SWAT) and analyzed its spatial distribution. Meanwhile, the boosted regression tree (BRT) method was proposed to quantitatively analyze the corresponding influential factors including land use, soil, elevation and slope. The results showed that NPS pollution in the Fanhe River watershed had high spatial heterogeneity. The spatial distribution of total nitrogen (TN) had greater difference than that of total phosphorus (TP). The three pollutants, TN, TP and sediment, were all positively related to slope gradients (P<0.01). The slope gradients played the strongest role in determining the sediment and TP output with the contribution rate of 46.5% and 38.2%, respectively. Land use had important influence on sediment and TP loads, with the contribution rate of 27.2% and 35.3%, respectively. TN was produced abundantly in lowelevation and steepslope locations and with cultivated land use. Cinnamon soil was most vulnerable to the TN load while meadow soil took the second place in terms of soil erosion and TP load. The paper overcame the complexity of influential factors for NPS pollution by BRT, and deepened the understanding of NPS pollution mechanism.


全 文 :基于增强回归树的流域非点源污染影响因子分析
尹  才1,2,3  刘  淼2∗  孙凤云1,3  李春林2  象伟宁3
( 1华东师范大学地理科学学院, 上海 200241; 2中国科学院沈阳应用生态研究所, 沈阳 110016; 3上海市城市化生态过程与生
态恢复重点实验室, 上海 200241)
摘  要  地表水的非点源污染在点源污染不断得到控制的前提下已经成为水环境污染的首
要问题.非点源污染影响因子的复杂性及不确定性一直是流域非点源污染研究的重点和难点.
本文利用 SWAT(Soil and Water Assessment Tool)模型,以辽河子流域汎河流域为例,模拟了
2003—2012年的非点源污染状况,对其空间分布状况进行了分析,并应用增强回归树的方法
定量分析各种影响因子(坡度、土地利用类型、高程和土壤类型)对该流域非点源污染的贡献
率.结果表明: 在汎河流域,非点源污染呈现较高的空间异质性,其中总氮的空间分布差异较
大,总磷的空间分布差异较小.坡度因子与载体泥沙、总氮和总磷均呈极显著正相关关系(P<
0.01),对泥沙和总磷有显著影响,其贡献率分别为 46.5%、38.2%;土地利用因子对载体泥沙、
总磷的负荷量有重要影响,其贡献率分别达到 27.2%、35.3%;高程较低、坡度较缓的耕地地区
易产生较高的总磷负荷量;褐色土壤最易流失总磷,而草甸土易流失总磷,且易受泥沙侵蚀.
本研究利用增强回归树模型克服了流域非点源污染影响因子的复杂性,可加深对非点源污染
产生机制的理解.
关键词  汎河流域; 增强回归树; SWAT模型; 定量分析
Influencing factors of non⁃point source pollution of watershed based on boosted regression
tree algorithm. YIN Cai1,2,3, LIU Miao2∗, SUN Feng⁃yun1,3, LI Chun⁃lin2, XIANG Wei⁃ning3
( 1School of Geography Sciences, East China Normal University, Shanghai 200241, China; 2Institu⁃
te of Applied Ecology, Chinese Academy of Sciences, Shenyang 110164, China; 3Shanghai Key La⁃
boratory for Urban Ecological Processes and Eco⁃Restoration, Shanghai 200241, China) .
Abstract: Non⁃point source (NPS) pollution has become a key water pollution problem under the
condition of point source pollution was controlled. The complexity and uncertainty research of NPS
pollution influential factors has always been important and difficult. This paper simulated NPS pollu⁃
tion of the Fanhe River watershed in 2003-2012 by the soil and water assessment tool (SWAT) and
analyzed its spatial distribution. Meanwhile, the boosted regression tree (BRT) method was pro⁃
posed to quantitatively analyze the corresponding influential factors including land use, soil, eleva⁃
tion and slope. The results showed that NPS pollution in the Fanhe River watershed had high spatial
heterogeneity. The spatial distribution of total nitrogen (TN) had greater difference than that of total
phosphorus (TP). The three pollutants, TN, TP and sediment, were all positively related to slope
gradients (P<0.01). The slope gradients played the strongest role in determining the sediment and
TP output with the contribution rate of 46.5% and 38.2%, respectively. Land use had important in⁃
fluence on sediment and TP loads, with the contribution rate of 27.2% and 35.3%, respectively.
TN was produced abundantly in low⁃elevation and steep⁃slope locations and with cultivated land use.
Cinnamon soil was most vulnerable to the TN load while meadow soil took the second place in terms
of soil erosion and TP load. The paper overcame the complexity of influential factors for NPS pollu⁃
tion by BRT, and deepened the understanding of NPS pollution mechanism.
Key words: Fanhe River watershed; boosted regression tree; soil and water assessment tool; quan⁃
titative analysis.
本文由国家自然科学基金面上项目( 41171155,41501198)资助 This work was supported by the National Natural Science Foundation of China
(41171155,41501198).
2015⁃07⁃01 Received, 2016⁃01⁃04 Accepted.
∗通讯作者 Corresponding author. E⁃mail: lium@ iae.ac.cn
应 用 生 态 学 报  2016年 3月  第 27卷  第 3期                                            http: / / www.cjae.net
Chinese Journal of Applied Ecology, Mar. 2016, 27(3): 911-919                    DOI: 10.13287 / j.1001-9332.201603.020
    在点源污染不断得到有效控制的情况下,非点源
污染成为水体污染的主要成因,已引起了广泛关
注[1] .非点源污染的产生受诸多环境因子的控制,明
确各环境因子与水体污染之间的关系,可为非点源污
染管理和水质优化提供重要的理论和实践依据[2-4] .
然而在流域尺度上,对非点源污染负荷和其源头的定
量关系分析往往受到数据缺乏的限制,也受到水质和
环境控制因子之间复杂性和区域性的影响[5-7] .
目前,非点源污染研究主要包括 3 个方面:1)
模拟非点源污染量和空间变异性[8-11];2)评价非点
源污染管理的有效性[12-15];3)对现有水文模型的改
进[16-20] .然而,在环境因子和非点源污染的定量关
系分析方面的研究较为缺乏,已有学者利用景观指
数(景观破碎度、多样性、连通性等)来揭示景观特
征和非点源污染的关系[21-22],而对非点源污染影响
因子定量分析方法的探讨还较少[23-25] .
20世纪 70 年代以来,国内外学者针对非点源
污染模拟和估算开发了大量数学模型,包括 AG⁃
NPS、AnnAGNPS、ANSWERS、ANSWERS⁃Continuous、
CASC2D、 DWSM、 HSPF、 KINEROS、 MIKE SHE、
PRMS和 SWAT模型等[26] .其中 SWAT 作为最常用
的模型,能够较好地模拟和预测复杂流域的径流、泥
沙和营养物的负荷[25,27-28],模拟污染物在流域范围
内的迁移转化过程,明确污染物运移的时空分布规
律,可以为治理和管理流域水环境提供有力支持.
流域非点源污染与各环境因子之间存在较为复
杂的关系,能否有效地量化其关系并做出合理的预
测是本研究的重点.增强回归树模型在研究复杂因
子间的相互作用关系和模拟预测方面有着十分明显
的优势,已经被成功应用于生态学中许多复杂现象
的机理分析中[29-31] .将此方法引入到非点源污染研
究中,能够有效地预测污染物负荷与各影响因子之
间的关系,从而给水质污染来源的解释、预测及管理
提供新的研究方法.本研究以辽河子流域汎河流域
为例,利用非点源污染模型 SWAT 对该流域的水文
过程进行模拟,将模型输出的非点源污染结果(总
氮和总磷)和泥沙作为因变量,以环境因子(土地利
用类型、土壤类型、高程、坡度)作为自变量,利用
BRT方法研究各环境因子对非点源污染物的影响,
分析 BRT方法在定量影响因子分析中的有效性.
1  研究区域与研究方法
1􀆰 1  研究区概况
汎河流域为辽河的一级支流,位于中国东北地
图 1  汎河流域位置
Fig.1  Location of the Fanhe River watershed.
1) 气象站 Meteorologial station; 2) 水文和雨量监测站 Hydrometric
and precipitation monitoring station; 3) 雨量监测站 Precipitation moni⁃
toring station; 4) 河道 Reach; 5) 子流域 Sub⁃basin.
区铁岭市南部 ( 42. 00°—42. 30° N, 123. 62°—
124.55° E,图 1).汎河流域的较大支流有 17 条,全
长 108 km,面积 1037.66 km2,占铁岭全市区域面积
的 8􀆰 0%.全流域呈狭长状,地势东高西低,平均坡降
5􀆰 0‰.该流域降雨量集中在 4—9月,2003—2013 年
的年均降雨量在 480 ~ 1036 mm.主要的土地利用类
型为林地、耕地和居民地,各占 57%、33%和 7%.该
流域受工业活动干扰较小,非点源污染主要来自农
业生产和农村生活.
1􀆰 2  研究方法
1􀆰 2􀆰 1 SWAT模型  本研究选用 SWAT 模型进行非
点源污染模拟研究,水量平衡是 SWAT 模型的基本
驱动力,其水文循环主要分为陆地阶段和河道演算
阶段.在陆地阶段,模型中采用水量平衡表达式进行
模拟,公式如下:
SWt = SW0 +∑

i -1
(Rday - Qsurf - Ea - Wseep - Qgw)
(1)
式中:SWt 为土壤最终含水量(mm);SW0 为土壤初
期含水量(mm);t 为时间步长(d);Rday为第 i 天的
降水量(mm);Qsurf为第 i 天地表径流量(mm),与流
域各土地利用类型面积和平均坡度直接相关;Ea 为
第 i天蒸散发量(mm);Wseep为第 i 天透过土壤层的
渗透量和侧流量(mm);Qgw为第 i 天的地下水含量
(mm).
在河道演算阶段,水量平衡方程式为:
Vs,2 =Vs,1+Vin-Vout-V1-Ech+Di+Vb (2)
式中:Vs,1、Vs,2为时间步长开始和结束时河道中的水
存储量(m3);Vin、Vout分别为时间步长内流入和流出
河道的水量(m3);Vl 为通过河床的河道水流传播损
失(m3);Ech为模拟日河道的蒸发量(m3);Di 为调
水对河道水量的改变(m3);Vb 为河岸存储进入河道
的水量(m3).
219 应  用  生  态  学  报                                      27卷
土壤的侵蚀量和产沙量采用修正的通用土壤流
失方程来估测,公式如下:
msed = 11.8 ×(Q× qfeng ×AHRU) 0.56 ×K ×C ×P ×LS ×
CFRG (3)
式中:msed为单个流域响应单元(HRU)的总土壤侵
蚀量(t);Q为地表径流(mm·h-1);qfeng为洪峰径流
(m3·s-1);AHRU为 HRU 面积(hm2);K 为土壤可蚀
性因子;C为植被覆盖与管理因子;P 为水土保持措
施因子;LS 为地形因子,与 HRU 平均坡度直接相
关;CFRG为粗糙度因子.
土壤中的氮磷等营养物通常通过地表径流和泥
沙运输进入河道.对于附着在土壤颗粒上的有机氮
(磷),随泥沙运输进入地表径流的量为:
N0 = 0.001×C0×S / Ah×εN (4)
式中:N0 为随泥沙运输进入地表径流的有机氮(磷)
负荷量(kg·hm-2);C0 为地表 10 mm 土层中的有
机氮(磷)浓度( g·t-1 );S 为模拟日的泥沙产量
(t);Ah 为 HRU的面积(hm2);εN 为氮(磷)富集系
数,是径流泥沙中有机氮(磷)浓度与地表土层(磷)
浓度之比.
当汇流时间超过 1 d,地表径流的一部分延迟进
入主河道,其中的营养物质也同样延迟.进入主河道
的有机氮(磷)量为:
NOS =(NOS′+NOS″)(1-e
-Li / th) (5)
式中:NOS为模拟日由地表径流运输进入主河道的有
机氮(磷)量(kg·hm-2);NOS′为模拟日 HRU 中产
生地表径流中的有机氮(磷)量( kg·hm-2),由式
(3)计算所得;NOS″为前一天存储或延迟的地表径流
中的有机氮(磷)量(kg·hm-2);Li 为地表径流延迟
系数,为模型中可调参数; th 为 HRU 的汇流时间
(h),与子流域面积及河道坡度有关.
1􀆰 2􀆰 2增强回归树 BRT  BRT是基于分类回归树算
法(classification and regression tree, CART)的一种
自学习方法.该方法是两大算法的组合:1)回归树算
法,通过递归将数据集切分成许多组易建模的数据,
再利用线性回归的方法建模;2)Boosting 方法,用来
提高弱分类算法的准确度,通过构造一个预测函数
系列,然后以一定的方式将它们组合成一个预测函
数[30] .在运算过程中多次随机抽取一定量的数据,
分析自变量对因变量的影响程度,剩余数据用于结
果的校验,对生成的多重回归树取均值并输出.BRT
方法可以计算在其他自变量取均值或不变的情况
下,某自变量与因变量的相互关系,从而得出自变量
对因变量的影响大小.BRT 可以提高计算结果的稳
定性和精度,并且在处理不同数据格式时具有很大
的灵活性,输出结果较为直观.
1􀆰 3  数据来源和处理
SWAT模型需要输入空间数据及属性数据,包
括:数字高程模型(DEM)数据、土地利用数据、土壤
数据、气象数据,水文水质监测数据等.
1)模型需要从 DEM 中获取模拟所需要的河流
长度、坡度和坡向等.DEM 数据来源于 1 ∶ 5 万地形
图(图 2),对原始 DEM 进行洼地填充,计算栅格累
积汇流量及流向,设置流域划分面积最小阈值 1200
hm2,将汎河流域划分为 53 个子流域.最后利用
DEM数据计算流域内的坡度数据,并将其分成 5 个
梯度:≤2°、2~6°、6~15°、15~25°、>25°.
    2)土地利用数据采用 2010年 8月 5日的 Land⁃
sat5 TM遥感影像,基于遥感分析软件 ERDAS 9.0,
以研究区 1 ∶ 5万地形图作为参照对原始影像进行
几何精校正,误差控制在 0.5 个像素以内.在解译成
土地利用数据后,在研究区的 260 个实地采样点数
据中的 100个作为目视解译的参考,余下的 160 个
采样数据对结果进行精度评价,得到遥感解译精度
为 89.2%.并基于人机交互的目视解译的方法将影
像分为 7类:有林地、草地、居民地、水田、灌木林地、
旱地及水域(图 3).
    3)土壤图是利用流域边界图切割东北 1︰100
万土壤图得来,并以土壤类型的代码字段为值转化
为栅格数据,然后建立土壤查找表文件,并根据研究
区土壤特点采用亚类级分类,得到土壤分布图.在
SWAT加载土壤数据后对其进行重分类,最终得到
棕壤、潮棕壤、褐土、草甸土、水稻土 5 类土壤类型
(图 3).
4)收集汎河流域 7 个降水测站提供的 1975—
1982年日降水数据和 1 个气象测站提供 1998—
2012年日降雨量、日最高气温、日最低气温、日平均
图 2  研究区内数字高程模型(DEM)空间分布
Fig.2  Spatial distribution of digital elevation model (DEM) in
the study area.
3193期                        尹  才等: 基于增强回归树的流域非点源污染影响因子分析           
图 3  研究区内土地利用类型(a)和土壤类型(b)的空间分

Fig.3  Spatial distribution of land use types (a) and soil types
(b) in the study area.
Ⅰ: 水田 Paddy; Ⅱ:水域Water; Ⅲ:旱地 Dryland; Ⅳ:林地 Forest;
Ⅴ: 居民地 Residence; Ⅵ:草地 Grassland; Ⅶ: 灌木 Shrub. 1) 棕壤
Brown soil; 2) 潮棕壤 Tidal soil; 3) 褐土 Cinnamon soil; 4) 草甸土
Meadow soil; 5) 水稻土 Paddy soil; 6) 水域 Water.
风速、相对湿度和日太阳辐射 6 组数据.并用 PCP⁃
STAT.exe和 DEW02.exe 工具计算出 SWAT 中天气
发生器所需要的参数.
5)汎河流域面积较小,水文测站少,观测数据不
连续,从水文年鉴中仅能查到 1976—1981 年张家楼
子测站数据,而且该站在 80年代取消观测.由于获取
资料的限制,本研究利用张家楼子测站(42.12° N,
123.51° E)1976—1981年径流量和泥沙量连续的月
观测数据,对 SWAT模型进行率定和验证.
6)SWAT模型的耕作管理情景的初始化操作,
汎河流域主产农作物为玉米、水稻、大豆等,其中玉
米、水稻占该地区农作物的绝大部分,故耕作方式选
用一年一熟春玉米和一年一熟春水稻. SWAT 模型
在定义施肥措施时有两种定义方法:一种是根据日
期,另一种是根据执行该措施时作物累计的热量单
位的比例.本研究采用第 2 种方法,这样模拟更贴近
真实情况.考虑到研究区域较小,且根据统计年鉴发
现铁岭市 2003—2013年的肥料使用情况变化不大,
故本文采用 10年的平均化肥施用量.
7)应用率定好的 SWAT 模型对 2003—2012 年
汎河流域的地表产水量、泥沙及总氮、总磷流失量进
行模拟,得到汎河流域中各 HRU每年非点源污染负
荷情况,然后计算出泥沙、总氮和总磷的年平均值,
从而分析非点源污染的空间分布特征.同时,在 BRT
模型中,将汎河流域 2003—2012 年模拟的泥沙、总
氮和总磷的平均值作为因变量,将 SWAT 模型划分
的每一个 HRU作为一个样点,共 1366个样点,每个
样点的土地利用类型、土壤类型、坡度、高程作为自
变量,构建了汎河流域不同环境因子对泥沙及总氮、
总磷的相对贡献率及各环境因子的边际效应.调用
Elith编写的 BRT 方程包进行增强回归树分析[30] .
设置学习速率为 0.005,每次抽取 50%的数据进行
分析,50%用于训练,并进行 5 次交叉验证.BRT 包
括 7个变量(表 1).其中泥沙量、总氮和总磷属于连
续型的因变量,变化范围分别是 0 ~ 62.1 t·hm-2、
0~67.6 kg·hm-2和 0 ~ 35.0 kg·hm-2;其余的 4 个
变量为自变量,土地利用类型和土壤类型为离散型
变量,而高程和坡度为连续型变量.
2  结果与分析
2􀆰 1  模型的率定与验证
构建的 SWAT 模型在张家楼子测站的径流量
和泥沙量率定及验证结果见表 2.其中,1976 年为模
型预热期,1977—1979 年为率定期,1980—1981 年
为验证期.利用模拟值和实测值的决定系数(R2)和
Nash ⁃Sutcliffe系数(NSE)作为模拟评价的指标 .其
表 1  非点源污染负荷中 BRT模型中的变量信息
Table 1  Variables used to develop the BRT model of NPS pollution loads
变量
Variable
定义
Definition
类型
Type
均值±标准差
Mean±SD
范围
Range
泥沙 Sediment( t·hm-2) 因变量 Dependent 连续 Continuous 3.70±8.52 0~62.1
总氮 TN(kg·hm-2) 因变量 Dependent 连续 Continuous 19.12±19.51 0~67.6
总磷 TP(kg·hm-2) 因变量 Dependent 连续 Continuous 3.85±6.60 0~35.0
土地利用类型 Land use type 自变量 Independent 分类 Category - -
土壤类型 Soil type 自变量 Independent 分类 Category - -
高程 Elevation(m) 自变量 Independent 连续 Continuous 178.98±76.18 49.9~707.3
坡度 Slope(°) 自变量 Independent 连续 Continuous 12.43±10.24 0~69.7
419 应  用  生  态  学  报                                      27卷
表 2  月径流及泥沙的模拟结果评价
Table 2  Evaluation of the simulation results of the monthly
runoff and sediment
径流 Streamflow
R2 NSE
泥沙 Sediment
R2 NSE
率定 Calibration
(1977—1979)
0.72 0.67 0.85 0.83
验证 Validation
(1980—1981)
0.82 0.82 0.93 0.89
中,R2模型回归的决定系数评价模拟值与实测值之
间的吻合程度.该值越大,表明模拟的结果越好,大
于 0.6则认为模拟结果是满意的;NSE 值越接近 1,
表明模型效率越高,如果为负值,表明模型模拟平均
值比直接使用实测平均值的可信度更低,在这里其
值大于 0.5为基本满意,若大于 0.75,表明模拟结果
达到要求[32-34] .该站在率定期和验证期的 R2和 NSE
都达到模型的要求,表明模型在汎河流域对径流及
污染物负荷模拟的适用性较好(图 4).张家楼子测
站没有时间段相匹配的营养物的监测,而浑河太子
河与汎河均属于辽河的支流.浑河太子河位于汎河
的南部,紧邻汎河,地理区位相似,土壤与土地利用
类型相差不大,总氮、总磷的产生条件相似.基于实
测数据的缺乏与地理区位的相似,参考浑河太子河
流域 SWAT模型的营养物设定的相关参数[28-29],进
行汎河流域营养物的参数设置.另获取到研究区黄
河子测站(42. 25° N, 123. 62° E) 2004 年各月份、
2 010年奇数月、2011年奇数月、2012年全年的总磷
图 4  1977—1981 年实测 (Ⅰ)与模拟(Ⅱ)月径流(或泥
沙)数据的时间序列
Fig.4  Time⁃series of observed (Ⅰ) and predicted data (Ⅱ)
of monthly stream flow and sediment during the period of 1977 to
1981.
数据和 2004年全年的总氮数据.模拟结果与实测结
果相比较,发现总氮和总磷的模拟结果与研究区实
际情况较相似,参数值设置较合理.
2􀆰 2  非点源污染的空间分布特征
将研究区划分成 53 个子流域,应用率定好的
SWAT模型对 2003—2012 年的地表产水量、泥沙及
总氮、总磷流失量进行模拟,得到汎河流域中各
HRU每年非点源污染负荷情况,然后计算出泥沙、
总氮和总磷的年平均值.模拟结果表明,总氮输出情
况具有最大的空间差异性,其标准差为 26􀆰 20
kg·hm-2,泥沙和总磷的空间差异性相对较小,分别
为 9􀆰 87 t·hm-2和 7.71 kg·hm-2 .泥沙、总氮和总磷
负荷的最大值分别为 62.1 t·hm-2、67.6 kg·hm-2和
35.0 kg·hm-2 .其具体空间分布见图 5.
总氮流失的平均值为 19.12 kg·hm-2,比总磷
的流失量大(3.85 kg·hm-2).总磷负荷的空间分布
与泥沙分布极为相似,图 6显示泥沙分别与总氮、总
磷的线性拟合结果,其中泥沙与总磷拟合的R2值为
图 5  2003—2012年间年平均泥沙(S)、总氮、总磷输出的空
间分布
Fig.5  Spatial distribution of average yearly outputs of sediment
(S), TN and TP during the period of 2003 to 2012.
5193期                        尹  才等: 基于增强回归树的流域非点源污染影响因子分析           
图 6  泥沙与总氮、总磷的线性拟合
Fig.6  Linear fit of sediment with both TN and TP.
0.89,表明两者有着极强的相关性.
2􀆰 3  非点源污染影响因子分析
利用 BRT 方法分析了环境因子(土地利用类
型、土壤类型、高程、坡度)对非点源污染的影响.结
果表明,坡度与载体泥沙、总氮和总磷均呈正相关关
系(P<0.001),对产沙量影响最大,决定了其变异的
46.5%(图 7).其他变量对载体泥沙的贡献率由大到
小为:土地利用类型(27.2%)>高程(19.1%)>土壤
图 7  环境因子分别对泥沙、总氮和总磷输出的相对影响
Fig.7  Relative influences of environmental factors to sediment,
TN and TP outputs.
Ⅰ: 坡度 Slope; Ⅱ: 土地利用类型 Land use type; Ⅲ: 高程 Eleva⁃
tion; Ⅳ: 土壤类型 Soil type.
类型(7.1%).各变量对产沙量的边际效应表明了泥
沙的产生最可能发生在陡坡、中等高程(约 290 m)、
旱地和土壤类型为草甸土或褐色土的地区(图 8).
对于流域非点源污染中总氮的流失量来讲,土
地利用类型为主要的影响因子,其贡献率为 62.1%,
而高程、土壤类型及坡度对总氮流失量的贡献率分
图 8  环境因子对流域产沙量(S)及总氮、总磷流失量的边际效应
Fig.8  Marginal effect of environmental factors to sediment yield (S), TN, TP loss of watershed.
Ⅰ: 草地 Grassland; Ⅱ:灌木地 Shrubland; Ⅲ:旱地 Dryland; Ⅳ:居民地 Residence; Ⅴ:水田 Paddy; Ⅵ:水域 Water; Ⅶ:有林地 Forest land;
Ⅷ: 草甸土 Meadow soil; Ⅸ: 潮棕壤 Tidal soil; Ⅹ: 褐土 Cinnamon soil; Ⅺ: 水稻土 Paddy; Ⅻ: 棕壤 Brown soil.
619 应  用  生  态  学  报                                      27卷
别为 17.3%、11.7%和 9.0%(图 7).从图 8可以看出,
农业用地(包括旱地和水田)最易产生氮营养物的
流失,褐色土壤中氮的流失明显高于其他类型的土
壤,坡度与氮流失总体上呈正相关性,而高程与氮流
失呈明显的负相关性.
    对于流域非点源污染中总磷的流失量来讲,坡
度和土地利用类型仍为最主要的贡献因子,贡献率
分别为 38.2%和 35.3%.总体上,流域内总磷的流失
与产沙量十分类似.同时,比较泥沙和总磷中各自变
量的边际效应可以看出,各变量对它们的边际效应
相对大小也极具相似性(图 8).
3  讨    论
由流域非点源污染的模拟结果可知,流域内总
氮的流失量是总磷流失量的 2 倍多,这主要是因为
植物生长过程中对氮的需求量多于磷,农田肥料中
氮的含量高于磷,过量的肥料会随降雨汇入河道,最
终导致流域内的非点源污染.对模型输出的泥沙和
总磷做线性回归分析,得到 R2值为 0.89,说明两者
具有极大的相关性,这是由于泥沙的表面是不规则
和粗糙的,泥沙的内部存在着各种尺度的空隙;磷进
入水体后大多数被泥沙颗粒吸附,泥沙成为是磷流
失的主要载体,携带了大量的磷,而雨水侵蚀导致土
壤流失,使得进入水体的非溶解性磷占总流失磷量
的绝大部分.同时,在变化的河湖水动力条件下,通
过泥沙的再悬浮,磷可能被重新释放到水体中,产生
二次磷污染[35] .
坡度对泥沙的运移和总磷负荷有着十分重要的
作用.这种强相关性主要是因为在坡度陡的地方,泥
沙和营养物对降雨和重力作用的响应更为显著.虽
然在模型模拟期间不同坡度分类可能会对污染物的
产生和分布造成一定的影响,但总体来说,当坡度在
27°—35°之间,泥沙的运输和营养物流失最为明显;
坡度超过 35°之后,坡度因子的影响开始趋于平稳.
这是因为地表径流随着坡度的增加会逐渐增大,对
泥沙的侵蚀作用更明显,同时造成营养物的流失增
多;当坡度大于 35°之后,土地主要被森林覆盖,减
弱了降雨对泥沙的侵蚀,减少了营养物的流失.
不同土地利用方式对总氮的贡献率接近高程的
3倍,水田和旱地为氮营养物流失的主要来源,其次
为居民用地;同时,这 3种土地利用类型为人类活动
影响最大的地区.人类主要通过使用氮肥,排放大量
的氮污染物到环境中,对环境造成负面影响.土地利
用类型为泥沙和总磷输出量的第二大影响因子,其
中旱地影响最大,这是由于旱地受人类农耕活动的
影响,水土保持能力最差,而人类使用的磷随着水土
流失而进入河道,导致严重的水体污染.不同的土地
利用类型对非点源污染的影响各不相同,其中有林
地、草地和灌木丛可以减少泥沙和总磷输出,具有较
强的水土保持能力,因此增加地表的植被覆盖度能
有效地减少环境的非点源污染.
高程为总氮输出的第二大影响因子.随着高程
的增加,对总氮负荷的影响减小,这主要与地形特征
有关.在汎河流域,平原地势平缓,海拔较低,以耕地
为主;而林地主要位于海拔较高的山区,土地的覆盖
类型对总氮的输出起着十分重要的作用.更重要的
是,人类活动主要集中在低海拔地区.虽然高程因子
对这 3种污染物相对贡献比例没有太大的差别,但
该因子对泥沙和总磷的边际效应均在 290 m左右出
现峰值,然后急剧下降,到 330 m 左右达到平稳状
态.本研究进一步发现,高程为 290 m 的区域为主要
支流集水区,河岸两边的土壤易受河流的侵蚀,泥沙
中携带大量的磷随河道向下转移.
在影响泥沙和总磷输出的因子中,土壤类型的
相对重要性最小.各种土壤类型的边际效应从高到
低依次为草甸土、褐色土、水稻土、棕壤和潮棕壤.土
壤侵蚀度用于表征土壤抗侵蚀的能力,与土壤自身
的特征有关[36] .通常,土壤的下渗速率越快,有机质
含量越高,其抵抗侵蚀的能力就越强.与黏土相比,
砂土和壤土具有更高的抗侵蚀性.经常实施耕作的
土壤有机质含量低,导致其易侵蚀度增加.另外,汎
河流域中棕壤的面积占到总面积的 70%,而潮棕壤
面积不到总面积的 1%,使得潮棕壤在流域中的代
表性减小.在影响总氮输出的因子中,土壤类型的相
对重要性排在第三,其中褐色土的边际效应最高,是
造成氮流失最重要的土壤类型.
非点源污染的产生是自然过程和人类活动共同
作用的结果.泥沙和磷的流失主要与自然过程有关,
而氮的流失却十分依赖人类活动.人类活动能够产
生非点源污染,也可以通过合理安排人类活动,管理
和控制非点源污染的产生,达到减缓和治理非点源
污染的目的.对污染源的控制和管理可考虑如下策
略:1)减少氮肥的使用量,避免其过多流入环境中;
2)改进农田耕作措施,尽量避免在坡度较陡的地区
种植作物;3)增加土地的植被覆盖度;4)在河岸两
边加强水土保持措施.
农田产生的总氮居于首位,控制农耕过程中产
生的氮流失是非常必要的.氮是大多数植物生长所
7193期                        尹  才等: 基于增强回归树的流域非点源污染影响因子分析           
需的关键限制性元素,然而随施肥进入环境中的大
量氮素对环境产生了严重的负面效应,已有研究表
明,一定范围内减少氮肥的施用量不会降低作物产
量,高效的施肥策略可以达到经济及环境的共
赢[37] .
本研究结果表明,在坡度大 27°以后,农田产生
的泥沙及总氮、总磷流失量增加尤为显著.建议在大
于 25°以上坡面,按照国家有关规定退耕、植树种
草;耕地短缺、退耕确有困难的,应当修建梯田或者
采取其他水土保持措施.
有林地产生的泥沙及总氮、总磷均处于较低水
平,在无植被和低植被覆盖区,土壤侵蚀量显著增
加,最有效的方法是减少裸地,增加有林地,利用植
被冠层截流作用,避免雨水对地表土壤的直接侵蚀.
建设河岸缓冲带是减缓非点源污染、保护水质
行之有效的措施之一[38-39] .在进行水体防护措施
时,应适当考虑河岸缓冲带的设计,设置保护措施,
通过一系列的物理、化学和生物效应来运移和削减
泥沙及非点源污染.
4  结    论
在汎河流域,坡度与载体泥沙、总氮和总磷均呈
正相关关系(P<0.01),对泥沙和总磷有显著影响,
其贡献率分别为 46.5%、38.2%;土地利用类型对泥
沙、总氮和总磷的负荷量均有重要影响,其贡献率分
别达到 27.2%、62.1%和 35.3%;高程较低、坡度较缓
的耕地易产生较高的总磷负荷量;褐色土壤最易流
失总磷,而草甸土易流失总磷,且易受泥沙侵蚀.非
点源污染的控制和管理有较强的复杂性,通过环境
因子的相互组合来更好地控制泥沙及非点源污染是
今后值得研究的问题.
BRT方法能够有效定量研究非点源污染的各
影响因子的贡献量.BRT 模型具有自变量无需做额
外处理、考虑到了自变量和因变量之间的复杂非线
性关系和可以得到精确定量化的回归结果等的优
点,因此 BRT方法适合用来定量分析非点源污染及
其影响因子之间的复杂非线性关系.
参考文献
[1]  He C⁃H (贺缠生), Fu B⁃J (傅伯杰), Chen L⁃D (陈
利顶). Non⁃point source pollution control and manage⁃
ment. Environmental Science (环境科学), 1998, 19
(5): 88-92, 97 (in Chinese)
[2]  Griffith JA. Geographic techniques and recent applica⁃
tions of remote sensing to landscape⁃water quality stu⁃
dies. Water, Air, and Soil Pollution, 2002, 138: 181-
197
[3]  Jin J⁃L (金婧靓), Wang F⁃E (王飞儿), Dai L⁃Y (戴
露莹), et al. Characteristics of non⁃point source pollu⁃
tion in Tiaoxi watershed and related affecting factors.
Chinese Journal of Applied Ecology (应用生态学报),
2011, 22(8): 2119-2125 (in Chinese)
[4]  Yang A⁃L (杨爱玲), Zhu Y⁃M (朱颜明). The study
of non⁃point source pollution of surface water environ⁃
ment. Advances in Environmental Science (环境科学进
展), 1999, 7(5): 60-67 (in Chinese)
[5]  Bacic ILZ, Rossiter DG, Bregt AK. Using spatial infor⁃
mation to improve collective understanding of shared en⁃
vironmental problems at watershed level. Landscape and
Urban Planning, 2006, 77: 54-66
[6]  Graf A, Bogena HR, Drüe C, et al. Spatiotemporal rela⁃
tions between water budget components and soil water
content in a forested tributary catchment. Water Re⁃
sources Research, 2014, 50: 4837-4857
[7]  Rui X⁃F (芮孝芳), Liang X (梁  霄). Present situa⁃
tion and future of hydrology. Advances in Science and
Technology of Water Resources (水利水电科技进展),
2011, 31(2): 1-4 (in Chinese)
[8]  Chahor Y, Casali J, Gimenez R, et al. Evaluation of the
AnnAGNPS model for predicting runoff and sediment
yield in a small Mediterranean agricultural watershed in
Navarre ( Spain ). Agricultural Water Management,
2014, 134: 24-37
[9]  Zhang Z⁃Y (张展羽), Si H (司  涵), Kong L⁃L (孔
莉莉). Migration of non⁃point source nitrogen and phos⁃
phorus in small watershed based on SWAT model. Transa⁃
ctions of the Chinese Society of Agricultural Engineering
(农业工程学报), 2013, 29(2): 93-100 (in Chinese)
[10]  Liu M⁃B (刘梅冰), Chen X⁃W (陈兴伟), Chen Y
(陈  莹). Multiple time scales analysis of spatial dif⁃
ferentiation characteristics of non⁃point source nitrogen
loss within watershed. Chinese Journal of Applied
Ecology (应用生态学报), 2015, 26(7): 2183-2191
(in Chinese)
[11]  Ma G⁃W (马广文), Wang S⁃R (王圣瑞), Wang Y⁃Y
(王业耀), et al. Temporal and spatial distribution
characteristics of nitrogen and phosphorus and diffuse
source pollution load simulation of Poyang Lake Basin.
Acta Scientiae Circumstantiae (环境科学学报), 2015,
35(5): 1285-1291 (in Chinese)
[12]  Chang C⁃L, Lin Y⁃T. Using the VIKOR method to eva⁃
luate the design of a water quality monitoring network in
a watershed. International Journal of Environmental Sci⁃
ence and Technology, 2014, 11: 303-310
[13]  Kaiglova J, Langhammer J. Analysis of efficiency of pol⁃
lution reduction measures in rural basin using MIKE Ba⁃
sin model. Case study: Olsava River Basin. Journal of
Hydrology and Hydromechanics, 2014, 62: 43-54
[14]  Luo Y⁃X (罗运祥), Su B⁃L (苏保林), Yang W⁃Z
(杨武志), et al. Identification and assessment of non⁃
point source pollution in the Chaihe reservoir catchment
using SWAT. Journal of Beijing Normal University
(Natural Science) (北京师范大学学报:自然科学
版), 2012, 48(5): 510-514 (in Chinese)
[15]  Geng R⁃Z (耿润哲), Wang X⁃Y (王晓燕), Duan S⁃H
(段淑怀), et al. A tool for estimating best management
practices effectiveness for agricultural non⁃point source
pollution control based on the MS ACCESS. Acta Scienti⁃
ae Circumstantiae (环境科学学报), 2013, 33(12):
819 应  用  生  态  学  报                                      27卷
3292-3300 (in Chinese)
[16]  Aslan A, Trauth KM. Development and demonstration of
a gis⁃based cumulative effectiveness approach to buffer
design and evaluation. Journal of Irrigation and Drai⁃
nage Engineering, 2014, 140: 575-575
[17]  Chen L, Zhong Y, Wei G, et al. Development of an in⁃
tegrated modeling approach for identifying multilevel
non⁃point⁃source priority management areas at the water⁃
shed scale. Water Resources Research, 2014, 50: 4095-
4109
[18]  Neshat A, Pradhan B, Dadras M. Groundwater vulnera⁃
bility assessment using an improved DRASTIC method in
GIS. Resources Conservation and Recycling, 2014, 86:
74-86
[19]  Wilkinson SN, Dougall C, Kinsey⁃Henderson AE, et al.
Development of a time⁃stepping sediment budget model
for assessing land use impacts in large river basins. Sci⁃
ence of the Total Environment, 2013, 468: 1210-1224
[20]  Yu W⁃J (余文君), Nan Z⁃T (南卓铜), Zhao Y⁃B
(赵彦博), et al. Improvement of snowmelt implementa⁃
tion in the SWAT hydrologic model. Acta Ecologica Sini⁃
ca (生态学报), 2013, 33(21): 6992-7001 (in Chi⁃
nese)
[21]  Wei C (魏  冲), Song X (宋   轩), Chen J (陈  
杰). Sensitivity analysis of swat model on changes of
landscape pattern: A case study from Lao Guanhe Wa⁃
tershed in Danjiangkou Reservoir area. Acta Ecologica
Sinica (生态学报), 2014, 34(2): 517-525 ( in Chi⁃
nese)
[22]  Yuan Y⁃Z (袁宇志), Zhang Z⁃D (张正栋), Meng J⁃
H (蒙金华). Impact of changes in land use and climate
on the runoff in Liuxihe watershed based on SWAT
model. Chinese Journal of Applied Ecology (应用生态学
报), 2015, 26(4): 989-998 (in Chinese)
[23]  Li C⁃L (李春林), Hu Y⁃M (胡远满), Liu M (刘 
淼), et al. Urban non⁃point source pollution: Research
progress. Chinese Journal of Ecology (生态学杂志),
2013, 32(3): 492-500 (in Chinese)
[24]  Hao F⁃H (郝芳华), Chen L⁃Q (陈利群), Liu C⁃M
(刘昌明), et al. Impact of land use change on runoff
and sediment yield. Journal of Soil and Water Conserva⁃
tion (水土保持学报), 2004, 18(3): 5-8 ( in Chi⁃
nese)
[25]  Zhang X⁃S (张雪松), Hao F⁃H (郝芳华), Yang Z⁃F
(杨志峰), et al. Runoff and sediment yield modeling in
meso⁃scale watershed based on SWAT model. Research
of Soil and Water Conservation (水土保持研究),
2003, 10(4): 38-42 (in Chinese)
[26]  Hu X⁃T (胡雪涛), Chen J⁃N (陈吉宁), Zhang T⁃Z
(张天柱 ). A study on non⁃point source pollution
models. Environmental Science (环境科学), 2002, 23
(3): 124-128 (in Chinese)
[27]  Gorgan D, Bacu V, Mihon D, et al. Grid based calibra⁃
tion of SWAT hydrological models. Natural Hazards and
Earth System Science, 2012, 12: 2411-2423
[28]  Liu M, Hu Y, Zhang W, et al. Application of land⁃use
change model in guiding regional planning: A case study
in Hun⁃Taizi River watershed, Northeast China. Chinese
Geographical Science, 2011, 21: 609-618
[29]  Zhu J⁃J (朱君君), Hu Y⁃M (胡远满), Liu M (刘 
淼), et al. Landscape change and its driving forces in
Hun⁃Tai river basin. Chinese Journal of Ecology (生态
学杂志), 2011, 30(1): 112-118 (in Chinese)
[30]  Elith J, Leathwick JR, Hastie T. A working guide to
boosted regression trees. Journal of Animal Ecology,
2008, 77: 802-813
[31]  Parisien MA, Moritz MA. Environmental controls on the
distribution of wildfire at multiple spatial scales. Ecologi⁃
cal Monographs, 2009, 79: 127-154
[32]  Nash JE, Sutcliffe JV. River flow forecasting through
conceptual models part I : A discussion of principles.
Journal of Hydrology, 1970, 10: 282-290
[33]  Moriasi DN, Arnold JG, Van Liew MW, et al. Model
evaluation guidelines for systematic quantification of ac⁃
curacy in watershed simulations. Transactions of the
American Society of Agricultural and Biological Engi⁃
neers, 2007, 50: 885-900
[34]  Castillo CR, Guneralp I, Guneralp B. Influence of chan⁃
ges in developed land and precipitation on hydrology of a
coastal Texas watershed. Applied Geography, 2014, 47:
154-167
[35]  Xiao Y (肖  洋), Lu Q (陆  奇), Cheng H⁃K (成
浩科), et al. Surface properties of sediments and its
effect on phosphorus adsorption. Journal of Sediment Re⁃
search (泥沙研究), 2011(6): 64-68 (in Chinese)
[36]  Bermudez⁃Couso A, Fernandez⁃Calvino D, Alvarez⁃Enjo
MA, et al. Pollution of surface waters by metalaxyl and
nitrate from non⁃point sources. Science of the Total Envi⁃
ronment, 2013, 461: 282-289
[37]  Good AG, Beatty PH. Fertilizing Nature: A Tragedy of
Excess in the Commons. PLoS Biology, 2011, 9(8):
e1001124
[38]  Wang L⁃M (王良民), Wang Y⁃H (王彦辉). Research
and application advances on vegetative filter strip. Chi⁃
nese Journal of Applied Ecology (应用生态学报),
2008, 19(9): 2074-2080 (in Chinese)
[39]  Wang Q⁃C (王庆成), Yu H⁃L (于红丽), Yao Q (姚
琴), et al. Retaining and transform action of incoming
soil N from highland to adjacent terrestrial water body in
riparian buffer zone. Chinese Journal of Applied Ecology
(应用生态学报), 2007, 18(11): 2611 - 2617 ( in
Chinese)
作者简介  尹  才, 男, 1990 年生, 硕士研究生.主要从事
流域非点污染模拟及其评价管理研究. E⁃mail: shues_cyin@
163.com
责任编辑  肖  红
尹才, 刘淼, 孙凤云, 等. 基于增强回归树的流域非点源污染影响因子分析. 应用生态学报, 2016, 27(3): 911-919
Yin C, Liu M, Sun F⁃Y, et al. Influencing factors of non⁃point source pollution of watershed based on boosted regression tree algo⁃
rithm. Chinese Journal of Applied Ecology, 2016, 27(3): 911-919 (in Chinese)
9193期                        尹  才等: 基于增强回归树的流域非点源污染影响因子分析