以采取植被恢复措施的陕西省吴起县为研究区,实地采集24个土壤剖面不同层次的黄绵土土样100个,在进行土壤样本全氮(TN)和碱解氮(AHN)含量及实验室反射光谱数据测量和分析的基础上,用相关分析(CA)结合偏最小二乘回归(PLS)方法建立黄绵土土壤TN和AHN含量的校正模型,并用独立样本对校正模型进行验证.结果表明: 利用6种光谱变换方式建立的校正模型中,微分光谱建立的校正模型是预测研究区土壤TN含量的最佳模型,校正和验证R2分别为0.929和0.935,均方根误差(RMSE)分别为0.045和0.047 g·kg-1,相对预测偏差(RPD)为3.12;而归一化变换建立的校正模型是预测土壤AHN含量的最佳模型,校正和验证R2分别为0.873和0.773,RMSE分别为9.946和16.204 mg·kg-1,RPD为1.538.所建立的全氮预测模型可以对0~40 cm土层的TN进行有效预测,而碱解氮的预测模型对同一深度只能进行粗略预测.本研究为采取植被恢复措施的退化生态系统区黄绵土土壤全氮的快速预测提供了一种较好的方法,但是对于碱解氮的准确、快速预测,需要进一步研究.
Wuqi County of Shaanxi Province, where the vegetation recovering measures have been carried out for years, was taken as the study area. A total of 100 loess samples from 24 different profiles were collected. Total nitrogen (TN) and alkali hydrolysable nitrogen (AHN) contents of the soil samples were analyzed, and the soil samples were scanned in the visible/nearinfrared (VNIR) region of 350-2500 nm in the laboratory. The calibration models were developed between TN and AHN contents and VNIR values based on correlation analysis (CA) and partial least squares regression (PLS). Independent samples validated the calibration models. The results indicated that the optimum model for predicting TN of loess was established by using first derivative of reflectance. The best model for predicting AHN of loess was established by using normal derivative spectra. The optimum TN model could effectively predict TN in loess from 0 to 40 cm, but the optimum AHN model could only roughly predict AHN at the same depth. This study provided a good method for rapidly predicting TN of loess where vegetation recovering measures have been adopted, but prediction of AHN needs to be further studied.
全 文 :基于相关分析和偏最小二乘回归的黄绵土
土壤全氮和碱解氮含量的高光谱预测∗
刘秀英1,2 王 力1 常庆瑞1∗∗ 王晓星1 尚 艳1
( 1西北农林科技大学资源环境学院, 陕西杨凌 712100; 2河南科技大学农学院, 河南洛阳 471003)
摘 要 以采取植被恢复措施的陕西省吴起县为研究区,实地采集 24 个土壤剖面不同层次
的黄绵土土样 100个,在进行土壤样本全氮(TN)和碱解氮(AHN)含量及实验室反射光谱数
据测量和分析的基础上,用相关分析(CA)结合偏最小二乘回归(PLS)方法建立黄绵土土壤
TN和 AHN含量的校正模型,并用独立样本对校正模型进行验证.结果表明: 利用 6 种光谱变
换方式建立的校正模型中,微分光谱建立的校正模型是预测研究区土壤 TN含量的最佳模型,
校正和验证 R2分别为 0.929和 0.935,均方根误差(RMSE)分别为 0.045和 0.047 g·kg-1,相对
预测偏差(RPD)为 3.12;而归一化变换建立的校正模型是预测土壤 AHN含量的最佳模型,校
正和验证 R2分别为 0.873和 0.773,RMSE 分别为 9.946 和 16.204 mg·kg-1,RPD 为 1.538.所
建立的全氮预测模型可以对 0~40 cm土层的 TN进行有效预测,而碱解氮的预测模型对同一
深度只能进行粗略预测.本研究为采取植被恢复措施的退化生态系统区黄绵土土壤全氮的快
速预测提供了一种较好的方法,但是对于碱解氮的准确、快速预测,需要进一步研究.
关键词 黄绵土; 全氮; 碱解氮; 高光谱; 植被恢复
文章编号 1001-9332(2015)07-2107-08 中图分类号 S153.6 文献标识码 A
Prediction of total nitrogen and alkali hydrolysable nitrogen content in loess using hyperspec⁃
tral data based on correlation analysis and partial least squares regression. LIU Xiu⁃ying1,2,
WANG Li1, CHANG Qing⁃rui1, WANG Xiao⁃xing1, SHANG Yan1 ( 1 College of Resources and
Environment, Northwest A&F University, Yangling 712100, Shaanxi, China; 2College of Agrono⁃
my, Henan University of Science and Technology, Luoyang 471003, Henan, China) . ⁃Chin. J.
Appl. Ecol., 2015, 26(7): 2107-2114.
Abstract: Wuqi County of Shaanxi Province, where the vegetation recovering measures have been
carried out for years, was taken as the study area. A total of 100 loess samples from 24 different pro⁃
files were collected. Total nitrogen (TN) and alkali hydrolysable nitrogen (AHN) contents of the
soil samples were analyzed, and the soil samples were scanned in the visible / near⁃infrared (VNIR)
region of 350-2500 nm in the laboratory. The calibration models were developed between TN and
AHN contents and VNIR values based on correlation analysis (CA) and partial least squares regres⁃
sion (PLS). Independent samples validated the calibration models. The results indicated that the
optimum model for predicting TN of loess was established by using first derivative of reflectance. The
best model for predicting AHN of loess was established by using normal derivative spectra. The opti⁃
mum TN model could effectively predict TN in loess from 0 to 40 cm, but the optimum AHN model
could only roughly predict AHN at the same depth. This study provided a good method for rapidly
predicting TN of loess where vegetation recovering measures have been adopted, but prediction of
AHN needs to be further studied.
Key words: loess; total nitrogen; alkali hydrolysable nitrogen; hyperspectrum; vegetation recove⁃
ring.
∗国家高技术研究发展计划项目 ( 2013AA102401⁃2)、国家科技支撑计划项目 ( 2012BAH29B04⁃00 ) 和河南省科技攻关计划项目
(132102110210)资助.
∗∗通讯作者. E⁃mail: changqr@ nwsuaf.edu.cn
2014⁃08⁃20收稿,2015⁃03⁃05接受.
应 用 生 态 学 报 2015年 7月 第 26卷 第 7期
Chinese Journal of Applied Ecology, Jul. 2015, 26(7): 2107-2114
土壤学理论和生态建设工程实践证明,严重退
化生态系统植被恢复重建的环境效应在一定程度上
取决于重建过程中土壤的形成发育和质量状况[1]、
及其土壤与植物之间的相互作用与协调关系.因此,
在植被恢复过程中了解土壤质量状况即土壤肥力的
基本特征及其变化,对于评估退化生态系统恢复重
建的功能与效益以及探讨不同植被恢复方案所产生
的环境效应差异非常重要.
土壤氮素水平不仅是衡量和表征土壤肥力特征
的重要指标,也是决定植株氮素营养水平的关键因
素,因此,如何实时、快速、无损、准确获取土壤的氮
素含量及其变化对评估植被恢复方案所产生的环境
效应差异极其重要.传统的土壤氮素含量测定方法
采用实验室化学法,此方法虽然相对准确,但通常比
较费时、费工、有害或有污染,且难以在野外直接测
定.高光谱遥感波段多、分辨率高,具有定量获取土
壤养分含量的研究潜力[2-4],现已成为一种非损伤
的、快速检测土壤养分含量的新方法[5] .
光谱数据应用于土壤氮素含量估测开始于 20
世纪 80 年代.近几年来,土壤氮素的定量遥感估测
已成为土壤学和遥感技术方面研究较多的内容之
一[6] .国内许多研究表明,可见光⁃近红外光谱在估
算黑土、紫色土、红壤、水稻土和潮土等土壤氮素时
比较成功,反演精度较高[7-10] .如李伟等[8]运用 PLS
和 ANN 方法成功地建立了黑土土壤碱解氮等的近
红外光谱预测分析模型.卢艳丽等[9]对光谱进行不
同的变换或组合,建立了黑土土壤全氮的预测模型,
模型的预测精度较高.徐丽华等[10]用偏最小二乘回
归方法建立了紫色土土壤全氮和全磷含量的预测模
型,对全氮含量的预测具有一定可行性,但对全磷含
量的预测效果较差.现有研究表明,在利用可见光⁃
近红外光谱技术对土壤氮素进行定量遥感估测时,
不同土壤类型利用的波段或波段范围是有差异
的[2,4,7-14],并且大多选择耕作区作为研究区
域[7-9,13-14] .如吴明珠等[12]研究表明,亚热带红壤全
氮的敏感光谱波段为:可见光 634 ~ 688 nm 和红外
872、873、1414、1415 nm. Dalal 等[13]用近红外光谱
1744、1870和 2052 nm 波段的反射率有效地估测了
耕作区多种土壤类型全氮的含量.He 等[14]利用近
红外光谱技术对耕作区土壤氮素等营养成分进行了
预测.在分析方法方面,目前许多研究都以偏最小二
乘方法构建土壤属性预测模型[4,8,10,15-16] .如陈红艳
等[15]以潮土为研究对象,采用 DWT⁃GA⁃PLS方法对
土壤碱解氮含量进行高光谱估测,取得了较好的预
测效果.栾福明等[16]采用小波分析结合 PLS 建立了
碱化土壤碱解氮含量的高光谱反演模型,反演精度
较高.迄今,利用可见光⁃近红外光谱技术对土壤氮
素进行定量遥感估测时,较少有研究以采取植被恢
复方案的生态系统退化严重的特殊区域的黄绵土作
为研究对象,利用 CA+PLS 方法构建土壤氮素预测
模型.
本研究选择陕西省吴起县为研究区,以黄绵土
为研究对象,室内测定土壤样本全氮和碱解氮含量
及样本的高光谱反射率,对不同变换形式的光谱与
全氮和碱解氮进行相关分析,找出预测黄绵土全氮
和碱解氮的敏感波段;并建立不同变换形式光谱与
土壤全氮和碱解氮含量的预测模型,比较不同光谱
变换对土壤全氮和碱解氮含量预测精度的影响;探
讨预测模型对 0~40 cm 和>40 cm 深度土壤全氮和
碱解氮预测的效果;总结不同类型土壤全氮和碱解
氮预测的通用波段,以期为采取植被恢复措施的生
态系统退化区域的黄绵土土壤氮素快速获取提供技
术支撑,为评价不同植被恢复方案所产生的环境效
应差异提供参考.
1 研究地区与研究方法
1 1 研究区概况
吴起县(36°33′33″—37°24′27″ N,107°28′57″—
108°32′49″ E)位于黄土高原北部的陕西省延安市
西北部,土壤类型为黄绵土,海拔 1233 ~ 1809 m,东
西宽 79.89 km,南北长 93.64 km.吴起县是半湿润气
候与干旱气候的过渡区,生态系统退化严重且形式
多样,长期采取不同植被恢复措施,是研究退化生态
系统恢复重建的理想地区.根据该区地域分异特点,
将全县分为大致均匀的 9 个区域,在每个区域依据
植被类型、造林方式、生长年限和地貌类型等差异,
选择典型样区,然后在该区的典型地点进行采样.共
选取 24个土壤剖面不同层次(0 ~ 5 和 5 ~ 20 或 0 ~
20、以及 20~40、40 ~ 60、60 ~ 100 cm)的 107 个土壤
样本作为本研究的样本,剔除有明显误差的 7 个样
本,余下 100个有效样本.随机选取 60 个样本用于
建模,40个样本用于模型验证.通过对本研究的土
壤样本统计分析发现,40 cm 以下土壤全氮和碱解
氮急剧减少.因此,本文以 40 cm 深度为界,选择预
测效果较好的模型对 40个验证样本分 0 ~ 40 cm 和
>40 cm深度两个土层进行预测.样品经风干、研磨
并通过 1 mm 孔筛后,采用四分法取样,一式两份,
一份用于实验室全氮含量和碱解氮含量的化学测
8012 应 用 生 态 学 报 26卷
定,另一份用于土壤光谱的测定.
1 2 测量方法
1 2 1土壤全氮和有效氮含量的测定 土壤全氮
(TN,g·kg-1)含量采用凯氏定氮法测定[17];碱解氮
(AHN,mg·kg-1)含量用碱解扩散法测定[17] .
1 2 2土壤反射率测量 土壤反射率采用 SVC HR⁃
1024i便携式光谱仪测定,光谱范围 350 ~ 2500 nm.
将处理好的土样置于直径 10 cm 的容器中,装满后
将土壤表面刮平,进行室内光谱测量.光谱测量用 4°
视场角的光纤探头,探头距土壤样本表面 15 cm;光
源为能够提供平行光的 50 W 卤素灯,距土壤表面
30 cm,光源天顶角为 15°.由于土壤表面平整状况和
土样本身组成物质的结构可能引起光谱各向异性的
情况,测量时水平转动被试样品 3 次,每次约 90°,
测试土样 4个方向的光谱曲线,每个方向测定 3 条
样本线,共 12条样本线,去掉异常线后取平均作为
该土样的光谱反射率值,并以白色参考板获取相对
反射率.
1 3 数据处理
1 3 1高光谱数据处理 本研究选用 400 ~ 2450 nm
间的光谱曲线[15] .由于光谱仪各波段对能量响应的
差异,使得光谱曲线上存在一些噪声,因此,首先将
原始光谱进行重采样,得到 10 nm 间隔的光谱反射
率[18],然后对数据分别进行 9点移动平均和 Savitzky⁃
Golay平滑、多元散射校正(MSC)、基线偏移(BOC)等
预处理,与移动平均相比其他方法对预测效果没有明
显改善,因此,选取移动平均平滑处理后的光谱进行
多种数学变换[19]:均值光谱(R)倒数取对数[log(1 /
R)]、均值光谱归一化[N(R)],然后对均值光谱、倒
数对数光谱、归一化光谱分别进行一阶微分,得到
dR、d[log(1 / R)]、d[N(R)],共 6种不同的光谱变换
形式.相对于 R的 6种变换方法包括:
1)均值光谱.R =
r1
n
,
r2
n
,…,
rn
n
æ
è
ç
ö
ø
÷ ,式中,n 为波
段数.
2)对 R 的倒数取对数变换. log(1 / R)= [ log(1 /
R1),log(1 / R2),…,log(1 / Rn)].
3)对 R 的归一化变换. N(R) = (
R1
∑R i / n
,
R2
∑R i / n
,…,
Rn
∑R i / n
) ,用各波段平均值做分母以
免变换后的值太小.
4)对 R 的一阶微分变换. d(R) = (
R3 - R1
Δλ
,
R4 - R2
Δλ
,…,
Rn - Rn-2
Δλ
) ,式中,Δλ为两倍波段宽.
5)对 log(1 / R)的一阶微分变换,d[log(1 / R)].
6)对 N(R)的一阶微分变换,d[N(R)].
1 3 2数据分析方法 数据分析采用偏最小二乘回
归法(PLS).PLS集主成分、典型相关和多元线性回
归分析 3种分析方法的优点,能够利用所有有效的
数据构建模型,提取出反映数据变异的最大信息,具
有良好的预测功能[20],特别适合处理各变量内部高
度线性相关的数据[16] .很多研究者采用此方法构建
光谱与土壤属性的预测模型[4,10,15-16,21] .本研究对全
氮和碱解氮建立校正模型时,先采用相关分析(CA)
对光谱数据进行降维,减少冗余信息,然后结合 PLS
算法(PLS1)建立校正模型,这样既可以保留绝大部
分有用信息,又可以提高运算速度、简化方程,然后
用独立样本对模型进行验证.建模过程中采用交叉
验证(full cross validation)确定主成分的个数,模型
的预测精度采用预测值和实际值的判断系数(R2)、
均方根误差(RMSE)和相对预测偏差(RPD)来衡
量[7,15,21] .其计算过程借助 Unscrambler 9. 7(CAMO
ASA,Trondheim,Norway)软件完成.
计算 RPD值的目的是为了解释每一个模型的
预测能力,RPD的评价标准采用 Chang等[22]提出的
阈值划分方法,RPD>2.0 表明模型是稳定的、准确
的;1.4<RPD<2.0表示是可以接受的模型,并可以改
进;RPD<1.4表明模型的预测能力很差.一个好的预
测模型应该有大的 R2和 RPD,小的 RMSE[4] .
R2 =∑
n
1
( y^i - y) 2 /∑
n
1
(yi - y) 2 (1)
RMSE = ∑
n
1
( y^i - yi) 2 / n (2)
RPD=SDv / RMSEv n / (n-1) (3)
式中:y^是预测值;y是观测值的均值;y 是观测值;n
是样本数量,用 i = 1,2,…,n 表示;SDv 是验证集的
标准偏差;RMSEv 是验证集的均方根误差.
2 结果与分析
2 1 样本土壤氮含量状况
由表 1 可以看出,研究区土壤全氮含量的变化
范围是 0.10~1.09 g·kg-1,标准差为 0.179 g·kg-1;
碱解氮含量的变化范围是 11.45 ~ 149.84 mg·kg-1,
标准差为 30.651 mg·kg-1 .该区全氮和碱解氮含量
偏低,明显低于其他地区[7-8,15] .全氮的校正集和验
证集的土壤样本的统计指标与整体样本较一致,而
90127期 刘秀英等: 基于相关分析和偏最小二乘回归的黄绵土土壤全氮和碱解氮含量的高光谱预测
表 1 土壤样本的总氮和碱解氮含量的统计描述
Table 1 Descriptive statistic of total nitrogen and alkali
hydrolysable nitrogen content in measured soil samples
土壤氮
Soil
nitrogen
土层深度
Soil
depth
(cm)
样本数
Number
of samples
均值
Mean
标准差
Standard
deviation
最小值
Minimum
最大值
Maximum
全氮 0~100 100 0.371 0.179 0.10 1.09
TN 0~100 60 0.383 0.199 0.20 1.09
(g·kg-1) 0~100 40 0.355 0.145 0.10 0.85
0~40 21 0.467 0.206 0.20 0.87
>40 19 0.281 0.111 0.10 0.53
碱解氮 0~100 100 45.359 30.651 11.45 149.84
AHN 0~100 60 47.176 34.219 11.45 149.84
(mg·kg-1) 0~100 40 42.634 24.509 11.82 113.88
0~40 21 58.880 37.810 17.60 149.84
>40 19 24.898 12.400 11.45 48.58
TN: Total nitrogen; AHN: Alkali hydrolysable nitrogen. 下同 The same below.
碱解氮验证集的范围、标准差与校正集和整体样本
相差较大.0~ 40 cm 土壤全氮和碱解氮的含量明显
高于 40 cm以下土壤,几乎相差 1倍.
2 2 土壤的光谱特征及特征波段的选择
由黄绵土各剖面不同层次土壤样本的原始平均
光谱曲线(图 1)可以看出,供试土壤光谱曲线形态
相似;除 20~40 cm土层外,土壤剖面从上到下各土
层光谱反射率有依次增大的趋势,这与彭杰等[23]的
研究结论相似;0~5 cm土层光谱反射率在整个波段
范围明显减小,与 5 cm以下土层土壤光谱反射率相
差较大;在可见光区,不同层土壤的光谱反射率总体
变化比较平缓,呈上升趋势;进入近红外波段后,在
1400、1900、2200 nm 处有明显的吸收谷,即水分吸
收带.
对土壤全氮和碱解氮与反射光谱的不同变换形
式之间进行相关分析,将具有最大相关系数的波段
列于表 2.不同变换形式光谱与全氮的最大相关系数
分别位于可见光区的610、670、690 nm处,近红外区
图 1 土壤剖面不同层的平均光谱曲线
Fig.1 Average spectral curves of soil profile samples of diffe⁃
rent layers.
表 2 不同土壤光谱反射率变换形式与土壤全氮和碱解氮
含量相关系数的峰值及其波段位置
Table 2 Peak value and band position of the correlation
coefficients between different spectrum transformation and
soil total nitrogen and alkali hydrolysable nitrogen content
光谱变换
Spectrum
transform
全氮 TN
最大相关系数
Maximum
correlation
coefficient
波段位置
Band
position
(nm)
碱解氮 AHN
最大相关系数
Maximum
correlation
coefficient
波段位置
Band
position
(nm)
R 0.656 710 0.554 640
d(R) 0.718 1450 0.594 2170
N(R) 0.715 670 0.470 1420
d[N(R)] 0.715 2240 0.503 2240
log(1 / R) 0.633 610 0.549 1980
d[log(1 / R)] 0.670 690 0.503 2230
R: 光谱反射率 Spectrum reflectance. 下同 The same below.
的 710、1450和 2240 nm处;而与碱解氮的最大相关
系数分别位于可见光区的 640 nm 和近红外区的
1420、1980、2170、2230和 2240 nm处.具有最大相关
系数的波段通常作为预测土壤全氮和碱解氮的敏感
波段.从全氮的相关系数来看,除 log(1 / R)的相关系
数比 R 小之外,其他的变换形式与全氮的相关系数
都增大,相关性得到增强;对于碱解氮,除微分变换
d(R)对相关性有所提高之外,其他变换形式未能改
善与碱解氮的相关关系.从而说明对于不同的土壤
属性,应该对反射光谱采取不同的变换,以提高两者
之间的相关关系.表 3 列出了土壤全氮和碱解氮与
反射光谱的不同变换形式具有的最大相关系数对应
的前 70个波段,这些波段包括了前人用于预测土壤
氮素的最佳波段[7,9,13],因此,选取表 3 中相关系数
较大的 70个波段用于下一步建立全氮和碱解氮的
预测模型,以达到保留最多有用信息,同时又对数据
进行降维、简化方程的目的.
2 3 土壤全氮和碱解氮的预测
由表 4 可以看出,对于全氮来说,均值光谱 R
构建的校正模型的判断系数最大(0.948),校正均方
根误差(RMSEc)最小,为 0.039 g·kg-1,内部交叉
验证的结果为 R2 = 0. 877,交叉验证均方根误差
(RMSEcv)为 0.061 g·kg-1,但是选择的主成分数最
多,为 12个;归一化微分 d[N(R)]构建的校正模型
选择的主成分数较少,仅为 6,但校正模型的判断系
数和交叉验证模型的判断系数均最小,分别为
0 888 和 0.807,而且 RMSEc最大,为 0.057 g·kg-1,
因此,这两个模型都不是最优.微分光谱变换 d(R)
构建模型时选择的主成分数为 7,其校正和内部交
叉验证的判断系数均较高,分别为 0.929 和 0.884,
而 均方根误差均较低 ,分别为 0 045和 0 059
0112 应 用 生 态 学 报 26卷
表 3 不同土壤光谱反射率变换形式与土壤全氮和碱解氮含量前 70个较大的相关系数的波段
Table 3 Bands of the biggest 70 correlation coefficients between different spectrum transformation and soil total nitrogen
and alkali hydrolysable nitrogen content
光谱变换
Spectrum transform
全氮(TN)的 70个最大相关系数波段
Bands of the biggest 70 correlation coefficients (nm)
碱解氮(AHN)的 70个最大相关系数波段
Bands of the biggest 70 correlation coefficients (nm)
R 400~860、970~1070、1400~1480、1570、1960~1970 400~850、1930~2170、2280~2290
d(R) 410~920、940~950、1430~1480、1940~1950、2130~2260 410~620、790 ~ 890、1360 ~ 1370、1430 ~ 1480、1690、1940 ~
1960、2040~2080、2120~2270、2300~2340
N(R) 520~720、1110~1590 510~780、1350~1710、1840~1880
d[N(R)] 410~ 600、630 ~ 920、940 ~ 950、1060 ~ 1110、1440 ~ 1460、
1920~1930、2230~2260、2390、2400~2410
410~ 610、640 ~ 910、950 ~ 960、1040、1060 ~ 1100、 1450、
1540~1560、1810、1990、2130、2220~2270
log(1 / R) 400~880、1930~2130 640~880、1910~2340、2450
d[log(1 / R)] 440~480、570 ~ 950、1060 ~ 1100、1450、1900 ~ 1930、1980 ~
2110、2230~2270、2390~2430
410~890、950 ~ 960、1070 ~ 1120、1530 ~ 1560、1990、2100 ~
2270
表 4 土壤全氮和碱解氮含量的偏最小二乘回归模型
Table 4 Partial least squares regression model of soil total nitrogen and alkali hydrolysable nitrogen content
土壤氮
Soil nitrogen
光谱变换
Spectrum
transform
主成分数
Principal
component number
校正 Calibration
R2 均方根误差
RMSE
交叉验证 Cross validation
R2 均方根误差
RMSE
相对预测偏差
RPD
全氮 R 12 0.948 0.039 0.877 0.061 3.286
TN d(R) 7 0.929 0.045 0.884 0.059 3.397
N(R) 10 0.910 0.051 0.850 0.068 2.948
d[N(R)] 6 0.888 0.057 0.807 0.065 3.084
log(1 / R) 6 0.920 0.029 0.874 0.062 3.233
d[log(1 / R)] 6 0.919 0.049 0.868 0.063 3.182
碱解氮 R 12 0.896 8.992 0.814 12.241 2.816
AHN d(R) 7 0.864 10.268 0.778 13.352 2.581
N(R) 13 0.873 9.946 0.746 14.295 2.411
d[N(R)] 9 0.885 9.439 0.777 13.378 2.576
log(1 / R) 10 0.876 9.820 0.803 12.595 2.736
d[log(1 / R)] 8 0.898 8.893 0.832 11.627 2.964
g·kg-1,说明微分光谱变换相对于其他变换形式而
言有利于全氮的高光谱预测模型构建,是预测全氮
的较优模型.除归一化微分变换构建的校正模型的
判断系数低于 0.90外,其他形式光谱构建的校正模
型的判断系数都大于 0.90.内部交叉验证时除归一
化微分变换形式光谱的判断系数为 0.807 外,其他
的都大于或等于 0.85,说明利用 CA+PLS 方法建立
的 TN的回归模型比较稳定,精度较高.
对于碱解氮而言,有最大校正判断系数的模型
为倒数对数微分变换光谱 d[ log(1 / R)]构建的模
型,选择的主成分为 8个,其校正和交叉验证模型的
判断系数均最高,分别为 0.898 和 0.832,均方根误
差均最小,分别为 8.893和 11.627 mg·kg-1 .选择主
成分最多的是归一化光谱构建的模型,选择 13个主
成分,但校正模型和交叉验证模型的判断系数和均
方根误差均略低于或高于 d[ log(1 / R)]构建的模
型.说明 PLS 建立的校正模型的精度与主成分个数
的选取不一定呈正比,利用 CA+PLS 方法建立的碱
解氮的回归模型也比较稳定,精度也比较高.
2 4 土壤全氮和有效氮预测模型的效果评价
利用独立样本对校正模型的预测效果进行验证
(表 5)的结果表明,土壤全氮校正模型验证过程中
的判断系数最高的是微分光谱d(R)建立的校正模
表 5 PLS模型的检验结果
Table 5 Validation results of spectral models developed by
PLS
土壤氮
Soil
nitrogen
光谱变换
Spectrum
transform
R2 均方根
误差
RMSE
相对预测
偏差
RPD
全氮 R 0.886 0.064 2.290
TN d(R) 0.935 0.047 3.120
N(R) 0.840 0.076 1.930
d[N(R)] 0.903 0.059 2.480
log(1 / R) 0.875 0.080 1.840
d[log(1 / R)] 0.912 0.056 2.620
碱解氮 R 0.705 18.921 1.312
AHN d(R) 0.688 19.005 1.306
N(R) 0.773 16.204 1.538
d[N(R)] 0.548 22.877 1.084
log(1 / R) 0.717 18.101 1.371
d[log(1 / R)] 0.602 21.478 1.156
11127期 刘秀英等: 基于相关分析和偏最小二乘回归的黄绵土土壤全氮和碱解氮含量的高光谱预测
型,R2为 0.935,均方根误差最小,为 0 047 g·kg-1 .
通过比较发现:建模过程和验证过程中 RMSE 之间
的差异不超过 0.05 g·kg-1,而且判断系数之差均不
超过 0.15.这表明利用 CA+PLS 方法建立的全氮预
测模型比较稳定,预测精度较高,同时也说明微分变
换是构建全氮预测模型的一种较好的变换方法.
土壤碱解氮模型验证过程中 R2最大(0.773)的
为归一化变换构建的模型,并且均方根误差最小,为
16.204 mg·kg-1 .验证效果最差的为归一化微分变
换构建的模型,其 R2为 0.548,RMSE 最大为 22.877
mg·kg-1 .总体来看,建模过程和验证过程中 RMSE
之间的差异均较大.说明归一化变换是构建碱解氮
预测模型的一种较好的变换方式,同时也说明利用
CA+PLS方法建立的碱解氮的回归模型不太稳定.
CA+PLS构建的全氮的校正模型在验证过程中
相对预测偏差(RPD)大于 2的分别为 R、d(R)、d[N
(R)]、d[log(1 / R)]光谱变换,而 N(R)、log(1 / R)
构建模型的 RPD值大于 1.8,在 1.4 ~ 2.0 之间,进一
步说明 TN的预测模型稳定可靠,可以用于植被恢
复区黄绵土土壤全氮的快速预测.而碱解氮的校正
模型在验证过程中的 RPD 只有归一化变换略大于
1.4,其他均在 1.0~1.4之间.表明碱解氮的预测模型
不够稳定,只有归一化变换构建的模型可以粗略进
行碱解氮的预测.
将全氮和碱解氮的参考值与预测值做趋势线并
与参考值的 1 ∶ 1线进行比较,可以了解预测值与参
考值的关系及预测的准确度.通过比较可知,原始光
谱(R)构建的模型预测的全氮含量整体偏低;全氮
含量大于 0.70 g·kg-1时,d(R)和 N(R)构建的模型
预测值与参考值比较接近,模型的预测精度较高,但
当全氮含量小于 0.70 g·kg-1时,d(R)为自变量构
建模型的预测值偏低,而 N(R)构建模型的预测值
偏高,而且全氮含量越低预测精度越差;d[N(R)]
为自变量构建的模型以全氮含量 0.60 g·kg-1为界,
小于此值时模型预测值偏高,反之则偏低;log(1 / R)
为自变量构建的模型预测值整体偏低,而且全氮含
量越大预测精度越低;d[ log(1 / R)]为自变量构建
的模型以 0.25 g·kg-1为界,小于此值时模型预测值
偏高,反之则偏低,全氮含量越高预测精度越低.对
于碱解氮而言,d(R)和 log(1 / R)构建模型的预测精
度随碱解氮含量的增加而降低,当碱解氮含量较大
时,预测值均偏高;d[log(1 / R)]构建的模型预测的
碱解氮含量整个范围都偏低;R 构建的模型预测
精度随碱解氮含量的增加而增高;N(R)构建的模型
表 6 全氮和碱解氮分层预测结果
Table 6 Layering forecast results of spectral models for
soil total nitrogen and alkali hydrolysable nitrogen content
土壤氮
Soil
nitrogen
光谱变换
Spectrum
transform
样本数
Number
of samples
土层深度
Soil
depth
(cm)
R2 均方根
误差
RMSE
相对预测
偏差
RPD
全氮 N(R) 21 0~40 0.892 0.066 3.199
TN 19 >40 0.373 0.086 1.326
R 21 0~40 0.890 0.067 3.151
19 >40 0.692 0.060 1.900
d(R) 21 0~40 0.921 0.057 3.700
19 >40 0.890 0.034 3.354
d[N(R)] 21 0~40 0.931 0.053 3.983
19 >40 0.645 0.065 1.754
log(1 / R) 21 0~40 0.806 0.090 2.345
19 >40 0.927 0.067 1.702
d[log(1 / R)] 21 0~40 0.919 0.057 3.703
19 >40 0.752 0.054 2.112
碱解氮 N(R) 21 0~40 0.665 20.895 1.854
AHN 19 >40 0.016 14.503 0.878
预测的碱解氮含量整体偏高;d[N(R)]为自变量构
建的模型预测的碱解氮含量在整个范围内有偏高的
也有偏低的,因此趋势线与 1 ∶ 1线较接近.
2 5 全氮和碱解氮的分层预测
利用构建的预测模型对验证样本集的土壤样本
分 0~40 cm和>40 cm两层进行预测,结果(表 6)表
明,0~40 cm土层的全氮预测模型的判断系数除 log
(1 / R)变换较低之外,其他均较高,判断系数最大值
与最小值之差小于 0.05,RPD值均大于 3,说明 CA+
PLS构建的预测模型预测 0 ~ 40 cm 土层全氮时精
度较高.>40 cm 土层的全氮预测模型的判断系数、
RPD值和 RMSE值均相差较大,说明模型对这一土
层的全氮可以进行预测,但不同光谱变换形式构建
的预测模型预测结果相差较大,模型不够稳定,需要
更大的样本集进行验证.
对碱解氮的分层预测仅选择 RPD 值大于 1.4
的模型进行预测. 0~ 40 cm 土层的碱解氮预测模型
的判断系数为 0.665,RPD 值为 1.854;>40 cm 土层
的碱解氮预测模型的判断系数、RPD 值均较低,R2
仅为 0.016,RPD值为 0.878<1.说明利用 CA+PLS构
建的预测模型可以对 0 ~ 40 cm 土层碱解氮进行粗
略预测,对>40 cm 土层的碱解氮预测结果不理想,
需要进一步深入研究.
3 讨 论
采用适当的光谱预处理和波长选择方法能够简
化和提取特征光谱信息,提高土壤参数定量模型的
2112 应 用 生 态 学 报 26卷
预测能力[3-4] .简单相关分析结果可为敏感波段的筛
选提供依据,但单纯依赖简单相关分析确定敏感波
段并作为自变量构建模型存在一定的片面性和局限
性,较难取得理想的建模效果[24] .偏最小二乘回归
适合处理各变量内部高度线性相关的数据,能够利
用所有有效的数据构建模型,具有良好的预测功
能[17] .因此,本研究采取 CA+PLS 方法建立校正模
型,这样既提取了特征波段,获得了最大的光谱信
息,又压缩了波段,对光谱数据进行了降维,简化了
建立的模型,并取得了较好的预测精度.
由于研究区土壤类型不同,在土壤氮元素的高
光谱反演方面,土壤氮素的敏感光谱波段有差异.本
研究对黄绵土全氮和碱解氮与光谱反射率进行相关
分析,确定了黄绵土预测全氮的敏感波段范围为
520~920、950~1100、1400~1600、1950~2400 nm;预
测碱解氮的敏感波段范围为 510 ~ 1000、 1400 ~
2400 nm.综合许多研究者的成果表明: 500 ~ 900、
1400~1900和 2050~2250 nm 是预测全氮的敏感波
段[9-10,12-13],而 1600~2500 nm是预测碱解氮的敏感
波段[8] .因此,可以归纳出预测不同类型土壤全氮的
通用敏感波段范围为 500 ~ 900、1400 ~ 1600、2050 ~
2250 nm,而预测不同类型土壤碱解氮的通用敏感波
段范围为 510~1000、1600 ~ 2400 nm,这一结论还需
要进一步的验证和完善.
CA+PLS方法建立的全氮预测模型比较稳定,
预测精度较高,这与其他研究区得出的结论相
似[4,7,9-10,12,14] .本研究区黄绵土土壤全氮含量较低,
说明 CA+PLS方法构建的预测模型可以对全氮含量
较低的黄绵土进行快速预测.李伟等[8]利用 PLS 和
ANN构建了黑土土壤碱解氮含量的预测模型,模型
反演效果较好.陈红艳等[15]、栾福明等[16]利用小波
分析结合 PLS 构建了碱化土壤和潮土土壤碱解氮
含量的预测模型,模型预测精度较高.本文利用 CA+
PLS方法建立的碱解氮预测模型不太稳定,建模精
度较高,但独立样本进行模型验证时精度较差,只能
粗略地进行碱解氮的预测.其原因可能有两方面,一
方面是由于本研究随机选择的碱解氮验证集的范
围、标准差与校正集和整体样本相差较大,未能很好
地代表整体样本;另一方面原因可能是本研究选择
的是生态系统退化严重、采取植被恢复措施的区域
为研究区,该区域土壤类型、土壤样本的浓度[25]和
数量[26]与其他研究区不同,并且光谱数据预处理方
法[4]和构建校正模型的方法[27]也不完全相同,因而
构建的碱解氮预测模型的预测精度与其他研究者的
结论有差异.另外,利用相同的预处理和建模方法,
全氮的预测效果明显优于碱解氮,其原因可能是土
壤中全氮含量明显高于碱解氮,全氮对土壤光谱的
影响较大所致.对土壤全氮和碱解氮进行分层预测
时,预测模型可以对 0~40 cm土层深度的全氮进行
预测,但当土层深度>40 cm 时,不同光谱变换形式
构建的模型预测结果相差较大,模型不够稳定.以归
一化变换构建的碱解氮预测模型可以粗略预测 0 ~
40 cm土层的碱解氮,而对>40 cm 土层的预测结果
不理想,需要进一步深入研究.
4 结 论
选择生态系统退化严重、采取植被恢复措施的
陕西省吴起县为研究区,以黄绵土为试验对象,结合
CA+PLS方法建立了土壤全氮和碱解氮含量的高光
谱预测模型.结果表明:通过相关分析确定的黄绵土
全氮的敏感波段为 610、 670、 690、 710、 1450 和
2240 nm,碱解氮的敏感波段为 640、 1420、 1980、
2170、2230和 2240 nm.CA+PLS 方法建立的黄绵土
全氮的预测模型在建模和验证过程中,RMSE 之间
的差异均不超过 0.05 g·kg-1,判断系数之差均不超
过 0.15,RPD值均较高,说明模型比较稳定,预测精
度较高,可以用于黄绵土全氮的快速预测,微分变换
是构建全氮预测模型的一种较好的变换方式.归一
化变换是构建黄绵土碱解氮预测模型的一种较好的
变换方式,但利用 CA+PLS 方法建立的碱解氮预测
模型不太稳定,只能对黄绵土碱解氮进行粗略预测.
CA+PLS 方法建立的黄绵土全氮预测模型可以对
0~40 cm土层的全氮进行预测,但土层>40 cm 时不
同光谱变换构建的模型预测结果相差较大,模型不
够稳定.以归一化变换构建的碱解氮预测模型可以
粗略预测 0~40 cm土层的碱解氮,对>40 cm土层的
预测结果不理想,需要进一步深入研究.
本次研究所选区域的生态系统退化严重,土壤
全氮和碱解氮含量相对较低,本文所建立的模型可
以对采取同样植被恢复措施的黄绵土土壤氮素进行
快速预测,但本研究结果对于其他区域具有差异较
大的土壤类型或其他土壤参数的适用性有待于进一
步研究证实.
参考文献
[1] Chang Q⁃R (常庆瑞), Yue Q⁃L (岳庆玲). Soil fertili⁃
ty quality of artificial forest in the Hilly⁃gull region of
Loess Plateau. Science of Soil and Water Conservation
(中国水土保持科学), 2008, 6(2): 71-74 ( in Chi⁃
31127期 刘秀英等: 基于相关分析和偏最小二乘回归的黄绵土土壤全氮和碱解氮含量的高光谱预测
nese)
[2] Zhang J⁃J (张娟娟), Tian Y⁃C (田永超), Yao X (姚
霞), et al. Estimating soil total nitrogen content based
on hyperspectral analysis technology. Journal of Natural
Resources (自然资源学报), 2011, 26(5): 881-890
(in Chinese)
[3] Xie HT, Yang XM, Drury CF, et al. Predicting soil or⁃
ganic carbon and total nitrogen using mid⁃ and near⁃
infrared spectra for Brookston clay loam soil in South⁃
western Ontario, Canada. Canadian Journal of Soil Sci⁃
ence, 2011, 91: 53-63
[4] Yang H, Kuang B, Mouazen AM. Quantitative analysis
of soil nitrogen and carbon at a farm scale using visible
and near infrared spectroscopy coupled with wavelength
reduction. European Journal of Soil Science, 2012, 63:
410-420
[5] Ben⁃Dor E, Chabrillat S, Demattê JAM, et al. Using
imaging spectroscopy to study soil properties. Remote
Sensing of Environment, 2009, 113: S38-S55
[6] Couillard A, Turgeon AJ, Shenk JS, et al. Near infrared
reflectance spectorscopy for analysis of turf soil profiles.
Crop Science, 1997, 37: 1554-1559
[7] Zhang J⁃J (张娟娟), TianY⁃C (田永超), Yao X (姚
霞), et al. The spectral index for estimating soil OM,
TN and AN content simultaneously using near⁃infrared
spectroscopy. Acta Pedologica Sinica (土壤学报 ),
2012, 49(1): 50-59 (in Chinese)
[8] Li W (李 伟), Zhang S⁃H (张书慧), Zhang Q (张
倩), et al. Rapid prediction of available N, P, and K
content in soil using near⁃infrared reflectance spectrosco⁃
py. Transactions of the Chinese Society of Agricultural
Engineering (农业工程学报), 2007, 23(1): 55-59
(in Chinese)
[9] Lu Y⁃L (卢艳丽), Bai Y⁃L (白由路), Wang L (王
磊), et al. Determination for total nitrogen content in
black soil using hyperspectral data. Transactions of the
Chinese Society of Agricultural Engineering (农业工程
学报), 2010, 26(1): 256-261 (in Chinese)
[10] Xu L⁃H (徐丽华), Xie D⁃T (谢德体), Wei C⁃F (魏
朝富), et al. Prediction of total nitrogen and total phos⁃
phorus concentrations in purple soil using hyperspectral
data. Spectroscopy and Spectral Analysis (光谱学与光谱
分析), 2013, 33(3): 723-727 (in Chinese)
[11] Peng Y⁃K (彭玉魁), Zhang J⁃X (张建新), He X⁃S
(何绪生), et al. Analysis of soil moisture, organic
matter and total nitrogen content in loess in China with
near infrared spectroscopy. Acta Pedologica Siniea (土
壤学报), 1998, 35(4): 553-559 (in Chinese)
[12] Wu M⁃Z (吴明珠), Li X⁃M (李小梅), Sha J⁃M (沙
晋明). Spectral inversion models for prediction of red
soil total nitrogen content in subtropical region
(Fuzhou). Spectroscopy and Spectral Analysis (光谱学
与光谱分析), 2013, 33(11): 3111- 3115 ( in Chi⁃
nese)
[13] Dalal RC, Henry RJ. Simultaneous determination of
moisture, organic carbon, and total nitrogen by near in⁃
frared reflectance spectrophotometry. Soil Science Society
of America Journal, 1986, 50: 120-123
[14] He Y, Huang M, García A, et al. Prediction of soil
macronutrients content using near⁃infrared spectroscopy.
Computers and Electronics in Agriculture, 2007, 58:
144-153
[15] Chen H⁃Y (陈红艳), Zhao G⁃X (赵庚星), Li X⁃C
(李希灿), et al. Hyperspectral estimation method for
soil alkali hydrolysable nitrogen content based on dis⁃
crete wavelet transform and genetic algorithm in combi⁃
ning with partial least squares. Chinese Journal of Ap⁃
plied Ecology (应用生态学报), 2013, 24 ( 11):
3185-3191 (in Chinese)
[16] Luan F⁃M (栾福明), Xiong H⁃G (熊黑钢), Wang F
(王 芳), et al. The inversion of soil alkaline hydroly⁃
sis nutrient content with hyperspectral reflectance based
on wavelet analysis. Spectroscopy and Spectral Analysis
(光谱学与光谱分析), 2013, 33(10): 2828- 2832
(in Chinese)
[17] Bao S⁃D (鲍士旦). Soil and Agricultural Chemistry
Analysis. Beijing: China Agriculture Press, 1999 ( in
Chinese)
[18] Cohen MJ, Prenger JP, DeBusk WF. Visible⁃near infra⁃
red reflectance spectroscopy for rapid, nondestructive as⁃
sessment of wetland soil quality. Journal of Environmen⁃
tal Quality, 2005, 34: 1422-1434
[19] Pu R⁃L (浦瑞良), Gong P (宫 鹏). Hyperspectral
Remote Sensing and Its Application. Beijing: Higher
Education Press, 2000 (in Chinese)
[20] Tang Q⁃Y (唐启义), Feng M⁃G (冯明光). DPS Data
Processing System. Beijing: Science Press, 2007 ( in
Chinese)
[21] Hu XY. Application of visible / near⁃infrared spectra in
modeling of soil total phosphorus. Pedosphere, 2013,
23: 417-421
[22] Chang CW, Laird DA. Near⁃infrared reflectance spectro⁃
scopic analysis of soil C and N. Soil Science, 2002, 167
(2): 110-116
[23] Peng J (彭 杰), Zhang Y⁃Z (张杨珠), Zhou Q (周
清), et al. Reflecting spectral changes in the depth pro⁃
file of major soils in Hunan Province. Chinese Journal of
Soil Science (土壤通报), 2006, 37(2): 236-240 (in
Chinese)
[24] Chen H⁃Y (陈红艳), Zhao G⁃X (赵庚星), Li X⁃C
(李希灿), et al. Hyper⁃spectral estimation of soil or⁃
ganic matter content based on wavelet transformation.
Chinese Journal of Applied Ecology (应用生态学报),
2011, 22(11): 2935-2942 (in Chinese)
[25] Kuang B, Mouazen AM. Calibration of visible and near
infrared spectroscopy for soil analysis at the field scale
on three European farms. European Journal of Soil Sci⁃
ence, 2011, 62: 629-636
[26] Guerrero C, Zornoza R, Gómez I, et al. Spiking of NIR
regional models using samples from target sites: Effect of
model size on prediction accuracy. Geoderma, 2010,
158: 66-77
[27] Vohland M, Besold J, Hill J, et al. Comparing different
multivariate calibration methods for the determination of
soil organic carbon pools with visible to near infrared
spectroscopy. Geoderma, 2011, 166: 198-205
作者简介 刘秀英,女,1977 年生,博士研究生,讲师. 主要
从事高光谱遥感与 GIS应用研究. E⁃mail: csfulxy@ 126.com
责任编辑 杨 弘
4112 应 用 生 态 学 报 26卷