免费文献传递   相关文献

Estimating Wetland plant leaf total nitrogen content based on optimal bands of reflectance from wetland vegetation

基于最佳波段判别的湿地植物叶片全氮反演研究



全 文 :第 34 卷第 17 期
2014年 9月
生 态 学 报
ACTA ECOLOGICA SINICA
Vol.34,No.17
Sep.,2014
http: / / www.ecologica.cn
基金项目:国家自然科学基金(40901281);北京市教育委员会科技计划面上项目(KM201310028012)
收稿日期:2013鄄11鄄04; 摇 摇 修订日期:2014鄄07鄄01
*通讯作者 Corresponding author.E鄄mail: xiaoyucnu@ 126.com
DOI: 10.5846 / stxb201311042664
郭超凡,段福洲,郭逍宇,赵文吉,刘克.基于最佳波段判别的湿地植物叶片全氮反演研究.生态学报,2014,34(17):4839鄄4849.
Guo C F,Duan F Z,Guo X Y,Zhao W J,Liu K.Estimating Wetland plant leaf total nitrogen content based on optimal bands of reflectance from wetland
vegetation.Acta Ecologica Sinica,2014,34(17):4839鄄4849.
基于最佳波段判别的湿地植物叶片全氮反演研究
郭超凡1,2,3,4,段福洲1,2,3,4,郭逍宇1,2,3,4,*,赵文吉1,2,3,4,刘摇 克5
(1. 首都师范大学资源环境与旅游学院,北京摇 100048;
2. 北京市城市环境过程与数字模拟重点实验室鄄省部共建国家重点实验室培育基地,北京摇 100048;
3. 三维信息获取与应用教育部重点实验室, 北京摇 100048;
4. 资源环境与地理信息系统北京市重点实验室, 北京摇 100048; 5. 北京市地质研究所,北京摇 100120)
摘要:利用高光谱遥感技术定量估测湿地植被叶片全氮含量,对于监测和诊断湿地植被的生理状况及生长趋势具有重要意义。
但叶片氮素遥感诊断研究多存在反演模型过拟合、入选波段与生化参量间因果关系不明确和入选变量间“多重共线性冶等局
限。 以芦苇(Phragmites australis)和香蒲(Typha angustifolia)叶片全氮含量作为研究对象,通过谱带分区,分区最佳波段选取和
偏最小二乘回归相结合的方法构建芦苇和香蒲叶片全氮含量反演模型,并利用交叉验证决定系数(R2cv )和均方根误差
(RMSEcv)对模型精度进行检验,尝试克服传统反演方法中的不足。 结果表明,不同湿地植物类型相比,利用芦苇反射光谱建立
的预测模型精度都高于香蒲。 不同回归模型相比,一阶导数光谱鄄偏最小二乘回归模型(FDS鄄PLSR)精度远高于原始光谱鄄偏最
小二乘回归模型(OS鄄PLSR)。 芦苇最佳模型交叉验证决定系数(R2cv)达到了 0.84,方根误差(RMSEcv)为 0.10,香蒲最佳模型交
叉验证的决定系数(R2cv)达到了 0.66,方根误差(RMSEcv)为 0.13,是构建湿地植物芦苇和香蒲光谱与叶片全氮含量关系的最佳
模型。 在不降低湿地植物叶片氮含量反演精度的基础上,有效地避免了传统地物高光谱模型反演中的局限性,是无损害遥感探
测方面的有益尝试。
关键词:湿地植物;高光谱;全氮;波段识别;偏最小二乘法
Estimating Wetland plant leaf total nitrogen content based on optimal bands of
reflectance from wetland vegetation
GUO Chaofan1,2,3,4,DUAN Fuzhou1,2,3,4,GUO Xiaoyu1,2,3,4,*,ZHAO Wenji1,2,3,4,LIU Ke5
1 College of Resources Environment and Tourism, Capital Normal University, Beijing 100048, China
2 Urban Environmental Processes and Digital Modeling Laboratory, Beijing 100048, China
3 Laboratory of 3D Information Acquisition and Application, MOST, Beijing 100048, China
4 Beijing Municipal Key Laboratory of Resources Environment and GIS, Beijing 100048, China
5 Beijing Institute for Geological Engineering, Beijing 100120, China
Abstract: Utilization of hyperspectral remote sensing technology to estimate wetland plant leaf nitrogen content
quantitatively in large area is important to monitor and diagnosis of physiological condition and growth trend of wetland
vegetation. However, there are many limitations such as over鄄fitting of inversion model, indeterminate causal relationship
between the selected bands and biochemical parameters,“multicollinearity冶 of selected bands in leaf nitrogen diagnosis
remote sensing research. The total nitrogen content of leaves of typical wetland plants, Phragmites australis and Typha
angustifolia, was selected as our study objects. These plants grow in South Wetland purification system in the Olympic Park
http: / / www.ecologica.cn
in Beijing, a typical wetland using reclaimed water. The leaf reflectance spectra of main wetland plants were acquired by
means of an ASD FieldSpec 3 spectrometer ( 350—2500nm). Leaf total nitrogen content was determined by Kjeldahl
nitrogen measurement method after acquiring the leaf reflectance spectra. The method,“Give a cross correlation analysis冶,
was used to build the correlations between leaf nitrogen content and the original spectrum, first derivative spectrum. Then,
the selected bands were divided into some areas according to QiSeGuang spectral range and the interval of selected bands.
Those bands which are high frequency、frequency more、ranked high frequency are chosen as representative bands of different
areas and considered to be the optimal bands used to build the regression model. Finally,partial least squares was used to
build inversion model. The accuracy of this model was tested with cross鄄validated coefficient of determination (R2cv) and
cross、 | validated root mean square error (RMSEcv).The results show that the first derivative transformation can effectively
improve the sensitivity of the original spectrum leaf nitrogen content inversion, and fully reflect the sensitivity of near
infrared wave band representing leaf total nitrogen content. The accuracy of regression model based on the first derivative
and the partial least鄄squares was much higher than that of the original spectra. In the regression model of the reed,
verification accuracy (R2cv) reached 0.84, square root error (RMSEcv) was 0.11, in the regression model of the cattail,
verification accuracy (R2cv) reached 0.66, square root error (RMSEcv) was 0.13, which were the optimal models to estimate
leaf total nitrogen content. The determination of parameters in “Give a cross correlation analysis冶provided a scientific basis
for building the model of eliminating “ singularband冶 and reducing “ multicollinearity冶 problem. Spectrum zone division
provides a scientific basis for revealing the causal relationships between optimal band and biochemical parameters. And
partial least squares regression method was used to avoid “multicollinearity冶 of selected bands. The result from this study
can not only fill the gaps in the detection of leaf nitrogen using remote sensing, but also provide a strong scientific basis for
the nitrogen content monitoring and management of urban wetlands using reclaimed water. At last, Partial least squares
regression method was used to avoid “multicollinearity冶 of selected bands.
Key Words: wetland plant; hyperspectrum; total nitrogen; band identification; partial least squares
摇 摇 植物叶片的光合作用、呼吸、蒸散发和分解等生
物过程与叶片的生化参量如叶片叶绿素、水分、氮和
纤维素等含量具有密切的关系[1],而植物受叶片内
叶肉细胞、叶绿素、水分含量、氮素含量以及其他生
理生化参量的影响表现出不同的反射光谱曲线[2鄄3]。
大量文献成功借助于植物冠层或叶片光谱特征对植
物生化参量进行实时监测和快速诊断,其结果对于
理解大范围的生态系统功能特性具有重要的意
义[4]。 由于叶绿素含量的变化会引起光谱趋势改变
的观点已得到普遍认同[5鄄6],同时有文献证明叶片叶
绿素含量与叶片氮含量具有正相关关系[7],为基于
叶片光谱特征的叶氮含量反演提供了科学依据。 早
期的叶片氮素遥感诊断研究多集中于借助指数模型
判别氮素的敏感波段[8]及基于光谱数据的变换提高
光谱吸收特征可辨性[9]。 但指数模型在实际应用中
容易受植物品种、生育期、生长环境的影响[8],其反
演精度存在不稳定性和普适性较差的问题。 其次指
数模型对于高光谱数据丰富的光谱信息而言极其有
限,容易造成重要信息的丢失[10]。 为克服指数模型
的局限性,许多学者通过原始光谱变换和寻求各种
统计方法构建基于光谱特征的植物氮素含量估算模
型。 其中采用逐步回归的方法来判别生物生化参量
的敏感波段得到了广泛的应用[11鄄12],该方法具有一
定的有效性和稳定性,但叶片氮素遥感诊断研究多
存在反演模型过拟合、入选波段的“多重共线性冶和
入选波段与生化参量间因果关系不明确[9,13]。 随后
有学者提出通过光谱吸收特性的连续移除法、带深
标准化分析和多元逐步线性回归相结合的模型构造
方法并获得了比较一致的、适用于多种物种且精度
较高的氮素及其他化学组分含量的预测方法[13],但
该方法容易受到冠层结构及叶片水分等因素的影
响,并不适宜用于湿生叶片生化参量的估测[11]。 偏
最小二乘方法已被证明是从植被光谱数据提取叶面
属性的最有效的经验方法,开始较多地应用于对植
被和农作物的遥感监测中[14]。
本课题组前期借助偏最小二乘法进行了植物叶
0484 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
片全氮含量的高光谱反演研究,因该方法具有较多
的光谱参数,考虑了全谱区各波长点的光谱参数,并
解决了多元线性回归中变量多重共线性等问题,因
而具有较高反演精度[14]。 但由于偏最小二乘法全
谱区所有波段参与模型反演,同样无法避免受土壤
背景、传感器信噪比、大气吸收、冠层结构及叶片水
分等因素对反演精度的影响。 同时基于该方法所构
建的模型同样无法明确入选波段与生化参量间的因
果关系。 基于此,本研究以奥林匹克公园南园湿地
优势植物芦苇和香蒲为研究对象,选取 400—1000
nm波段范围的原始光谱及其派生的一阶导数光谱
为光谱数据源,通过舍一交叉法选取与叶氮含量相
关性较高且相关频率较大的波段作为叶片全氮含量
反演模型的最佳波段集,并利用偏最小二乘法构建
这些波段集与叶片全氮含量的反演模型,研究结果
预期在反演模型构建中避免模型入选波段多重共线
性、明确入选波段与生化参量间因果关系、剔除构建
模型中的奇异波段和消除模型的过拟合等方面进行
有益的尝试,为湿地植物生长的遥感监测提供科学
依据。
1摇 研究区概况
奥林匹克公园南园湿地地处北京市区北部,位
于奥林匹克公园内。 该区属暖温带半干旱半湿润大
陆性季风气候。 多年平均气温 11—12 益,极端最高
气温 41.6 益,极端最低气温-21.2 益。 多年平均水
面蒸发量在 1200 mm 左右,多年平均降雨量约 600
mm。 降雨年内分配不均,多集中在汛期 6—9月,约
占全年的 85%。 奥林匹克公园以清河、北小河再生
水处理厂的出水为补水水源,并循环利用,且补水入
湖前流经南园湿地以改善水质。 南园湿地以再生水
处理湿地和循环水处理湿地为核心,植物氧化塘、生
态氧化塘为辅助,混合生态功能区为补充,形成多层
次的湿地净化系统(图 1) [15]。 该净化系统的各个部
分均布有大量水生植物,主要包括芦苇、香蒲、水葱、
千屈菜等。 通过植物的净化作用出水水质可以达到
地表芋类水水质标准(GB3838—2002)。
2摇 研究方法
2.1摇 湿地植物光谱采集及 TN含量的测定
摇 摇 选择研究区主要的湿地植物芦苇和香蒲为光谱
图 1摇 奥林匹克公园南园湿地地理位置及净化系统布置图[15]
Fig.1摇 Location and distribution of the purification system in
the South Wetland[15]
采集对象。 根据两种湿地植物在每个水质净化子系
统(再生水处理湿地,循环水处理湿地,植物氧化塘,
生态氧化塘,混合生态功能区)的分布情况,设置芦
苇( Phragmites australis) 光谱采样点 28 个,香蒲
(Typha angustifolia)光谱采样点 20个。 于 2010 年 8
月进行湿地植物叶片光谱测量,测量仪器采用美国
ASD(Analytical Spectral Device)公司 FieldSpec 3 便
携式地物波谱仪。 该仪器探头视场角度为 10毅,光谱
范围为 350—2500 nm,光谱分辨率在 700 nm 时为 3
nm,在 1400 nm 时为 8. 5 nm,在 2100 nm 时为 6. 5
nm,光谱采样间隔在 350—1000 nm 为 1. 4 nm,在
1000—2500 nm为 2 nm。 野外测量选择晴朗无风的
天气,测量时间为 10:00—14:00,根据天气条件进行
优化,至多每 20 min 利用白板进行 1 次。 测量时选
择植株从顶部下数第 1 片完全展开的新叶,探头距
离叶片中间部位约 5 cm,保证探头的视野范围落在
叶片上,同时注意避开叶脉位置,每个样点一次保存
10条光谱。 与光谱测量同步,取相应叶片,在 105 益
下杀青 30 min 后,再于 80 益 下烘干至恒量,用
H2SO4鄄H2O2消煮后,利用凯氏法测定叶片全氮含量。
2.2摇 数据处理
2.2.1摇 光谱数据预处理
本文选取的波段范围为:400—1000 nm,对每个
样点采集的光谱进行平均。 为减少数据冗余度,对
光谱进行重采样(仪器输出光谱自动重采样为 1 nm
的分辨率),采样间隔为 5 nm,并采用 Savitzky鄄Golay
方法进行平滑,该方法为窗口移动多项式最小二乘
1484摇 17期 摇 摇 摇 郭超凡摇 等:基于最佳波段判别的湿地植物叶片全氮反演研究 摇
http: / / www.ecologica.cn
平滑,能够保留光谱细微特征并减少随机噪声,提高
光谱信噪比[16]。
2.2.2摇 光谱数据的一阶导数变换
光谱微分技术是高光谱遥感数据最主要的分析
技术之一,利用光谱微分技术可以消除大气和背景
噪声的影响,突出光谱特征和规律。 一阶导数的计
算方法如公式(1):
R忆(姿 i)=
R(姿 i+1)-R(姿 i-1)
姿 i+1-姿 i-1
(1)
式中,姿 i为每个波段的波长,R忆(姿 i)为波长 姿 i的一阶
导数。
2.2.3摇 模型建立及精度验证
基于 SPSS,SIMCA鄄P 11.5 等软件,利用相关性
分析和统计分析的方法选取与叶片全氮含量关系密
切的敏感波段,并运用偏最小二乘回归法分别构建
原始最佳光谱集与叶片全氮含量的回归模型
(Original Spectrum鄄Partial Least Squares Regression,
OS鄄PLSR)和一阶导数光谱最佳波段集与叶片全氮
含量的回归模型 ( First Derivative Spectrum鄄Partial
Least Squares Regression,FDS鄄PLSR)。 模型精度检
验采用舍一交叉验证方法,评价指标为交叉验证决
定系数(R2cv)和交叉验证均方根误差(RMSEcv),并
绘制实测值与估计值之间的 1颐1关系图。
3摇 结果与讨论
3.1摇 相关性分析
分别对芦苇和香蒲的所有样点的原始光谱及其
一阶导数光谱和叶片全氮含量进行相关性分析(图
2)。 从原始光谱相关性分析可以看出芦苇和香蒲的
相关性系数曲线相似,叶片氮含量与光谱 ( 400—
1000 nm)反射率呈负相关,并在 550 nm 和 715 nm
附近出现波谷。 第一个波谷的形成是由于叶绿素对
于绿光的反射作用,并且在 550 nm 附近达到最大
值,第二个波谷位于“红边冶区域,有相关研究发现
“红边冶波段与植物叶绿素含量、生物量等参数间存
在显著相关性[17]。 以上结论与 barbara.J.Yoder 等人
的研究成果一致。 说明在原始光谱中,反映芦苇和
香蒲叶片氮含量的敏感光谱主要集中在可见光波
段。 其中芦苇叶片全氮含量与光谱在 400—980 nm
范围内相关性达到显著水平(P<0.05),在 440—840
nm范围内到极显著水平(P<0.01);而香蒲叶片全氮
含量与光谱的相关性在 455—665、685—770 nm 和
910—1000 nm达到显著水平(P<0.05),在 515—605
nm和 695—730 nm达到极显著水平(P<0.01)。 从
一阶导数相关性分析,芦苇叶片全氮含量与可见光
波段反射率的相关性水平较高,在 405—455、485—
545 nm 和 555—725 nm 波段范围内达到显著水平
(P<0.05),在 405—455、485—535 nm 和 555—675
nm波段范围内达到极显著水平(P<0.01)。 香蒲在
可见光波段与芦苇的相关性曲线表现出一致的变化
趋势,在 425—455、485—545、555—645 nm 和 680—
710 nm 波段范围内达到显著(P< 0. 05),在 485—
530、555—600 nm和 680—710 nm 波段范围内达到
极显著水平(P<0.01),但对比发现,与芦苇叶片全氮
含量达到显著和极显著水平的波段范围更广。 在近
红外波段,芦苇叶片全氮含量与光谱在 820、875、910
nm和 940 nm 等附近的也出现了相关性较高的峰
值,而香蒲在近红外波段范围内不存在与叶片氮含
量相关性较好的波段。 这些高相关波段为湿地植物
芦苇和香蒲全氮含量的估测提供了保障。
3.2摇 OS鄄PLSR模型构建及精度评价
3.2.1摇 原始叶片氮反演最佳波段选择
为选择基于地物高光谱特征的湿地植物叶片全
氮反演的最佳波段,本文尝试采用“舍一交叉法冶。
具体流程如下:将原始光谱随机划分为 10 份,每次
取其中的九份进行与叶氮含量的相关性分析,选出
每组中相关系数绝对值最大的 20 个极值点(共 200
个)。 之后对入选波段按其相关性绝对值的大小进
行排序(1—20 名),并统计每个波段出现的频率、频
率最高排名和频率最高排名的次数(表 1)。 实验中
认为当波段出现的频率小于 5 时(出现频率小于
50%),表示该波段为不稳定波段,应该删除。 最终
确定芦苇和香蒲各有 21 个,这些入选波段为潜在的
湿地植物全氮含量预测的最佳波段。 按照表中波段
出现的间断,并结合光谱分区特征,对入选波段进行
谱带划分。 芦苇的入选波段主要分布在红波波段
(I)、黄光波段(域)和绿光波段(芋),香蒲的入选波
段主要分布在红光波段(I)、黄光波段(域)和绿光波
段(芋)。 其中红光波段反映了叶绿素对红光的吸收
特征;黄光谱带反映了叶绿素和类胡萝卜素对黄光
的反射特征;绿光波段反映了植物叶绿素和类胡萝
卜素对绿光的反射特征。 为进一步确定叶片氮含量
2484 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
反演的最佳波段,在各个谱带内选取频率最高、出现
频率次数最大且频率排名最高的波段作为该谱带的
代表波段。 结果如下:芦苇的最佳波段集为 550、
580、715 nm,芦苇的最佳波段集为 555、580、715 nm。
芦苇和香蒲叶片全氮含量反演的最佳波段集几乎一
致,说明 550(555 nm)、580、715 nm波段是叶氮反演
的关键波段,在芦苇和香蒲叶氮反演中具有普适性。
此外这些入选波段不仅与叶片全氮含量具有高度相
关性,而且可从生化参数的角度解释其与叶片氮含
量高度相关的意义,同时在谱区范围划分及谱区范
围分区中各参数选择则可以有效地避免同一谱区范
围内“多重共线性冶问题对反演模型的影响。 从研究
结果还可以看出在原始光谱叶片氮含量反演最佳波
段判别过程中,不同植物类型对于叶片全氮含量的
敏感波段差异不明显,进一步说明入选的波段是基
于原始光谱特征的反演植物叶片氮含量的特征波
段。 其中 550(555 nm)和 715 nm是能有效反映植物
叶片全氮含量的敏感波段已被许多学者证实[17鄄18],
580 nm波段由于受到 550 nm波段的影响,在传统模
型中该波段对于叶片全氮含量的估测能力往往不能
充分体现。
图 2摇 芦苇、香蒲原始光谱和一阶导数光谱与 TN含量的相关系数图
Fig.2摇 Coefficients correlation relating the spectrum of original and first鄄derivation to concentrations of nitrogen
3.2.2摇 模型及精度验证
经过统计分析选出的最佳波段集代表了各个谱
带内与叶片氮含量相关性最好的波段,且相关性绝
对值均大于 0.6,均达到极显著水平。 说明这些光谱
特征变量与叶片尺度的全氮含量具有较高的关联
性。 因此利用偏最小二乘法构建叶片全氮含量和最
佳波段集的回归模型,构建的回归模型如表 3。 根据
交叉有效性原理,得到芦苇和香蒲所提取的成分维
数分别为 1 维和 2 维。 建立最佳估算模型后,为了
检验估算模型的可靠性和实用性,采用了交叉验证
决定系数(R2cv)和均方根误差(RMSEcv)2 个指标对
估算模型进行评定,并绘制了实测值与预测值之间
的 1颐1关系图,以直观的展示估算模型的拟合度和可
靠性。 验证的结果如图 3 所示,在构建的回归模型
中芦苇模型的 R2cv为 0.58,RMSEcv为 0.16,香蒲模型
的 R2cv为 0.56,RMSEcv为 0.16。 在原始光谱构建的回
归模型中,芦苇模型精度略高于香蒲,但差异不大。
虽然该模型在一定程度上能够反映芦苇和香蒲叶片
的全氮含量,但是精度较低,稳定性有待提高。
3484摇 17期 摇 摇 摇 郭超凡摇 等:基于最佳波段判别的湿地植物叶片全氮反演研究 摇
http: / / www.ecologica.cn
表 1摇 湿地植物原始光谱潜在最佳波段统计表
Table 1摇 Potential optimal bands of original spectrum from wetland vegetation
谱带划分
Spectrum division
芦苇 Phragmites australis
入选波段
Selected band
频率
Frequency
频率最高排名
Magnitude tier
频率最高
排名次数
Highest frequency
number
谱带分区
Spectral zone
最佳波段
Optimum band
红波波段 730 5 6 1 玉 715
Red spectrum 725 9 4 1 玉
720 10 2 1 玉
715 10 1 7 玉
710 10 1 3 玉
705 10 3 4 玉
700 10 4 1 玉
695 8 6 1 玉
黄光波段 585 5 15 1 域 580
Yellow spectrum 580 9 14 4 域
绿光波段 575 10 13 2 芋
Green spectrum 570 10 12 2 芋
565 10 10 2 芋
560 10 8 2 芋
555 10 6 2 芋
550 10 6 3 芋 550
545 10 8 1 芋
540 10 9 1 芋
535 10 11 2 芋
530 10 10 1 芋
525 10 6 1 芋
谱带划分
Spectrum division
香蒲 Typha angustifolia
入选波段
Selected band
频率
Frequency
频率最高排名
Magnitude tier
频率最高
排名次数
Highest frequency
number
谱带分区
Spectral zone
最佳波段
Optimum band
红光波段 730 7 7 1 玉 715
Red spectrum 725 8 4 1 玉
720 10 2 1 玉
715 10 1 6 玉
710 10 1 3 玉
705 10 3 4 玉
700 10 1 1 玉
695 9 7 1 玉
黄光波段 585 5 16 1 域 580
Yellow spectrum 580 7 15 2 域
绿光波段 575 7 14 4 芋 555
Green spectrum 570 9 12 1 芋
565 10 10 2 芋
560 10 6 1 芋
555 10 6 3 芋
550 10 6 1 芋
545 10 9 7 芋
540 10 11 7 芋
535 10 11 1 芋
530 9 10 1 芋
525 9 16 3 芋
4484 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
图 3摇 原始光谱的偏最小二乘回归模型的交叉验证实测值和估计值的 1 颐1关系图
Fig.3摇 The 1 颐1 relationship between the estimated value and measured value in cross validation of spectral OS鄄PLSR model
3.3摇 FDS鄄PLSR模型构建及精度评价
3.3.1摇 一阶导数叶片全氮反演最佳波段选择
相同的方法应用于一阶导数光谱的最佳波段选
取。 产生的极值点(共 200个)所对应的波段即为叶
片全氮含量反演的潜在敏感波段。 对入选波段按其
相关性绝对值大小进行排序(1—20 名),并统计每
个波段出现的频率、频率最高排名和频率最高排名
的次数(表 2)。 实验中认为当波段出现的频率小于
5(频率<50%)时,表示该波段为不稳定波段,应该删
除。 统计发现芦苇有 21 个波段入选,香蒲有 23 个
波段入选。 按照表中波段出现的间断,并结合光谱
分区特征,对入选波段进行谱带划分。 芦苇的入选
波段主要分布在近红外波段(玉)、红光波段(域、
芋)、绿光波段(郁)和蓝光波段(吁),香蒲的入选波
段主要分布在红光波段( I)、黄光波段(域)、绿光波
段(芋、IV)和蓝光波段(V)。 其中蓝光波段,反映了
植物光合作用色素(叶绿素,类胡萝卜素)对蓝光的
吸收特征,黄光光谱反映了叶绿素和类胡萝卜素对
黄光的反射特征,近红外波段(760—1000 nm)反映
了植物叶子的多孔薄壁组织(海绵组织)对近红外波
段的强烈反射。 虽然尚未发现该波段与叶片全氮含
量的直接相关的生化意义,但氮素作为植物生长、发
育所必须的元素,氮含量的多少影响植物叶子的多
孔薄壁组织(海绵组织)结构[14],进而影响光谱反射
率。 为进一步确定湿地植物叶片氮含量反演的最佳
波段,在每个谱带分区中各选取一个出现频率最高,
出现频率次数最大和频率最高排名次数最多的波段
作为该分区中的代表波段即最佳波段。 其中芦苇的
最佳波段集为 490、500、635、680 nm和 940 nm,香蒲
的最佳波段集为 490、495、565、590 nm 和 700 nm。
与原始光谱最佳波段判别结果相比较,一阶导数光
谱判别中获得的谱区范围更广。 芦苇与香蒲的最佳
谱带中出现了红外光和蓝光等原始光谱中不存在的
谱带,这些谱带作为原始光谱的斜率对叶片全氮含
量的敏感性被充分挖掘。 不同植物类型相比较,芦
苇和香蒲二者不仅在谱区范围的划分上存在较大的
差异,而且在入选波段上有所变异。 在可见光范围
内,相同入选波段(490、495 nm / 500 nm)是经过一阶
导数变换后植物叶片全氮含量反演的稳定特征波
段,这些关键波段对于芦苇和香蒲叶片全氮含量反
演研究具有普遍适用性。 不同的入选波段则是通过
一阶导数转换有效的从光谱角度反映出不同植物类
型的生理生化参量的差异与组织结构的关系的
反应。
3.3.2摇 模型及精度验证
经过统计分析选出的最佳波段集代表了各个谱
带内与叶片氮含量相关性最好的波段,且相关性均
大于 0.65,说明这些光谱特征变量与叶片尺度的全
氮含量具有较高的关联性。 因此利用偏最小二乘法
构建叶片全氮含量和最佳波段集的回归模型,构建
的回归模型如表 3。 根据交叉有效性原理,得到芦苇
和香蒲所提取的成分维数分别为 2 维和 3 维。 建立
最佳估算模型后,为了检验估算模型的可靠性和实
用性,采用了交叉验证决定系数(R2cv)和均方根误差
(RMSEcv)2个指标对估算模型进行评定,并绘制了
实测值与预测值之间的 1颐1关系图,以直观的展示估
算模型的拟合度和可靠性。 验证的结果如图 4 所
示,芦苇的回归模型的 R2cv为 0.82,RMSEcv为 0.11。
香蒲的回归模型的 R2cv为 0.66,RMSEcv为 0.13。 相对
5484摇 17期 摇 摇 摇 郭超凡摇 等:基于最佳波段判别的湿地植物叶片全氮反演研究 摇
http: / / www.ecologica.cn
于 OS鄄PLSR 模型, R2cv分别增加了 0. 11 和 0. 05,
RMSEcv分别减少了 0.03和 0.02,精度有了很大的提
高。 此外,研究结果表明一阶导数模型中,仍然是芦
苇所建立的模型精度较高。
表 2摇 湿地植物一阶导数光谱潜在最佳波段统计表
Table 2摇 Potential optimal bands of first derivative spectrum from wetland vegetation
谱带划分
Spectrum division
芦苇 Phragmites australis
入选波段
Selected band
频率
Frequency
频率最高排名
Magnitude tier
频率最高
排名次数
Highest frequency
number
谱带分区
Spectral zone
最佳波段
Optimum band
近红外光谱 Near infrared 940 7 1 1 玉 940
红光光谱 705 5 12 1 域 680
Red spectrum 700 10 9 3 域
695 10 4 1 域
690 10 5 3 域
685 10 3 4 域
680 10 1 9 域
645 6 18 3 芋 635
640 10 13 1 芋
635 10 12 1 芋
绿光光谱 535 10 11 1 郁 500
Green spectrum 530 10 13 3 郁
525 10 9 1 郁
520 10 8 1 郁
515 10 6 2 郁
510 10 4 2 郁
505 10 3 5 郁
500 10 2 9 郁
495 10 3 1 郁
蓝光光谱 490 8 10 1 V 490
Blue spectrum 485 2 16 1 V
- - -
谱带划分
Spectrum division
香蒲 Typha angustifolia
入选波段
Selected band
频率
Frequency
频率最高排名
Magnitude tier
频率最高
排名次数
Highest frequency
number
谱带分区
Spectral zone
最佳波段
Optimum band
红光光谱 705 10 2 2 玉 700
Red spectrum 700 10 1 8 玉
695 10 2 4 玉
690 7 6 1 玉
685 10 3 1 玉
680 7 2 1 玉
黄光光谱 595 10 5 1 域 590
Yellow spectrum 590 8 12 1 域
绿光光谱 575 7 13 2 芋 565
Green spectrum 570 10 6 1 芋
565 10 4 1 芋
560 9 2 1 芋
555 6 5 1 芋
530 6 11 1 郁 495
525 4 12 1 郁
520 5 14 1 郁
515 4 16 1 郁
510 3 18 3 郁
505 8 5 1 郁
500 9 7 1 郁
495 10 4 3 郁
蓝光波段 Blue spectrum 490 10 3 2 V 490
485 7 2 1 V
6484 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
图 4摇 一阶导数的偏最小二乘回归模型的交叉验证实测值和估计值的 1 颐1关系图
Fig.4摇 The 1 颐1 relationship between the estimated value and measured value in cross validation of spectral FDS鄄PLSR model
表 3摇 叶片全氮含量与最佳波段集构建的回归模型
Table 3摇 Regression model between nitrogen content and the best band set
湿地植物类型
Species
模型类型
Model types
回归方程
Regression equation
芦苇 OS鄄PLSR模型 Y= 0.11R550+1.85R580-1.71R715+0.60
Phragmites australis FDS鄄PLSR模型 Y=-76.06R490-52.21R500+86.28R635-50.72R680+126.81R940+0.59
香蒲 OS鄄PLSR模型 Y=-0.10R555+0.16R580+0.57R715+0.51
Typha angustifolia FDS鄄PLSR模型 Y=-354.74R490-164.50R495-230.31R565+489.95R590+35.15R700+0.49
4摇 结论与讨论
为了探索植物生化参量遥感诊断的可能性,20
世纪 70年代以来有关科学家就进行了大量的基础
研究,探索植物生化参量反演的最佳反演模型。 然
而,研究发现这些回归模型存在入选波段的稳定性
差、波段生化参量含义不明确、共线性和回归模型的
过拟合等问题。 虽然这些问题被许多学者反复指出
并做了大量解决方法的尝试[11,13,19],但并未取得较
为理想和统一的效果。 本文结合了“舍一交叉相关
分析冶、谱带划分、统计分析和偏最小二乘回归等多
种方法,构建了湿地植物芦苇和香蒲叶片全氮含量
的回归模型。 其中,“舍一交叉相关分析冶处理能够
有效剔除模型中的“奇异波段冶,降低了参量间的
“多重共线性冶,谱段范围的划分解释了入选波段与
生化参量间的因果关系,偏最小二乘法进一步消除
了入选波段间“多重共线性冶。 此外,由于构建的模
型是多参量方程,在一定程度上避免了指数模型易
受环境等其他干扰因素影响的缺点。 研究结果表明
上述处理方法对于构建的叶片全氮含量的回归模型
具有较好精度。 理论上,该方法也可应用于其他生
物参量如叶绿素、水分含量的估测。 本研究的方法
和模型针对其他生理生化参量反演的适用性有待今
后进一步研究。
本文分别用原始光谱和一阶导数光谱进行了叶
片全氮含量回归模型的构建。 结果表明,FDS鄄PLSR
模型比 OS鄄PLSR模型具有更好的稳定性和精度。 有
研究表明经过一阶导数转换能有效提高光谱与生物
参量的相关性[20],即原始光谱的斜率更能高效的反
映出生物参量与光谱间的关系。 此外,本课题组前
期已有学者进行了芦苇和香蒲叶片全氮含量估测最
优模型的构建[21],与其结果相比较,芦苇和香蒲的
FDS鄄PLSR模型精度都高于其所构建的最优模型
PLSR。 虽然,FDS鄄PLSR 模型是湿地植物叶片全氮
含量估测的最优模型,尤其对于芦苇叶片全氮的反
演具有较高的精度,大量文献研究中发现不同的信
息提取方法对于构建的模型精度有很大的影响。 目
前,已有许多学者尝试从光谱转换,提取隐藏信息这
一角度进行回归模型的构建[22鄄23]。 不同的方法在不
同类型的生理生化参量反演中发挥了不同的作用。
应用其他的转化方法取代一阶导数转化进行回归模
型的构建也是一个值得深入探讨的问题。
从湿地植物类型看,模型精度在不同湿地植物
类型之间存在差异,利用芦苇光谱的模型精度均高
7484摇 17期 摇 摇 摇 郭超凡摇 等:基于最佳波段判别的湿地植物叶片全氮反演研究 摇
http: / / www.ecologica.cn
于香蒲。 这与该组早期的研究结果一致[20]。 有文
献表明芦苇对氮的吸收能力高于香蒲[24],说明芦苇
更能反映所处的环境特征,这可能是其回归模型精
度较高的原因。 本文最终确定了芦苇叶片全氮含量
反演的最佳波段组合集为 490、500、635、680 nm 和
940 nm,香蒲叶片全氮含量反演的最佳波段组合集
为 490、495、565、590 nm和 700 nm。 在反演模型中,
芦苇和香蒲相同的入选波段为 490 nm 和 495 / 500
nm,这些关键波段对于芦苇和香蒲叶片全氮含量反
演研究具有普遍适用性。 而不同的入选波段则反映
出不同植物类型的生理生化参量的差异与组织结构
对于光谱反射值得影响。 此外,研究发现芦苇在近
红外范围 940 nm 出现了最佳波段而香蒲在该区域
不存在最佳波段。 研究表明在 922—990 nm 植物光
谱会受到植物水分差异的影响[14],芦苇和香蒲水分
的差异和组织结构的不同可能是造成这种现象的原
因,其深层次的原因还有待进一步研究。 本文主要
对湿地植物芦苇和香蒲全氮含量估测模型构建的可
能性进行了探讨,在不影响回归精度的前提下,有效
避免了传统生物参量光谱反演中存在的一些问题。
研究成果可以为湿地植物全氮含量的大面积监测提
供有力的科学依据。
致谢: 林川、张翼然、段光耀、阿多、杨典华、袁德阳、
尹川、朱先芳、熊薇参与了大量野外采样和室内化验
分析工作,特此致谢。
References:
[ 1医摇 Goetz S J, Prince S D. Remote sensing of net primary production
in boreal forest stands. Agricultural and forest Meteorology, 1996,
78(3 / 4): 149鄄179.
[ 2 ] 摇 Wang J H, Zhao C J, Huang W J. Fundamentals and Applications
of Quantitative Remote Sensing in Agriculture. Beijing: Science
Press, 2008: 4鄄5.
[ 3 ] 摇 Lin C, Gong Z N, Zhao W J. Hyperspectral estimation models for
plant community water content at both leaf and canopy levels in
Wild Duck Lake wetland. Acta Ecologica Sinica, 2011, 31(22):
6645鄄6658.
[ 4 ] 摇 Dawson T P, Curran P J, North P R J, Plummer S E. The
propagation of foliar biochemical absorption features in forest
canopy reflectance: a theoretical analysis. Remote Sensing of
Environment, 1999, 67(2): 147鄄159.
[ 5 ] 摇 Yoder B J, Pettigrew鄄Crosby R E. Predicting nitrogen and
chlorophyll content and concentrations from reflectance spectra
(400—2500nm) at leaf and canopy scales. Remote Sensing of
Environment, 1995, 53(22): 199鄄211.
[ 6 ] 摇 Gitelson A A, Merzlyak M N. Remote estimation of chlorophyll
content in higher plant leaves. International Journal of Remote
Sensing, 1997, 18(12): 2691鄄2697.
[ 7 ] 摇 Zhu Z Y, Bao Y D, Huang M, Feng L. Study of the relationship
between the chiorophyll and the nitrogen content of oilseed rapes.
Journal of Zhejiang University: Agriculture and Life Sciences,
2006, 32(2): 152鄄154.
[ 8 ] 摇 Xue L H, Luo W H, Cao W X, Tian Y C. Research progress on
the water and nitrogen detection using spectral reflectance. Journal
of Remote Sensing, 2003, 7(1): 73鄄80.
[ 9 ] 摇 Curran P J, Dungan J L, Peterson D L. Estimating the foliar
biochemical concentration of leaves with reflectance spectrometry:
testing the kokaly and clark methodologies. Remote Sensing of
Environment, 2001, 76(3): 349鄄359.
[10] 摇 Wang Y Y, Li G C, Zhang L J, Fan J L. Retrieval of leaf water
content of winter wheat from canopy hyperspectral data using
partial least square regression. Spectroscopy and Spectral Analysis,
2010, 30(4): 1070鄄1074.
[11] 摇 Bortolot Z J, Wynne R H. A method for predicting fresh green leaf
nitrogen concentrations from shortwave infrared reflectance spectra
acquired at the canopy level that requires no in situ nitrogen data.
International Journal of Remote Sensing, 2003, 24(3): 619鄄624.
[12] 摇 Yan C Y, Niu Z, Wang J H, Liu L Y, Huang W J. The
assessment of spectral indices applied in chlorophyll content
retrieval and a modified crop canopy chlorophyll content retrieval
model. Journal of Remote Sensing, 2005, 9(6): 742鄄750.
[13] 摇 Kokaly R F, Clark R N. Spectroscopic determination of leaf
biochemistry using band鄄depth analysis of absorption features and
stepwise multiple linear regression. Remote Sensing of
Environment, 1999, 67(3): 267鄄287.
[14] 摇 Liu K, Zhao W J, Guo X Y, Hu D Y, Gong Z N, Long J.
Spectral bands of typical wetland vegetation in the Wild Duck
Lake. Acta Ecologica Sinica, 2010, 30(21): 5853鄄5861.
[15] 摇 Deng Z Z. On Water System and Rainwater Harvesting System in
Beijing Olympic Green. Beijing: China Water Power Press, 2009:
54鄄88.
[16] 摇 Savitzky A, Golay M J E. Smoothing and differentiation of data by
simplified least squares procedures. Analytical Chemistry, 1964,
36(8): 1627鄄1639.
[17] 摇 Li B Z, Li M X, Zhou X, Zhang L S, Zhang H Y. Hyperspectral
estimation models for nitrogen contents of apple leaves. Journal of
Remote Sensing, 2010, 14(4): 767鄄780.
[18] 摇 Song S L, Li P X, Gong W, Wang J P. PLS wavelength selection
by hyperspectral remote sensing in rice. Geomatics and Information
Science of Wuhan University, 2010, 35(2): 219鄄223.
[19] 摇 Pasternak H, Edan Y, Schmilovitch Z. Overcoming
multicollinearity by deducting errors from the dependent variable.
8484 摇 生摇 态摇 学摇 报摇 摇 摇 34卷摇
http: / / www.ecologica.cn
Journal of Quantitative Spectroscopy & Radiative Transfer, 2001,
69(6): 761鄄768.
[20] 摇 Han L H. Estimating chlorophyll鄄a concentration using first鄄
derivative spectra in coastal water. International Journal of Remote
Sensing, 2005, 26(23): 5235鄄5244.
[21] 摇 Liu K, Zhao W J, Guo X Y, Wang Y H, Miao Q. Estimating total
nitrogen content in wetland vegetation based on measured
reflectance spectra. Spectroscopy and Spectral Analysis, 2012, 32
(2): 465鄄471.
[22] 摇 Blackburn G A, Ferwerda J G. Retrieval of chlorophyll
concentration from leaf reflectance spectra using wavelet analysis.
Remote Sensing of Environment, 2008, 112(4): 1614鄄1632.
[23] 摇 Malenovsky忆 Z, Homolov佗b L, Zurita鄄Millad R, Lukes姚 P, Kaplane
V, Hanus姚 J, Gastellu鄄Etchegorryf J P, Schaepman M E. Retrieval
of spruce leaf chlorophyll content from airborne image data using
continuum removal and radiative transfer. Remote Sensing of
Environment, 2013, 131: 85鄄102.
[24] 摇 Chen Y H, Wu X F, Jiang L J, Chen M L, Zeng M, Lei D,
Zhang Z N, Yang S Y. Screening and evaluation of plant
purification potential for phytoremediation of sanitary sewage. Acta
Scientiae Circumstantiae, 2008, 28(8): 1549鄄1554.
参考文献:
[ 2 ]摇 王纪华, 赵春江, 黄文江. 农业定量遥感基础与应用. 北京:
科学出版社, 2008: 4鄄5.
[ 3 ] 摇 林川,宫兆宁,赵文吉. 叶冠尺度野鸭湖湿地植物群落含水量
的高光谱估算模型. 生态学报, 2011, 31(22): 6645鄄6658.
[ 7 ] 摇 朱哲燕, 鲍一丹, 黄敏, 冯雷. 油菜叶绿素与氮含量关系的试
验研究. 浙江大学学报: 农业与生命科学版, 2006, 32(2):
152鄄154.
[ 8 ] 摇 薛利红, 罗卫红, 曹卫星, 田永超. 作物水分和氮素光谱诊断
研究进展. 遥感学报, 2003, 7(1): 73鄄80.
[10] 摇 王圆圆, 李贵才, 张立军, 范锦龙. 利用偏最小二乘回归从冬
小麦冠层光谱提取叶片含水量. 光谱学与光谱分析, 2010, 30
(4): 1070鄄1074.
[12] 摇 颜春燕, 牛铮, 王纪华, 刘良云, 黄文江. 光谱指数用于叶绿
素含量提取的评价及一种改进的农作物冠层叶绿素含量提取
模型. 遥感学报, 2005, 9(6): 742鄄750.
[14] 摇 刘克, 赵文吉, 郭逍宇, 胡德勇, 宫兆宁, 龙娟. 野鸭湖典型
湿地植物光谱特征. 生态学报, 2010, 30(21): 5853鄄5861.
[17] 摇 李丙智, 李敏夏, 周璇, 张林森, 张海燕. 苹果树叶片全氮含
量高光谱估算模型研究. 遥感学报, 2010, 14(4): 767鄄780.
[18] 摇 宋沙磊, 李平湘, 龚威, 汪金平. 基于水稻高光谱遥感数据的
PLS 波长选择研究. 武汉大学学报: 信息科学版, 2010, 35
(2): 219鄄223.
[21] 摇 刘克, 赵文吉, 郭逍宇, 王翊虹, 孙永华, 苗茜. 基于地面实
测光谱的湿地植物全氮含量估算研究. 光谱学与光谱分析,
2012, 32(2): 465鄄471.
[24] 摇 陈永华, 吴晓芙, 蒋丽鹃, 陈明利, 曾敏, 雷电, 张珍妮, 阳
石英. 处理生活污水湿地植物的筛选与净化潜力评价. 环境
科学学报, 2008, 28(8): 1549鄄1554.
9484摇 17期 摇 摇 摇 郭超凡摇 等:基于最佳波段判别的湿地植物叶片全氮反演研究 摇