免费文献传递   相关文献

Validation of Statistic Based Forest Types Classification Methods Using Hyperspectral Data

高光谱数据森林类型统计模式识别方法比较评价


在我国东北地区获取EO-1 Hyperion高光谱数据,以高空间分辨率的全色SPOT-5数据及其影像分割结果为辅助,通过外业测量获取真实可靠的森林类型空间分布数据。以这些数据为地面实状数据,对现代先进的统计模式识别方法用于森林类型识别的效果进行比较评价,总结可以有效解决有限样本条件下高光谱分类问题的基于统计模式识别的森林类型分类技术方案。评价结果表明:对高光谱数据进行降维处理,并采用更加有效的二阶统计量估计方法,进而应用将空间上下文信息和光谱信息相结合的分类算法,如ECHO,可以有效提高高光谱数据森林类型的识别精度。

With much higher spectral resolution, hyperspectral remote sensing data has higher potential capability to identify land cover types than traditional multispectral data. But under limited training sample size, increased dimension of remote sensing data means decreased samples/dimension ratio, which can lead to low classification accuracy if common statistic based pattern classification methods were used. One scene of EO-1 Hyperion hyperspectral data was acquired for the test site in north-east of China. In order to aid for ground true information collection, 2.5 m SPOT-5 PAN image was segmented into self-closure polygons. Detailed ground true data was surveyed according to the boundary of each polygon. Based on these ground true data, the hyperspectral data was used to validate the forest types identification accuracy of several advanced statistic classification methods. Finally, one classification scheme being able to effectively solve the small train sample problems for forest type classification using hyperspectral data was suggested. It was shown that forest type classification accuracy can be improved if advanced feature extraction method, much more effective second order statistic parameter estimation method, and context-sensitive samples classifier such as ECHO was applied.


全 文 :第 wv卷 第 t期
u s s z年 t 月
林 业 科 学
≥≤Œ∞‘׌„ ≥Œ∂ „∞ ≥Œ‘Œ≤„∞
∂²¯1wv o‘²1t
¤±qou s s z
高光谱数据森林类型统计模式识别方法比较评价
陈尔学t 李增元t 谭炳香t 梁毓照u 张则路u
kt1 中国林业科学研究院资源信息研究所 北京 tsss|t ~ u1吉林省汪清林业局 汪清 tvvussl
摘 要 } 在我国东北地区获取 ∞’2t ‹¼³¨µ¬²±高光谱数据 o以高空间分辨率的全色 ≥°’×2x数据及其影像分割结果
为辅助 o通过外业测量获取真实可靠的森林类型空间分布数据 ∀以这些数据为地面实状数据 o对现代先进的统计
模式识别方法用于森林类型识别的效果进行比较评价 o总结可以有效解决有限样本条件下高光谱分类问题的基于
统计模式识别的森林类型分类技术方案 ∀评价结果表明 }对高光谱数据进行降维处理 o并采用更加有效的二阶统
计量估计方法 o进而应用将空间上下文信息和光谱信息相结合的分类算法 o如 ∞≤‹’ o可以有效提高高光谱数据森
林类型的识别精度 ∀
关键词 } ∞’2t ‹¼³¨µ¬²±~高光谱 ~统计模式识别 ~森林类型
中图分类号 }×°z| 文献标识码 }„ 文章编号 }tsst p zw{{kusszlst p ss{w p sy
收稿日期 }ussx p sx p ux ∀
基金项目 }/ {yv0课题资助kussu„„tvvsxsl ∀
ς αλιδατιον οφ Στατιστιχ Βασεδ Φορεστ Τψπεσ Χλασσιφιχατιον Μετηοδσ Υσινγ Ηψπερσπεχτραλ ∆ατα
≤«¨ ± ∞µ¬∏¨t ¬ ±¨ª¼∏¤±t פ± …¬±ª¬¬¤±ªt ¬¤±ª≠∏½«¤²u «¤±ª¨¯∏u
kt1 Ινστιτυε οφ Φορεστ ΡεσουρχεσΙνφορµατιον Τεχηνιθυεσo ΧΑΦ Βειϕινγ tsss|t ~
u1 Ωανγθινγ Φορεστ Βυρεαυ οφ ϑιλιν Προϖινχε Ωανγθινγ tvvussl
Αβστραχτ} •¬·« °∏¦««¬ª«¨µ¶³¨¦·µ¤¯ µ¨¶²¯∏·¬²±o«¼³¨µ¶³¨¦·µ¤¯ µ¨°²·¨ ¶¨±¶¬±ª§¤·¤«¤¶«¬ª«¨µ³²·¨±·¬¤¯ ¦¤³¤¥¬¯¬·¼·²¬§¨±·¬©¼
¤¯±§¦²√¨ µ·¼³¨¶·«¤± ·µ¤§¬·¬²±¤¯ °∏¯·¬¶³¨¦·µ¤¯ §¤·¤q …∏·∏±§¨µ ¬¯°¬·¨§·µ¤¬±¬±ª¶¤°³¯¨¶¬½¨ o¬±¦µ¨¤¶¨§ §¬°¨ ±¶¬²± ²© µ¨°²·¨
¶¨±¶¬±ª§¤·¤ °¨ ¤±¶§¨¦µ¨¤¶¨§¶¤°³¯ ¶¨Π§¬°¨ ±¶¬²±µ¤·¬²oº«¬¦«¦¤± ¯¨ ¤§·² ²¯º ¦¯¤¶¶¬©¬¦¤·¬²± ¤¦¦∏µ¤¦¼¬©¦²°°²± ¶·¤·¬¶·¬¦¥¤¶¨§
³¤·¨µ± ¦¯¤¶¶¬©¬¦¤·¬²± °¨ ·«²§¶º¨ µ¨ ∏¶¨§q’±¨ ¶¦¨±¨ ²©∞’pt ‹¼³¨µ¬²± «¼³¨µ¶³¨¦·µ¤¯ §¤·¤º¤¶¤¦´∏¬µ¨§©²µ·«¨ ·¨¶·¶¬·¨¬± ±²µ·«p
¤¨¶·²©≤«¬±¤qŒ± ²µ§¨µ·²¤¬§©²µªµ²∏±§·µ∏¨ ¬±©²µ°¤·¬²±¦²¯¯¨ ¦·¬²±ou1x ° ≥°’×px °„‘¬°¤ª¨ º¤¶¶¨ª°¨ ±·¨§¬±·²¶¨ ©¯p¦¯²¶∏µ¨
³²¯¼ª²±¶q⁄¨·¤¬¯¨ §ªµ²∏±§·µ∏¨ §¤·¤º¤¶¶∏µ√¨ ¼¨ §¤¦¦²µ§¬±ª·²·«¨ ¥²∏±§¤µ¼ ²© ¤¨¦«³²¯¼ª²±q…¤¶¨§²±·«¨¶¨ ªµ²∏±§·µ∏¨ §¤·¤o
·«¨ «¼³¨µ¶³¨¦·µ¤¯ §¤·¤ º¤¶∏¶¨§·² √¤¯¬§¤·¨ ·«¨ ©²µ¨¶··¼³¨¶¬§¨±·¬©¬¦¤·¬²± ¤¦¦∏µ¤¦¼ ²© ¶¨√¨ µ¤¯ ¤§√¤±¦¨§¶·¤·¬¶·¬¦¦¯¤¶¶¬©¬¦¤·¬²±
°¨ ·«²§¶qƒ¬±¤¯ ¼¯ o ²±¨ ¦¯¤¶¶¬©¬¦¤·¬²± ¶¦«¨ °¨ ¥¨¬±ª ¤¥¯¨·² ©¨©¨¦·¬√¨ ¼¯ ¶²¯√¨ ·«¨ ¶°¤¯¯ ·µ¤¬± ¶¤°³¯¨ ³µ²¥¯ °¨¶©²µ©²µ¨¶··¼³¨
¦¯¤¶¶¬©¬¦¤·¬²±∏¶¬±ª«¼³¨µ¶³¨¦·µ¤¯ §¤·¤ º¤¶¶∏ªª¨¶·¨§qŒ·º¤¶¶«²º±·«¤·©²µ¨¶··¼³¨ ¦¯¤¶¶¬©¬¦¤·¬²± ¤¦¦∏µ¤¦¼ ¦¤± ¥¨ ¬°³µ²√¨ §¬©
¤§√¤±¦¨§©¨¤·∏µ¨ ¬¨·µ¤¦·¬²± °¨ ·«²§o °∏¦« °²µ¨ ©¨©¨¦·¬√¨ ¶¨¦²±§ ²µ§¨µ¶·¤·¬¶·¬¦³¤µ¤°¨ ·¨µ ¶¨·¬°¤·¬²± °¨ ·«²§o¤±§¦²±·¨¬·p
¶¨±¶¬·¬√¨ ¶¤°³¯ ¶¨¦¯¤¶¶¬©¬¨µ¶∏¦«¤¶∞≤‹’ º¤¶¤³³¯¬¨§q
Κεψ ωορδσ} ∞’pt ‹¼³¨µ¬²±~«¼³¨µ¶³¨¦·µ¤¯ ~¶·¤·¬¶·¬¦³¤·¨µ± µ¨¦²ª±¬·¬²±~©²µ¨¶··¼³¨
由于光谱分辨率大幅度提高 o高光谱数据比多光谱具有更强的潜在的地物识别能力 o在林业遥感应用上
表现为潜在的森林类型识别能力 ∀但在有限训练样本条件下 o遥感数据维数的增高使样本Π维数比率大大降
低 o采用常规的统计模式识别方法反而无法得到较好的分类结果 ∀为此 o国际上对基于统计模式识别理论的
高光谱数据分类问题进行了深入地研究 o提出了一些旨在解决或减轻维数灾难问题的理论和方法
k¤±§ªµ¨¥¨ ousss ~⁄∏§¤ ετ αλqot|zv ~ •¬¦«¤µ§¶ot|{y ~ƒ∏®∏±¤ª¤ ετ αλqot|zs ~ƒ²¯ ¼¨ ετ αλqot|zx ~Ž¤½¤®²¶ot|z{ ~
≥º¤¬± ετ αλqot|zv ~ ⁄¨ √¬­¬√¨ µετ αλqot|{u ~¨¨ ετ αλqot||v ~ ‹²©©¥¨¦® ετ αλqot||y ~ƒµ¬¨§°¤±ot|{| ~Ž¨·¬ª ετ αλqo
t|zyl o积累了非常宝贵的经验 o并发展了功能强大的分类工具k¤±§ªµ¨¥¨ ot||v ~ussvl ∀这些理论方法和工具
是通过十几年的研究逐步发展起来的 o有着深厚的数理统计和信息论基础 ∀理解 !分析评价这些算法和工具
对于发展新的分类算法有重要作用 ∀遗憾的是 o国内对这些技术的引进 !消化和吸收都十分欠缺 ∀在这种技
术水平条件下 o要想在高光谱数据处理和分类算法上实现创新是比较困难的 ∀本文对国外先进 !成熟的高光
谱分类技术进行了较为详细 !系统地分析总结 o并采用在我国东北试验区获取的美国 ∞’2t ‹¼³¨µ¬²±高光谱
数据 o对国外先进的高光谱统计模式识别技术进行了比较评价研究 ∀
t 试验区及数据
111 试验区遥感数据获取情况
试验区位于吉林省汪清林业局所辖林区内 ∀在图版 ´pt中 o汪清林业局的范围由 ¤±§¶¤·∞א n影像表
示 ∀所获取的 ∞’pt ‹¼³¨µ¬²±高光谱数据成像时间为 usst年 z月 tw日 o以蓝色长方形表示 o呈一窄条状 o其
主要覆盖区域是浪溪林场 ∀图中白色图形是浪溪林场的林相图 o该区域是外业获取地面实况数据和分类方
法评价的实际区域 ∀为了外业获取地面实况数据的需要 o特获取了 u1x °空间分辨率 ≥°’×px全色数据 o其
成像时间为 ussw年 w月 u{日 o在图中用红色长方形表示其覆盖区域 ∀∞’pt高光谱数据空间分辨率为 vs ° o
总波段数为 uwu ∀在和 ≥°’×px正射校正影像配准前 o需要经过无效波段去除 !绝对辐射值转换 !坏行及条纹
修复等预处理过程 ∀
112 地面实况数据的获取
首先利用 ≥°’×px图像处理专用软件 Š∞’¬°¤ª¨ µ对 ≥°’×px全色影像进行正射校正处理 o控制点从 tΒx万
地形图上寻找 ∀数字高程模型k⁄∞l比例尺也是 tΒx万 o从国家测绘局基础地理信息中心购买 ∀ ⁄∞ 像元
大小为 ux ° o正射校正在东西向残差绝对值的平均值为 ws ° o而在南北向为 vs °∀正射校正后的 ≥°’×px影
像覆盖范围如图版 ´pt中红色长方形所示 ∀覆盖浪溪林场的窗口影像如图版 ´pu¤所示 o该图一个子窗口
k红线框l的全分辨率显示如图版 ´pu¥所示 ∀由于影像分辨率为 u1x ° o可以比较清楚地看到主要地物的空
间分布特征 ∀比如 o道路和裸地为白色 o特征很鲜明 ~在稀疏的林地上可以看到孤立大树的树冠 o呈深灰色 ~
树木稠密的区域呈深黑色 o但由于受低光谱分辨率的限制 o难于确定树种组成 ∀对图版 ´pu¤影像利用
≤¨²ª±¬·¬²±µ软件进行分割处理 o得到多边形矢量图层如图版 ´pu¥所示 o用粉红色多边形表示 ∀每个多边形
代表了一个在空间上具有一定的同质性的自然林分 ∀以这种形式确定的林分更加接近森林空间分布的自然
状态 o其面积通常也要比小班小得多 ∀图版 ´pu¥中黄色为林相图小班边界 ∀显然林相图小班作为一个经
营单位 o其平均属性难于精确地代表林分的自然状态 o因此本文以影像分割得到的多边形为单元进行地面实
况数据的调查 ∀
外业调查工作主要设备为装有 Š°≥系统的手持电脑 °⁄„系统 ∀°⁄„装有森林资源调查专用软件 o可以
精确地导航定位 o并直接将调查因子记录到数据库中 ∀采用角规调查和人工测量相结合的方法 o调查因子包
括 }土地覆盖类型 !有林地的优势树种平均胸径和树高 !林分内主要树种及其组成成数kts分法l !林分的郁
闭度及优势树种的龄组 ∀对所有面积大于 wss °u 的多边形都进行以上内容的调查 ∀将调查结果更新到地
理信息系统 o最终结果以 „• ≤Ќ‘ƒ’ ≤²√¨ µ¤ª¨ 矢量格式提供 ∀由于正射校正误差在 vs ∗ ws °左右 o而 Š°≥定
位误差也在 ts ∗ tx °左右 o直接对面积较小的多边形进行定位是很困难的 ∀因此在外业调查中 o先对面积
比较大的多边形的中心进行定位 o根据打印图件的影像特征对多边形的覆盖范围做出估计并进行调查 ∀对
面积较小的多边形 o以 Š°≥导航位置为参考 o结合影像纹理特征及多边形之间的位置关系确定调查点的具
体位置和测树范围 ∀
根据调查结果统计出该试验区出现的主要优势树种包括柞树k Θυερχυσ µονγολιχυσl !白桦k Βετυλα
πλατψπηψλλαl !臭松kΑβιεσ νεπηρολεπισl !落叶松kΛαριξ γ µελινιιl !樟子松k Πινυσσψλϖεστρισl和杨树k Ποπυλυ󶳳ql ∀调
查到的森林类型包括 }柞树林 !白桦林 !杨树林 !臭松林 !落叶松林 !樟子松林 !混交林 !阔叶林 !针叶林 !杂木
林 ∀其中指明树种名称的类型 o该树种的成数大于 x成 ~针叶林是指针叶树种的成数大于阔叶树种的成数 o
但没有一个针叶树种的成数超过 x成 ~阔叶林是指阔叶树种的成数大于针叶树种的成数 o但没有一个阔叶
树种的成数超过 x成 ~混交林是指林分由针叶 !阔叶树种组成 o但没有树种的成数大于 x成 ~杂木林是指以
槭属kΑχερl与榆属k Υλµυσl以及水曲柳k Φραξινυσ µανδσηυριχαl !核桃楸kϑυγλανσ µανδσηυριχαl等阔叶树种为主
的落叶森林植物群落 ∀
外业共调查了 z个区域 o各区域在浪溪林场的分布如图版 ´pv¤所示 ∀图版 ´pv¥给出了其中一个区域
的矢量显示 o多边形的填充色彩表示不同的优势树种类型 ∀图版 ´pv¥给出的优势树种类型是在所有 z个区
域中出现的类型 o在图版 ´pv¥所示的区域中有些树种并没有出现 ∀该试验区内大面积分布的树种并不多 o
统计结果表明 }所调查林分以阔叶林为最多 o占外业调查林分总面积的 xu1{y h ~其次是混交林 o占 uu1ww h ~
再次是柞树林 o占 tv1wt h ~白桦林占 w1s| h ~落叶松林 !臭松林和樟子松林的总和仅占 v1uv h ∀这基本代
表了该试验区内林分类型的实际分布面积比例情况 ∀
x{ 第 t期 陈尔学等 }高光谱数据森林类型统计模式识别方法比较评价
113 高光谱与 ΣΠΟΤ−5全色影像的配准
以 tΒx万地形图为参考寻找控制点建立多项式几何校正方程kƒtl o用于高光谱影像k„l的几何校正处
理 o这样校正后的高光谱影像k…l和正射校正过的全色影像k≤l之间基本配准 ∀为了达到 „与 ≤ 之间的精确
配准 o可以采用影像匹配的方法 ∀从 …中抽取和 ≥°’×px全色影像光谱范围最为接近的一个波段 o记为影像
⁄~对影像 ≤进行 tu倍缩小处理 o得到像元大小为 vs °的 ≥°’×px影像k∞l ∀在影像 ⁄与 ∞之间采用基于标
准化自相关系数的模板匹配方法 o自动寻找若干匹配点 o建立影像 ⁄与 ∞之间的坐标转换方程 o可以使 ⁄与
∞之间的配准精度在 t个像元之内 o由于 ∞已经过正射校正 o因此就可以得到影像 ⁄的几何校正方程kƒul ∀
根据 ƒt和 ƒu就可以推导出影像 „的几何校正方程kƒvl ∀利用 ƒv对高光谱影像 „进行几何校正重采用处
理 o就可以得到可以和 ≥°’×px全色影像精确配准的高光谱几何校正结果影像kŠl ∀由于外业调查的多边形
是在正射校正的 ≥°’×px影像上生成的 o因此外业测量的地面实况数据就可以配准到高光谱影像 Š上 ∀
u 高光谱统计模式识别方法
211 高光谱统计模式识别中的高阶统计量估计
从理论分析和实践应用可知 o一种陆地表面覆盖类型的光谱特征通常难于用单一一条光谱曲线充分表
达k¤±§ªµ¨¥¨ ousssl ∀农作物 !森林 !自然植被 !土壤 !矿物以及城镇目标等人们感兴趣的地物 o在自然界中以
不同的状态存在 o其辐射能力以不同的光照状态被传感器捕获 ∀这导致不应该用一个单一平均k或典型l光
谱响应 o而是用一系列的光谱响应表示地物的光谱特征 ∀实际上 o描述这一系列光谱响应的特性指标 o比如 o
这些光谱响应如何以平均光谱为中心上下变动 o和平均光谱响应一样都可以作为地物类型识别的指标 ∀实
际在理论上已经证实 o一个确定的统计分布可以通过一系列的具有各种阶数的统计量来完整地描述 ∀通常
只利用前两阶统计量k平均值和协方差l的主要原因在于 o利用有限的训练样本估计高阶统计量存在很大的
困难 ∀为训练分类器获取所必需的类别标识样本是非常费时 !费力的 ~更为困难的是 o由于地球表面覆盖具
有很强的变化性和动态性 o类别标识过程需要针对不同的数据分别进行 o而不能将基于 „数据获得的分类
器直接用于 …数据的分类处理 ∀由于高阶统计量需要非常庞大数量的类别标识样本点才能得到足够高的
估计精度 o因此利用高于两阶的统计量是不太现实的k¤±§ªµ¨¥¨ ousssl ∀随着光谱波段数的增加 o已知类别
标识样本点的数量是否充足问题变得更为突出 ∀因此研究评价可以有效克服小样本统计模式识别问题的特
征提取方法 !二阶统计参数估计方法对于高光谱数据分类精度的提高有重要作用 ∀
212 特征提取和特征选择方法
尽管 Ž变换k又称主成分变换l从信号表达的角度来说是最优的 o可以生成均方误差最小的主成分特
征 ~但从类别可分性上来说 oŽ变换生成的特征不是最佳的 o甚至被 Ž方法抛弃的那些分量有可能正是能
够把不同的类别区分开来的分量k⁄∏§¤ ετ αλqot|zvl ∀ ƒ¬¶«¨µ线性判别分析采用的是典范分析方法k•¬¦«¤µ§¶o
t|{yl ∀若均值向量很小或没有差别 o由典范分析得到的特征向量是不可信的 ~而且若一个类的均值向量和
其他类的均值向量差异很大 o就会导致无效的特征提取 ∀ ƒ∏®∏±¤ª¨ 等kt|zsl认识到最佳的代表特征不一定
是最佳的识别特征 o进而提出了 ƒ∏®∏±¤ª¨2Ž²²±·½方法 ∀该方法适用于类别间协方差差别大而无或有较小均
值差异的情况 o若存在较大的均值差异 o将导致不正确的结果kƒ²¯ ¼¨ ετ αλqot|zxl ∀ Ž¤½¤®²¶kt|z{l提出的线性
标量特征提取方法 o只能提取一个特征 o无法一般化为提取多个特征 ∀ ‹ ¼¨§²µ±kt|ztl提出的删除冗余特征的
方法 o只能在原始特征空间进行 o虽然先对数据进行线性变化 o然后再应用该方法也可以达到特征提取的目
的 ∀基于统计距离的特征选择方法也已有深入的研究和广泛的应用k≥º¤¬± ετ αλqot|zv ~ ⁄¨ √¬­√¨ µ ετ αλqo
t|{ul o其存在的主要问题是 }tl随着维数的增加 o需要搜索的特征组合会指数上升 o很快导致令人无法接受
的处理时间 o虽然也有一些寻求亚优特征组合的算法可以从一定程度上降低处理时间 ~ul特征选择只是在
原始特征上进行 o而最佳特征向量可能不在原始特征空间 o这种情况下该方法是无效的 ∀总之 o以上特征提
取和选择方法 o无法预测内在的可分辨维 o即无法决定可以达到在原始特征空间同样的分类精度的最小的变
换空间的特征数 o难于回答/应该选择多少个特征就可以满足分类需要了 ‚0的问题 ∀ ¨¨等kt||vl提出的决
策面特征提取k⁄…ƒ∞l方法可以很好地解决这些问题 o而且当平均值和协作方差阵很小时也可以得到正确的
结果 ∀本文将对 ⁄…ƒ∞特征提取方法的有效性进行评价 ∀
213 小样本条件下二阶统计参数的有效估计方法
当利用高斯最大似然法进行分类时 o每个类别的平均向量和协方差矩阵是未知的 o必须利用训练样本估
y{ 林 业 科 学 wv卷
计 ∀对于 π p维的数据 o除非样本数大于 π n t o否则协方差估计都是无效的 ∀高光谱遥感应用 o特征向量的
维数很大 o而训练样本数目总是非常有限 ∀这种较低的样本Π维数比率会降低协方差矩阵的估计精度 o从而
成为阻碍高斯最大似然法用于高维数据分类的重要因素 ∀ ‹²©©¥¨¦®等kt||yl提出了一种协方差矩阵的优化
估计方法 o称为/去一协方差矩阵估计法0k¯ ¤¨√¨ ²±¨ ²∏·¦²√¤µ¬¤±¦¨ °¤·µ¬¬ ¶¨·¬°¤·¬²±o’’≤l ∀试验证明 }当训练
样本数较少时 o’’≤方法与直接利用样本协方差矩阵 !公共协方差矩阵得到的分类精度相比有明显的提
高 ~’’≤方法比类似的 • ⁄„kµ¨ª∏¯¤µ¬½¨ §§¬¶¦µ¬°¬±¤±·¤±¤¯¼¶¬¶l方法kƒµ¬¨§°¤±ot|{|l可以得到较高的分类精度 o
并且处理时间有很大降低k‹²©©¥¨¦® ετ αλqot||yl ∀
214 分类方法
多光谱数据分类典型的做法是将一个/简单对称性0的决策依据应用于每个分辨单元k像元l o这意味着
每个像元仅仅依据其光谱测量值进行分类 ∀这种方法的基本假设是感兴趣目标与一个像元大小相比要大得
多 ∀否则 o一个像元的大部分区域会有 u个或更多的类别组成 o使统计模式识别方法无法使用 o比如说 o事先
确定的类别将不足以描述自然的真实状态 ∀由于抽样间隔一般和像元大小是相当的k为保持系统分辨率l o
通常每个目标由若干个像元组成的阵列组成 o这说明空间连续的客观目标间存在统计依赖性kŽ¨·¬ª ετ αλqo
t|zyl ∀基于/简单对成性0的分类方法称为/无记忆0分类法 o而考虑空间连续目标统计依赖性的分类方法称
为/记忆0分类法 ∀在遥感影像分类中 o常用的一些统计模式识别方法 o如最大似然法k l !最小距离法
k∞⁄l和光谱角分类法k≥„l都属于/无记忆0分类法kŽ¨·¬ª ετ αλqot|zyl ∀
∞≤‹’k ¬¨·µ¤¦·¬²± ¤±§¦¯¤¶¶¬©¬¦¤·¬²± ²© «²°²ª¨ ±¨ ²∏¶²¥­¨¦·l是一种典型的基于图像分割的 / 记忆0分类法 ∀
∞≤‹’先将统计上相似的像元归并在一起形成一个目标 o然后再对目标进行分类 ∀由于每个同质Π平滑区域
代表了一个统计/样本群0k若干个来自同一个群体的观察值l o可利用/样本群0分类器进行分类 ∀这样对目
标的分类不仅利用了组成该目标的每个像元的光谱信息 o而且还利用了像元周围其他邻近像元的上下文关
系信息 ∀这种将光谱信息和空间上下文信息综合应用的分类方法可以提高分类精度kŽ¨·¬ª ετ αλqot|zyl ∀
关于 ∞≤‹’的具体算法 o童庆禧等kussyl有较为详细的介绍 o由于篇幅所限 o本文就不再赘述 ∀本研究将对
∞≤‹’分类算法进行试验评价 o并将其分类精度和其他常规方法进行对比 ∀
215 高光谱森林类型统计模式识别方法评价方案
通过以上分析 o筛选得到了几种先进的高光谱统计模式识别方法 ∀为了比较评价这几种方法的有效性 o
设计了 v套具体的分类方案 o具体方法如表 t ∀所有的分类方案在分类处理的最初阶段都采用相同的训练
样本和精度检验样本 o这些样本的获取参考外业测量得到的地面实状数据 ∀以下评价结果中给出了由精度
检验样本计算得到的各类别的分类精度和所有类别的总分类精度 ∀
表 1 高光谱森林类型统计模式识别方法评价方案
Ταβ .1 Τηε σχηεµε φορ ϖαλιδατινγ φορεστ τψπεσστατιστιχ παττερν χλασσιφιχατιον µετηοδσ ωιτη ηψπερ2σπεχτραλ δατα
方案
≥¦«¨ °¨
特征变换方法
ƒ ¤¨·∏µ¨ ·µ¤±¶©²µ° ° ·¨«²§
统计参数计算方法
≥·¤·¬¶·¬¦³¤µ¤° ·¨¨µ¶
¦²°³∏·¤·¬²± ° ·¨«²§
参与比较评价的分类方法
≤¯ ¤¶¶¬©¬¦¤·¬²± ° ·¨«²§¶∏¶¨§
©²µ¦²°³¤µ¬¶²± ¤±§√¤¯¬§¤·¬²±
t 不进行任何特征变换•¬·«²∏·¤±¼ ©¨¤·∏µ¨ ·µ¤±¶©²µ°
常规统计参数计算方法
×µ¤§¬·¬²±¤¯ ¶·¤·¬¶·¬¦³¤µ¤°¨ ·¨µ¶
¦²°³∏·¤·¬²± ° ·¨«²§
最大似然法kl !最小距离法k∞⁄l !光谱角匹配法k≥„l !∞≤‹’法
¤¬¬°∏° ¬¯®¨ ¬¯«²²§kl o°¬±¬°∏° ∏¨¦¯¬§¨¤± §¬¶·¤±¦¨k∞⁄l o
¶³¨¦·µ¤¯ ¤±ª¯¨ °¤³k≥„l o∞≤‹’
u 不进行任何特征变换•¬·«²∏·¤±¼ ©¨¤·∏µ¨ ·µ¤±¶©²µ°
’’≤方法
’’≤ ° ·¨«²§
最大似然法kl !最小距离法k∞⁄l !光谱角匹配法k≥„l !∞≤‹’法
¤¬¬°∏° ¬¯®¨ ¬¯«²²§kl o°¬±¬°∏° ∏¨¦¯¬§¨¤± §¬¶·¤±¦¨k∞⁄l o
¶³¨¦·µ¤¯ ¤±ª¯¨ °¤³k≥„l o∞≤‹’
v ⁄…ƒ∞特征变换⁄…ƒ∞ ©¨¤·∏µ¨ ·µ¤±¶©²µ°
’’≤方法
’’≤ ° ·¨«²§
最大似然法kl !最小距离法k∞⁄l !光谱角匹配法k≥„l !∞≤‹’法
¤¬¬°∏° ¬¯®¨ ¬¯«²²§kl o°¬±¬°∏° ∏¨¦¯¬§¨¤± §¬¶·¤±¦¨k∞⁄l o
¶³¨¦·µ¤¯ ¤±ª¯¨ °¤³k≥„l o∞≤‹’
v 结果与分析
方案 t得到的分类结果如表 u所示 ∀该表没有列出 方法和 ∞≤‹’方法的分类结果 o因为这 u种方法
根本就无法正常运行 ∀ 方法和 ∞≤‹’方法都采用了二阶统计量k协方差矩阵l o但由于臭松 !人工落叶松
训练样本分别为 zy !yt个 o无法对协方差矩阵进行求逆运算 o因此无法实现分类处理过程 ∀这种分类结果证
实了由训练样本有限引起的高光谱数据分类的典型问题 }小样本使得基于二阶统计量的分类器无效 o更谈不
上精度问题 ∀ ∞⁄和 ≥„ 算法只基于一阶统计量k平均向量l o因此可以实现分类 o但分类精度都在 xs h以
下 ∀因此在对于本试验这种小样本 p多类别 p高维数据的分类问题 o不采用有效的特征提取方法和更先进
z{ 第 t期 陈尔学等 }高光谱数据森林类型统计模式识别方法比较评价
的统计参数计算方法是不可能得到满意的分类结果的 ∀
表 2 方案 1 分类结果 ≠
Ταβ .2 Χλασσιφιχατιον ρεσυλτ οφ σχηεµε 1
分类方法
≤¯ ¤¶¶¬©¬¦¤·¬²±
°¨ ·«²§¶
类别 ≤¯ ¤¶¶¨¶
„ … ≤ ⁄ ∞ ƒ Š ‹ Œ  Ž
总精度
ײ¤¯
¤¦¦∏µ¤¦¼
Ž¤³³¤
∞⁄ t{1s zz1x us1s s1s tt1u u{1y zv1t ts1| {t1z {y1v {{1v xx1y xs1u
≥„ ut1w {x1{ vw1x s1s tz1{ vv1v zy1s tw1t yt1{ zw1{ x{1{ w|1y wy1{
≠ „ q白桦林 „¶¬¤± • «¬·¨ …¬µ¦«©²µ¨¶·~…q柞树林 ²±ª²¯¬¤± ’¤®©²µ¨¶·~ ≤ q阔叶林 …µ²¤§p¯ ¤¨√ §¨©²µ¨¶·~ ⁄q臭松林 Ž«¬±ª¤± ƒ¬µ©²µ¨¶·~∞q落叶松林
⁄¤«∏µ¬¤± ¤µ¦«©²µ¨¶·~ƒ q人工落叶松林 ⁄¤«∏µ¬¤± ¤µ¦«³¯¤±·¤·¬²±~Š q针叶林 ≤²±¬©¨µ²∏¶©²µ¨¶·~‹ q混交林 ¬¬¨ §©²µ¨¶·~Œq云 ≤¯ ²∏§~‹ q阴影 ≥«¤§²º ~Žq
农田 „ªµ¬¦∏¯·∏µ¤¯ ¤¯±§q下同 ∀ ׫¨ ¶¤°¨¥¨ ²¯º q
方案 u得到的分类结果见表 v ∀和方案 t一样仍然是在原始数据空间对 w种分类方法进行精度评价 o只
是所采用的统计方法有类改变 o这里采用 ’’≤ 方法计算协方差矩阵 o而不是采用常规的方法 ∀显然 ’’≤
解决了小样本情况下协方差矩阵无法求逆问题 o和 ∞≤‹’方法都可以实现正常的分类处理 o而且 和
∞≤‹’的分类精度都要比 ∞⁄和 ≥„ 的高 ∀这里 ∞⁄和 ≥„ 的分类精度和方案 t是相同的 o因为 ’’≤
只是改进了二阶统计量的计算方法 o并没有改变平均向量的值 o因此对只采用平均向量进行分类的 ∞⁄和
≥„ 方法的分类精度没有任何影响 ∀表 v中 o法的分类总精度达到了 y{1{ h o∞≤‹’达到了 zs1u h o这有
力地证明了 ’’≤统计计算方法的有效性 o同时证实了二阶统计量对提高分类精度的作用 ∀
表 3 方案 2 分类结果
Ταβ .3 Χλασσιφιχατιον ρεσυλτ οφ σχηεµε 2
分类方法
≤¯ ¤¶¶¬©¬¦¤·¬²±
°¨ ·«²§¶
类别 ≤¯ ¤¶¶¨¶
„ … ≤ ⁄ ∞ ƒ Š ‹ Œ  Ž
总精度
ײ·¤¯
¤¦¦∏µ¤¦¼
Ž¤³³¤
 yv1u y|1u ws1x s1s wt1z w1{ ww1x ux1| |{1z |t1t |{1{ y{1{ yw1u
∞⁄ t{1s zz1v us1s s1s tt1u u{1y zv1t ts1| {t1z {y1v {{1x xx1y xs1u
≥„ ut1w {x1{ vw1x s1s tz1{ vv1v zy1s tw1t yt1{ zw1{ x{1{ w|1y wu1{
∞≤‹’ y|1u zu1v wv1w s1s wv1s w1{ wz1w ut1| |{1{ |t1t |{1{ zs1u yx1{
表 w是方案 v各分类方法的分类精度 ∀该方案首先利用 ⁄…ƒ∞特征提取方法将高光谱数据由原始特征
空间转换到变换特征空间 o从变换特征空间中提取前 ts个特征分量用于分类处理 o并且所采用的统计参数
计算方法是 ’’≤ 法 ∀和方案 u 相比 o由于采用了特征提取处理技术 o总分类精度由 y{1{ h 提高到
zu1{ h ~而 ∞≤‹’分类精度由 zs1u h提高到 zz1y h ∀≥„ 分类精度由 w|1y h提高到 yz1u h o但 ∞⁄方法分
类精度有所降低 ∀总的来看 o采用 ⁄…ƒ∞特征提取方法可以有效地提高基于二阶统计量的分类器的总分类
精度 ∀从表 v和表 w都可以看出 o∞≤‹’是 w种方法中分类精度最高的分类方法 ∀∞≤‹’是一种综合考虑了空
间 p光谱信息的面向目标或对象的分类方法 o和基于像元的分类方法相比 o通常可以获得较高的分类精度 ∀
表 4 方案 3 分类结果
Ταβ .4 Χλασσιφιχατιον ρεσυλτ οφ σχηεµε 3
方法
≤¯ ¤¶¶¬©¬¦¤·¬²±
°¨ ·«²§¶
类别 ≤¯ ¤¶¶¨¶
„ … ≤ ⁄ ∞ ƒ Š ‹ Œ  Ž
总精度
ײ·¤¯
¤¦¦∏µ¤¦¼
Ž¤³³¤
 y|1t x|1u zs1w s1s |1s ws1x xy1y tw1z ||1z |v1x ||1x zu1{ y{1y
∞⁄ y1{ yx1{ ux1x s1s |1x zt1w uz1t yu1u z{1u {t1z {s1y xt1y wt1v
≥„ u|1x yy1u ws1x s1s vw1s yy1z yy1{ vs1| |y1x |x1w |{1t yz1u yu1y
∞≤‹’ {t1w yy1| |t1y s1s t1y s1s zs1t t1| ||1| |v1x ||1x zz1y zw1s
≠各分类器都选择 ⁄…ƒ∞提取特征的前 ts个用于分类处理 ∀ ׫¨ ©¬µ¶·ts ⁄…ƒ∞·µ¤±¶©²µ° §¨©¨¤·∏µ¨ ¦²°³²±¨ ±·¶º µ¨¨ ∏¶¨§©²µ¤¯¯·«¨ ¦¯¤¶¶¬©¬¦¤·¬²±
° ·¨«²§¶q
从以上 v个方案的分析可以看出 o由于臭松 !人工落叶松的分类样本数很低 o而且一些树种实际上无法
和其他类别区分开来 o因此导致了一些类别的分类精度极低 ∀采用如下类别归并方案对训练样本和精度检
验样本进行类别合并处理 }tl白桦归并到阔叶林 ~ul臭松 !落叶松 !人工落叶松归并到针叶林 ∀经过类别归
并后得到的待分类优势树种类别包括 }柞树林 !阔叶林 !针叶林 !针阔混交林 w种 o其他非森林类型仍然保持
不变 ∀这里只对 和 ∞≤‹’ u种方法进行分类精度比较评价 o因为前面的分析已经证实基于一阶统计的
∞⁄和 ≥„ 方法分类不如基于二阶统计的方法效果好 ∀类别的合并使得样本Π维数比率提高 o可以从一定
程度上减轻小样本 p高光谱数据分类的维数灾难问题 o再加上采用有效的特征提取和二阶统计参数计算方
{{ 林 业 科 学 wv卷
法 o分类精度必然会有一定的提高 ∀从表 x也可以看出 o的总分类精度达到了 {y1w h o而 ∞≤‹’的总分类
精度更高 o达到了 |t1t h ∀表 x中 o对 w种森林类型的分类精度分别为 yy1x h !z{1{ h !yw1w和 y{1t h o都
在 ys h以上 ∀而表 w中 o对 {种森林类型的识别精度只有 u种在 ys h以上 ∀同样对比表 x和表 w可以看
出 }∞≤‹’不仅在总分类精度上有较大提高 o而且对 w种森林类型的分类精度都在 zv h以上 ∀另外 o从表 x
中 u种分类方法的对比来看 o无论是总分类精度还是各类别精度 o∞≤‹’都要比 高 o这再次说明了 ∞≤‹’
方法的优越性 ∀图版 ´pw是对应表 x的 u种处理方法的分类结果 ou种分类方法的结果基本是一致的 o只是
∞≤‹’分类结果的类别噪声相对要小得多 o不需要再对分类结果进行类别滤波处理 ∀
表 5 基于 ΛΟΟΧ和 ∆ΒΦΕ特征空间及类别归并处理的分类精度比较 ≠
Ταβ .5 Χοµ παρισον οφ ΜΛ ανδ ΕΧΗΟ χλασσιφιερσ αφτερ χλασσεσ χοµ βινατιον ωιτη ΛΟΟΧ στατιστιχ ανδ
ιν ∆ΒΦΕ τρανσφορµεδ φεατυρε σπαχε
分类方法
≤¯ ¤¶¶¬©¬¦¤·¬²±
°¨ ·«²§¶
类别 ≤ ¤¯¶¶¨¶
… ≤ Š ‹ Œ  Ž
总精度
ײ·¤¯
¤¦¦∏µ¤¦¼
Ž¤³³¤
 yy1x z{1{ yw1w y{1t ||1{ |v1v ||1x {y1w {v1y
∞≤‹’ zv1t {z1w {z1w {u1u ||1z |v1v ||1y |t1t {|1u
≠ u个分类方法都选择 ……ƒ∞提取特征的前 y 个用于分类处理 ∀ ׫¨ ©¬µ¶·y ⁄…ƒ∞ ·µ¤±¶©²µ°¨ §©¨¤·∏µ¨ ¦²°³²±¨ ±·¶ º µ¨¨ ∏¶¨§©²µ¥²·« ²©·«¨
¦¯¤¶¶¬©¬¦¤·¬²± ° ·¨«²§¶q
w 结论
本文利用在我国东北地区获取的美国卫星 ∞’pt ‹¼³¨µ¬²±高光谱数据 o基于详实的地面实状观测数据 o
对国外发展的几种先进的高光谱统计模式识别方法进行了比较评价研究 ∀结果表明 }tl基于二阶统计量的
分类器一般要比仅基于一阶统计的分类器表现优越 ~ul通过特征提取降低高光谱数据的维数 o可以减小样
本Π维数比率 o是提高小样本 p高光谱分类精度的不可缺少的处理步骤 o试验中所采用的 ⁄…ƒ∞特征提取方
法具有这种特性 ~vl在有限样本条件下 o采用更有效的二阶统计量计算方法可以解决由于样本数少而导致
的协方差矩阵计算病态问题 o试验结果证实了 ’’≤ 方法可以有效地提高分类精度 ~wl综合利用空间 p光
谱信息的分类方法k∞≤‹’l在试验中一致表现出较高的分类精度 o这和从理论分析得到有关该算法优越性的
结论是一致的 ~xl采用 ⁄…ƒ∞特征变换方法对高光谱数据进行特征提取 o利用所提取特征的前 y ∗ ts个分量
特征 o并利用 ’’≤ 算法进行二阶统计量的计算 o然后采用 ∞≤‹’方法进行分类处理 o是本研究所建议的高
光谱森林类型分类方案 ∀
参 考 文 献
童庆禧 o张 兵 o郑兰芬 qussy1 高光谱遥感 ) ) ) 原理 !技术与应用 q北京 }高等教育出版社 outz p ut{
⁄¨ √¬­√¨ µ° oŽ¬·¯ µ¨qt|{u1 °¤·¨µ± µ¨¦²ª±¬·¬²±}¤¶·¤·¬¶·¬¦¤¯ ¤³³µ²¤¦«q°µ¨±·¬¦¨Π‹¤¯¯Œ±·¨µ±¤·¬²±¤¯
⁄∏§¤ • ’ o ‹¤µ·° ∞qt|zv1 °¤·¨µ± ¦¯¤¶¶¬©¬¦¤·¬²± ¤±§¶¦¨±¨ ¤±¤¯¼¶¬¶q²«± • ¬¯¨ ¼ i ≥²±¶
ƒ²¯ ¼¨ ⁄ ‹ o≥¤°°²±  • qt|zx1 „± ²³·¬°¤¯ ¶¨·²©§¬¶¦µ¬°¬±¤±·√¨ ¦·²µ¶qŒ∞∞∞ ×µ¤±¶≤²°³∏·¨µo≤puwkvl }u{t p u{|
ƒµ¬¨§°¤±  ‹ qt|{|1 • ª¨∏¯¤µ¬½¨ §§¬¶¦µ¬°¬±¤±·¤±¤¯¼¶¬¶q „° ≥·¤·¬¶·¬¦¤¯ „¶¶²¦o{w }tyx p tzx
ƒ∏®∏±¤ª¤ ŽoŽ²²±·½ • Š qt|zs1 „³³¯¬¦¤·¬²± ²©·«¨ Ž¤µ«∏±¨ ±p²¨ √¨ ¬¨³¤±¶¬²±·²©¨¤·∏µ¨ ¶¨¯¨ ¦·¬²± ¤±§²µ§¨µ¬±ªqŒ∞∞∞ ×µ¤±¶≤²°³∏·¨µo≤pt|kwl }vtt p vt{
‹ ¼¨§²µ± • ° qt|zt1 • §¨∏±§¤±¦¼¬± ©¨¤·∏µ¨ ¬¨·µ¤¦·¬²±qŒ∞∞∞ ×µ¤±¶≤²°³∏·¨µotsxt p tsxw
‹²©©¥¨¦®° o⁄¤√¬§„ qt||y1 ¤±§ªµ¨¥¨ o¦²√¤µ¬¤±¦¨ °¤·µ¬¬ ¶¨·¬°¤·¬²± ¤±§¦¯¤¶¶¬©¬¦¤·¬²± º¬·« ¬¯°¬·¨§·µ¤¬±¬±ª§¤·¤qŒ∞∞∞ ×µ¤±¶¤¦·¬²± ²± °¤·¨µ± „±¤¯¼¶¬¶¤±§
¤¦«¬±¨ Œ±·¨¯ ¬¯ª¨ ±¦¨ ot{kzl }zyv p zyz
Ž¤½¤®²¶⁄qt|z{1 ’±·«¨ ²³·¬°¤¯ ¬¯±¨ ¤µ©¨¤·∏µ¨ qŒ∞∞∞ ×µ¤±¶Œ±©²µ°¤·¬²± ׫¨ ²µ¼oŒ×puwkxl }yxt p yxu
Ž¨·¬ª• o¤±§ªµ¨¥¨ ⁄ „ qt|zy1 ≤¯ ¤¶¶¬©¬¦¤·¬²± ²© °∏¯·¬¶³¨¦·µ¤¯ ¬°¤ª¨ §¤·¤ ¥¼ ¬¨·µ¤¦·¬²± ¤±§ ¦¯¤¶¶¬©¬¦¤·¬²± ²© «²°²ª¨ ±¨ ²∏¶²¥­¨¦·¶qŒ∞∞∞ ×µ¤±¶¤¦·¬²±¶²±
Š¨ ²¶¦¬¨±¦¨ ∞¯ ¦¨·µ²±¬¦¶oŠ∞p twktl }t| p uy
¨¨ ≤ o¤±§ªµ¨¥¨ ⁄ „ qt||v1 ƒ ¤¨·∏µ¨ ¬¨·µ¤¦·¬²± ¥¤¶¨§²± §¨¦¬¶¬²± ¥²∏±§¤µ¬¨¶q°«⁄ §¬¶¶¨µ·¤·¬²± ¬± ≥¦«²²¯ ²© ∞¯ ¦¨·µ¬¦¤¯ ∞±ª¬±¨ µ¨¬±ªo°∏µ§∏¨ ˜±¬√¨ µ¶¬·¼o • ¶¨·
¤©¤¼¨ ·¨ oŒ±§¬¤±¤
¤±§ªµ¨¥¨ ⁄ „ qt||v1 „ ³¨µ¶³¨¦·¬√¨ ²±·«¨ ¤±¤¯¼¶¬¶²©«¼³¨µ¶³¨¦·µ¤¯ §¤·¤o³µ²¦¨ §¨¬±ª¶²©·«¨ ¬±·¨µ±¤·¬²±¤¯ ª¨²¶¦¬¨±¦¨ ¤±§µ¨°²·¨ ¶¨±¶¬±ª¶¼°³²¶¬∏° kŒŠ• „≥≥.
|vl qײ®¼²otvyu p tvyw
¤±§ªµ¨¥¨ ⁄ „ qussv1 ≥¬ª±¤¯ ·«¨ ²µ¼ ° ·¨«²§¶¬± °∏¯·¬¶³¨¦·µ¤¯ µ¨°²·¨ q≥¨ ±¶¬±ªo • ¬¯¨ ¼ }‘
¤±§ªµ¨¥¨ ⁄ „ q usss1 ’± ·«¨ µ¨ ¤¯·¬²±¶«¬³ ¥¨·º¨¨ ± ¦¯¤¶¶ §¨©¬±¬·¬²± ³µ¨¦¬¶¬²± ¤±§ ¦¯¤¶¶¬©¬¦¤·¬²± ¤¦¦∏µ¤¦¼ ¬± «¼³¨µ¶³¨¦·µ¤¯ ¤±¤¯¼¶¬¶q °µ²¦¨ §¨¬±ª¶²© Œ∞∞∞q
Š¨ ²¶¦¬¨±¦¨ ¤±§ • °¨²·¨ ≥ ±¨¶¬±ª≥¼°³²¶¬∏° o ‹²±²¯∏¯∏o ‹¤º¤¬¬
•¬¦«¤µ§¶„ qt|{y1 • °¨²·¨ ¶¨±¶¬±ª§¬ª¬·¤¯ ¬°¤ª¨ ¤±¤¯¼¶¬¶q≥³µ¬±ª¨µp∂ µ¨¯¤ª
≥º¤¬± ° ‹ oŽ¬±ª • ≤ qt|zv1 ׺² ©¨©¨¦·¬√¨ ©¨¤·∏µ¨ ¶¨¯¨ ¦·¬²± ¦µ¬·¨µ¬¤©²µ°∏¯·¬¶³¨¦·µ¤¯ µ¨°²·¨ ¶¨±¶¬±ªq°µ²¦ƒ¬µ¶·Œ±·²¬±·≤²±©²± °¤·¨µ± • ¦¨²ª±¬·¬²±oxvy p xws
k责任编辑 石红青l
|{ 第 t期 陈尔学等 }高光谱数据森林类型统计模式识别方法比较评价