ENVI中光谱分类方法
非监督分类——无训练样本,自动聚合 ——K-means——软件进行easy
监督分类——在分类前,先选择样本区域,再根据分类器进行分类;——神经网络
类别判读——样本选择——分类器——分类——分类后处理——分类验证
(一)判读样本:林地、草地、沙地、裸地
(二)样本选择:新建ROI,每一类多选几个样本
判断样本质量——利用样本的可分离性
Jefferies , transformed 都大于1.9说明分离情况较好;<1就合并到一起
样本保存 .xml
(三)分类器选择
(1)平行六面体——根据训练样本亮度值形成n维平行六面体数据空间,其他像元光谱落在平行六面体任何一个训练样本所对应区域,就划分其对应的类别中。
(2)最小距离——利用训练样本数据计算每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪类最小,则归入到哪一类。
(3)马氏距离——计算输入图像到个训练样本的协方差距离,协方差最小的放入此类别【经常解决两个未知样本集的相似度的方法】
(4)最大似然估计——假设每一个波段的每一类统计都呈现正态分布,计算给定像元属于某一个训练样本的似然度,像元最终被归并到似然度最大的一类中。
(5)神经网络——模拟人脑的结构,用许多小的处理单元模拟生物的神经元,用来实现人脑的识别、记忆、思考。
(6)支持向量机(SVM)——自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化。
(7) 在N维空间将像元与参照波谱进行匹配,通过计算波谱间的相似度,之后对波谱之间相似度进行角度的对比,较小的角度表示更大的相似度。
(四)分类后处理:后面会有笔记
(五)分类结果验证
混淆矩阵和BOC
可以用更高分辨率进行验证
下面对混淆矩阵中的几项评价指标进行说明:
总体分类精度
等于被正确分类的像元总和除以总像元数。被正确分类的像元数目沿着混淆矩阵的对角线分布,总像元数等于所有真实参考源的像元总数,如本次精度分类精度表中的Overall Accuracy = (1849/2346) 78.8150%。
Kappa系数
它是通过把所有真实参考的像元总数(N)乘以混淆矩阵对角线(XKK)的和,再减去某一类中真实参考像元数与该类中被分类像元总数之积之后,再除以像元总数的平方减去某一类中真实参考像元总数与该类中被分类像元总数之积对所有类别求和的结果。
Kappa计算公式
错分误差
指被分为用户感兴趣的类,而实际属于另一类的像元,它显示在混淆矩阵里面。本例中,林地有419个真实参考像元,其中正确分类265,12个是其他类别错分为林地(混淆矩阵中林地一行其他类的总和),那么其错分误差为12/419=2.9%。
漏分误差
指本身属于地表真实分类,当没有被分类器分到相应类别中的像元数。如在本例中的耕地类,有真实参考像元465个,其中462个正确分类,其余3个被错分为其余类(混淆矩阵中耕地类中一列里其他类的总和),漏分误差为3/465=0.6%
制图精度
是指分类器将整个影像的像元正确分为A类的像元数(对角线值)与A类真实参考总数(混淆矩阵中A类列的总和)的比率。如本例中林地有419个真实参考像元,其中265个正确分类,因此林地的制图精度是265/419=63.25%。
用户精度
是指正确分到A类的像元总数(对角线值)与分类器将整个影像的像元分为A类的像元总数(混淆矩阵中A类行的总和)比率。如本例中林地有265个正确分类,总共划分为林地的有277,所以林地的用户精度是265/277=95.67%。
注:监督分类中的样本选择和分类器的选择比较关键。在样本选择时,为了更加清楚的查看地物类型,可以适当的对图像做一些增强处理,如主成分分析、最小噪声变换、波段组合等操作,便于样本的选择;分类器的选择需要根据数据源和影像的质量来选择,比如支持向量机对高分辨率、四个波段的影像效果比较好。