基于主成分分析的岩性信息提取

如题所述

1. 主成分分析基本原理

主成分分析法 ( Principal Component Analysis,PCA) 是多变量统计方法中的一种,该概念首先由 Karl Pearson 在1901 年提出,当时只限于非随机变量的讨论,1933 年 Hotelling将该概念推广到随机变量。主成分分析法通过将具有一定相关性的多个指标转化为少数几个综合性指标,在确保数据信息丢失最少的前提下对高维变量空间作降维处理,因此是综合处理上述多变量问题的一种强有力的工具。若需要解决的问题中指标数越多且各指标间相关程度越密切,则主成分分析法降维处理的优越性越能得到充分体现。

在多光谱遥感影像中,各个波段影像之间存在相关性,并包含了冗余信息,基于主成分分析的基本思想是,将一组线性相关的变量变为一组相互独立的、相互正交的变量,而新的变量是输入变量的线性组合。这样就能消除各个波段影像之间的信息冗余。这种方法,所得到的结果是能够改变 P 个波段影像变换到 Y ( Y < P) 个主分量的像素定义,能够简化多光谱影像的数据处理过程,但不损失原影像信息。有关主成分分析的详细基本原理参见第四章第三节 K - L 变换。

2. 基于 TM 影像主成分分析实例

选取研究区内蒙古大青山地区色尔腾山一段 TM 影像的 710 ×470 子区进行试验研究( 周成虎,2003) 。该区出露的岩石主要为: 桑干群 ( Ar1Sg) 片麻岩夹大理岩组、五台群( Ar2Wt) 绿 泥 片 岩 和 绢 云 石 英 片 岩 夹 含 铁 石 英 岩; 侏 罗 系的 中、下 统 石 拐 群 ( J1 - 2Sh1 - 2,3) 砂页岩组和砾岩组; 燕山早期肉红色中细粒钾长花岗岩 ( γ25) ,加里东晚期灰绿色细粒黑云母花岗岩 ( γo33) ( 图 7-13) 。

TM 数据的轨道号为: PATH-128,ROW = 32,由于 TM 第 6 波段空间分辨率较低,因而未利用,只对其余六个波段进行了主成分分析和对应分析处理。

对所选影像进行主成分分析,特征向量矩阵见表 7-3。

分析表 7-3,可得出如下几点结论:

( 1) 在 PC1 主成分上,六个波段均为正值,其中第 5 波段贡献最大,其次是波段 7,4 和 3。总体说来,PC1 主成分反映的是影像六个波段的加信息,反映在 PC1 影像,主要表现的是亮度信息和地形信息。

( 2) PC2 主成分是波段 4,5,7 的和减去波段 1,2,3 的和的线性变换,其中第 1 波段与 PC2 呈明显的负相关。

( 3) PC3 主成分是波段 1,5,7 的和减去波段 2,3,4 的和的线性组合,其中除波段1 之外,其余波段对 PC2 主成分的贡献基本相同。

( 4) PC4 主成分主要反映的是波段 5 的减信息和波段 7 的加信息。

( 5) 波段 2 和波段 4 对 PC5 主成分的贡献最大,其中波段 2 为加信息,波段 4 为减信息,PC5 是它们的体现。

图 7-13 色尔腾山矿产地质示意图( 据内蒙古地区矿产局 1∶20 万佘太镇矿产图)

表 7-3 主成分分析的特征向量矩阵

( 6) PC6 是波段 2 和波段 4 的加信息与波段 3 的减信息的线性组合。

图 7-14 是上述六个特征向量 ( 主成分) 反变换后的影像。

从图 7-14 的六个主成分影像看,主成分 5,4,3 ( PC5,PC4,PC3) 较好地反映了该区的岩性信息。另外,各种岩石在这三个主成分影像上的反差也大,故选取 PC5,PC4,PC3 作假彩色 RGB 合成,结果很好地进行了该区岩性的提取和区分。将结果与地质示意图相对照,基本吻合。与原始影像 1,4,7 波段的假彩色合成影像相比,岩性信息更加突出 ( 图版 11) 。

图 7-14 研究区 TM 影像的六个主成分影像( 据周成虎等,2003)

温馨提示:答案为网友推荐,仅供参考