一、背景:
seeks to extract these independent components and the mixing matrix of coefficients,通过线性变换寻求统计独立和非高斯分布的潜变量
PCA:降维,去相关性(二阶统计量)
ICA: 不仅去相关性(二阶统计量),还能减少高阶统计量依赖。
注:独立一定不相关(线性);不相关不一定独立
如果潜变量服从非高斯分布,ICA 对原始源信号的提取程度远远大于 PCA
二、模型:
其中 是数据矩阵(与 PCA 相反,ICA 采用转置数据矩阵),
是未知混合矩阵,
是独立分量矩阵,
是残差矩阵,n 是样本数量。
我们假设(当 ,残差矩阵 E变成零矩阵)。
在已知观测信号X,而源信S号和混合系数A都未知的情况下,希望找到一个分离矩阵W,以便从观测信号中分离出统计独立的源信号,即
在独立分量分析中,分离矩阵砰与混合矩阵的关系为
三、预处理
1、约束条件
为确保独立分量分析方法的顺利进行,下约束条件:
1) 源信号的各成分是瞬时统计独立的。
2) 各源信号服从非高斯分布,或至多存在一个源信号服从高斯分布,否则无法实现源信号的分离。
3) 观测信号的数目不少于源信号 的数目。
2、数据预处理
1)中心化:消除数据中存在的一阶统计相关性
2)白化或球化(whitening or sphering):在标准化基础上使各分量间彼此正交,达到消除数据二阶统计相关性目的
设随机变量X的第k次采样值为x(k),则其协方差矩阵为:
的特征值分解为:
白化变换的表达式为:
白化变换矩阵Q为:
B是一个正交矩阵
白化变换后,ICA的任务从求解矩阵,变为求解正交矩阵
因此,我们可以估计s(k)为:,
其中
3、ICA的目标函数和优化算法
独立分量分析=目标函数+优化算法
1) 目标函数;非高斯的最大化
在独立分量分析的模型中,观测信号x(k)是由m个独立的源信号线性混合而成,因此它比其中任意一个源信号更加趋于高斯分布。如果能够找到一个向量w作用于混合信号x(k),使得变换后的结果尽量偏离高斯分布,即非高斯最大化,那么得到的就是其中的一个源信号。同理,可以分离出余下的m-1个源信号。
衡量非高斯性的大小---熵
定义概率密度为f(y)的随机变量y的熵H为:
负熵J为:
负熵近似为:
常用的G函数形式有:
2) 优化算法:FastICA
4、ICA 的排序和降维
we used a Euclidean norm L2 to sort the rows of the demixing matrix, W
可以计算分离矩阵W的行向量的欧氏范数,即其中其中i=1,2,3…d,以此为标准从大到小顺序排列行向量,然后选取前面几个范数和中所占比重大的行向量作为主部,剩下的作为余部,
四、统计量和控制限
: dominant part of W
: excluded part of W
;
统计量:
The confidence limits of the threestatistics,, can be obtained by kernel density estimation
控制限:
non-parametric empirical density estimates using kernel extraction
???
具有核 K 的单变量核估计量:
x is the data point under consideration,
is an observation value from the data set,
h is the window width (also known as the smoothing parameter),
n is the number of observations, and
K is the kernel function
窗宽随样本个数而趋于零。当取得太小时,随机性的影响增加,使呈现很不规则的形状,这可能掩盖的重要特性反之。太大,则将会过度平滑,使比较细致的性质不能显露出来。
The kernel function K :
选用标准正态密度函数作为核函数,在选取窗宽参数时,考虑到这里的目的是面向工业过程的监控应用,不需要达到理论上的高度最优化,所以窗宽参数的大小可按照下面的关系式计算得到:
其中C=0.7853为对应于标准正态密度核函数的一个常数,Q是样本的四分位数间距,n是样本的个数。
变量贡献图:
测量变量在第K个采样时刻对两种统计量的贡献值分别为
通过直方图可以把这些贡献值大小直观地表示出来,这样就可以较容易看出引起过程异常的具体原因。