LDA线性判别分析与PCA降维的区别

LDA线性判别分析

线性判别分析(Linear Discriminant Analysis,LDA)是一种有监督学习算 法,同时经常被用来对数据进行降维。它是Ronald Fisher在1936年发明的,有些资 料上也称之为Fisher LDA(Fisher’s Linear Discriminant Analysis)。LDA是目前机 器学习、数据挖掘领域中经典且热门的一种算法。
相比于PCA,LDA可以作为一种有监督的降维算法。在PCA中,算法没有考 虑数据的标签(类别),只是把原数据映射到一些方差比较大的方向上而已。
假设用不同的颜色标注C1、C2两个不同类别的数据,如图4.4所示。根据PCA 算法,数据应该映射到方差最大的那个方向,亦即y轴方向。但是,C1,C2两个不
同类别的数据就会完全混合在一起,很难区分开。所以,使用PCA算法进行降维 后再进行分类的效果会非常差。但是,如果使用LDA算法,数据会映射到x轴方 向。那么,LDA算法究竟是如何做到这一点的呢?



LDA的中心思想——最大化类间距离和最小化类内距 离。
我们已经找到了使得类间距离尽可能大的投影方式,现在只需要同 时优化类内方差,使其尽可能小。我们将整个数据集的类内方差定义为各个类分 别的方差之和,将目标函数定义为类间距离和类内距离的比值,于是引出我们需 要最大化的目标


Fisher LDA相比PCA更善于对有类别信息的数据进行降 维处理,但它对数据的分布做了一些很强的假设,例如,每个类数据都是高斯分 布、各个类的协方差相等。尽管这些假设在实际中并不一定完全满足,但LDA已 被证明是非常有效的一种降维方法。主要是因为线性模型对于噪声的鲁棒性比较 好,但由于模型简单,表达能力有一定局限性,我们可以通过引入核函数扩展 LDA方法以处理分布较为复杂的数据。

PCA是有监督的降维算法,而LDA是无监督的降维 算法。虽然在原理或应用方面二者有一定的区别,但是从这两种方法的数学本质 出发,我们不难发现二者有很多共通的特性。

LDA线性判别分析与PCA降维的区别

首先从目标出发,PCA选择的是投影后数据方差最大的方向。由于它是无监 督的,因此PCA假设方差越大,信息量越多,用主成分来表示原始数据可以去除 冗余的维度,达到降维。而LDA选择的是投影后类内方差小、类间方差大的方 向。其用到了类别标签信息,为了找到数据中具有判别性的维度,使得原始数据 在这些方向上投影后,不同类别尽可能区分开。

举一个简单的例子,在语音识别中,我们想从一段音频中提取出人的语音信 号,这时可以使用PCA先进行降维,过滤掉一些固定频率(方差较小)的背景噪 声。但如果我们的需求是从这段音频中区分出声音属于哪个人,那么我们应该使 用LDA对数据进行降维,使每个人的语音信号具有区分性。

另外,在人脸识别领域中,PCA和LDA都会被频繁使用。基于PCA的人脸识 别方法也称为特征脸(Eigenface)方法,该方法将人脸图像按行展开形成一个高 维向量,对多个人脸特征的协方差矩阵做特征值分解,其中较大特征值对应的特 征向量具有与人脸相似的形状,故称为特征脸。Eigenface for Recognition一文中将 人脸用7个特征脸表示(见图4.7),于是可以把原始65536维的图像特征瞬间降到7 维,人脸识别在降维后的空间上进行。然而由于其利用PCA进行降维,一般情况 下保留的是最佳描述特征(主成分),而非分类特征。如果我们想要达到更好的 人脸识别效果,应该用LDA方法对数据集进行降维,使得不同人脸在投影后的特 征具有一定区分性。

从应用的角度,我们可以掌握一个基本的原则——对无监督的任务使用PCA
进行降维,对有监督的则应用LDA。 ·总结与扩展·
至此,我们从数学原理、优化目标以及应用场景的角度对比了PCA和LDA这 两种经典的线性降维方法,对于非线性数据,可以通过核映射等方法对二者分别 进行扩展以得到更好的降维效果。关于特征脸这一降维应用,有兴趣的读者可以 拜读最经典的Eigenface论文[4],更好地理解降维算法的实际应用。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容