Auto encoder 和Denoising auto encoder分别和PCA之间的关系（学习笔记）(1)

【深度学习】【auto-encoder】原文链接

鉴于这几天心情大好，于是我决定在挖一个大坑，讲一讲Auto encoder和PCA的关系以及 Denoising auto encoder 和PCA的关系（流形学习角度），今天这一篇作为这个大坑的第一步，我打算讲讲有关Auto encoder的基础概念，基本上讲有关DL的博客都有说的什么深度结构的优势什么的，我这就不多说了，接下来直接进入正题，按照惯例，先上个图：

这些都是我们接下来会用到的符号，请各位看官看仔细了，既然讲到Auto encoder，那就不得不提到表示（representation)这个词了，我们的auto encoder所要达到的目标就是找到输入的一个新的高级表示，假设输入层的维数比隐藏层低则称我们获得的表示是over-complete representation，反之则是under-complete representation，当然，获得的表示是有质量差别的，我们不能照单全收，所以我们需要一个标准来确定什么是一个好的表示，一个好的表示最低限度的要求是最大限度的保有输入所带有的“信息”（这里联系到信息论了），然后在这之上的就是是否可以使得分类的效果提升等的要求，当然了，如果把这些要求全讲出来会使得这个文章变得相当的混乱，当然，我们时常提到的稀疏性也是好的表示的标准之一。

好了，接下来开始推导了，各位看官可看仔细了。

刚刚我说了一个好的表示最低限度的要求是最大限度的保有输入所带有的信息，那好，感性的认识各位看官应该都有了，但是如果要变成实际的式子要如何表示呢？，我估计有人应该看出来了，对，就是互信息！，那为什么是使用互信息表示呢？因为其实互信息表示的其实就是两个随机事件的相关性的度量，互信息的式子如下

其实通俗点说，所谓的熵就是不确定性的度量，一般来说，感到闷热的话很有可能是会下雨了，于是可以做个假设，假设随机变量Y表示的是闷热与否，随机变量X表示的是是否下雨，这时候的条件熵

的值会比随机变量X的熵要低，因为闷热和下雨是有相关性的，从而在给定Y（闷热）的条件下，X（下雨）的不确定减少了，而互信息就是由随机变量X的熵减去随机变量X给定Y的条件熵，我想接下来我应该不用解释了，各位看官应该明白了。

好，终于绕回来了，作为一位语文老师死得早的娃来说，我又让我语文老师黄泉之下泪奔三千里了，好了，既然互信息是相关性的度量，那我们的任务就应该是最大化互信息，使得输入层和隐层的相关性最大，从而获得好的表示，如下式所示：

各位看官一定在想H（X）去哪里了吧，其实很简单，我们所要学习的参数

的来源是见下图

（这次结构有点乱，下次会好的，各位看官见谅）。

好了，关键的一部来了，见下图：

这个其实是由这个推出来的

，这样我们就确定了互信息的下界了，所以只要我们不断提升下界就可以了，现在可能还有点看不出个所以然，但是各位看官别急，慢慢你就会发现原来如此了。接下来下一步：

各位看官注意一下这里的多了一个参数，这个就是我们要最大化的式子了其实就是从上一个图那里来的，我们的最大值将会在当

时得到（和相对熵的性质有关系，其实这个就是相对熵等于0的时候，根据相对熵的定义就可以得到）。

如果设

那我们就可以得到以下的式子：

注意看，这两个式子是有差别的，差别就在q（X）这里，这个其实是输入X（训练样本）的分布，但是我们不知道这个分布，所以我们用训练样本的经验平均值代替了。

好了，终于绕完了，现在我们正式引入传统的auto encoder，接下来你就会发现前面的推导有多有用了。

这些都是相当基础的东西了，估计各位看官应该都知道了。好了，接下来重要的来了

这样我们就有了loss function的统一标准了（个人看法），凡是满足这个条件的都可以当做loss function，底下就是可以使用的loss function的例子

当然，我们的目标函数也可以表示成这个样子，这就是大家平时所见的AE的目标函数了

最后的最后，总的来说，auto encoder是通过减小重构误差来提升X和Y的互信息的lower bound，从而学习到一个好的表示的。

本人菜鸟一只，希望各位大大多多指正。

下一篇讲Denosing autoencoder（流形学习方面）

最后编辑于：2017.11.27 03:30:43

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,802评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,109评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,683评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,458评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,452评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,505评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,901评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,550评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,763评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,556评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,629评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,330评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,898评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,897评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,140评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,807评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,339评论 2赞 342

Auto encoder 和Denoising auto encoder分别和PCA之间的关系（学习笔记）(1)

推荐阅读更多精彩内容