没有免费午餐

好的,相信你多半可能是对这个标题产生兴趣才进来的,本文章可跟吃的没有任何关系呢,"没有免费午餐"定理(No Free Lunch,简称NFL)是Wolpert和Macerday提出的“最优化理论的发展”之一。不和吃的有关你可能会失望了,但是这是一个非常有趣的一个定理,我相信等你看完你也会觉得的。

我们先来思考一下这么一个问题,现在机器学习和深度学习在我们的生活中,已经成为了不可缺少的一部分,就单单对我们生活而言,他们的发展极大方便了我们的生活,例如你每天都要使用手机上网,互联网的存在以及它们的应用给你带来了乐趣和便利。 那么既然机器学习和深度学习的成功,存不存在着一种算法,它能够在任何领域,任何情况下都表现为最佳,即有没有一种最好的算法,这样科学家们只需要努力的寻找这么一种算法就好了,但是很遗憾,事实证明,这并不存在。那么接下来,我们一起看一下这个定理的简单证明。接下来会涉及一点数学,每步我都会进行解释,看看数学家们是如何运用数学来完美解释的!


简单说一下机器学习,是建立一个解决问题的模型(算法),然后通过对给定训练集的样本进行学习,通过学习不断优化自身,让其向这个问题的真实模型靠近,最后学得一个模型,使得能够在训练集之外的样本,即未见样本,对其进行预测,仍会有好的表现!

例如我们现在要训练一个模型,让它能够用来对西瓜进行分类,将西瓜分成好瓜和坏瓜,这是一个二分类问题。 给的的训练集是西瓜的一些属性,例如假设决定西瓜得好坏由以下属性决定,当模型在这个数据集上进行学习,不断得优化自己,然后在未见样本下,对其进行预测,仍然有很好得表现!即我们模型的泛化能力很好,这是我们训练模型的终极目标!


首先,假设一个算法为a,而随机胡猜的算法为b,为了简单起见,假设 样本空间为\gamma 和 假设空间H 都是离散的。令 P(h|X,a) 表示算法a基于训练数据 X 产生 假设h 的概率,再令 f 代表我们希望学习的真实目标函数。算法a的训练集外(测试集)误差,即算法a在训练集之外(测试集)的所有样本上的误差为:

E_{ote}(a|X,f)=\sum_{h}\sum_{x\in \gamma -X}P(X)l(h(x)\neq f(x))P(h|X,a)

其中函数l(\bullet )为指示函数,当里面的为真,即h(x)\neq f(x),函数取值为1,否则为0. P(h|X,a) 表示在使用算法a时,认为训练集数据X为假设h的概率。

令人生畏的长公式,不过我们来依次解读它,

首先看里面这个,\sum_{x\in \gamma -X}P(X)l(h(x)\neq f(x)), 预测值h(x)与真实值f(x)一致则误差为0,不一致则误差为1,即I(h(x)≠f(x)),由于x是一个随机变量,那么这个误差值也是一个随机变量,取值为0或1,其在训练集之外的所有样本上的 期望 可以看作 假设函数h 在训练集之外的所有样本上预测的错误率定义为 假设函数h 对 训练集之外的样本 x 的误差

与此同时,在 算法a 的假设空间中可能会存在多个假设函数 与训练集一致,每一个假设函数的产生是有概率的,假设算法a在训练数据集X上产生某个假设h的概率为 P(h|X, a)(在使用算法a,把训练集样本X,认为是假设h的概率),那么,我们接下来要做的是定义a在“训练集之外的所有样本上的误差”,而不单单只是a产生的一个假设h的误差。

我们已经定义了 假设函数h 在训练集之外的所有样本上的误差,由于假设h是算法a以概率P(h|X, a)产生的,那么我们可以定义算法a的误差为所有可能的h的误差的期望,所以按照上面的那个方式,同理,在外面嵌套一层即可,即:

E_{ote}(a|X,f)=\sum_{h}\sum_{x\in \gamma -X}P(X)l(h(x)\neq f(x))P(h|X,a)

接下来,考虑二分类问题,而且真实目标函数可以是任何函数\gamma\rightarrow  \left\{ 0,1\right\} 假设对所有可能的f按均匀分布对误差求和,有:

\sum_{f}E_{ote}(a|X,f)=\sum_{f}\sum_{h}\sum_{x\in \gamma -X}P(X)l(h(x)\neq f(x))P(h|X,a)

因为每个乘积都是独立的,所以可以把求和符号放到任意位置,

=\sum_{x\in \gamma -X}P(X)\sum_{f}l(h(x)\neq f(x))\sum_{h}P(h|X,a) 

因为根据假设所有可能的f满足均匀分布,所以 \sum_{f}l(h(x)\neq f(x)) 会有一半为0,一半为1,然后任何函数取值都为0和1,样本空间有\vert \gamma \vert 个元素,令n= |\gamma |,所以\sum_{f}l(h(x)\neq f(x)) = \frac{1}{2} 2^n,然后\sum_{h}P(h|X,a) = 1,因为在所有情况下概率和为1嘛。 即:

=\frac{1}{2} 2^n\sum_{x\in \gamma -X}P(X)  \cdot 1

=\frac{1}{2} 2^n\sum_{x\in \gamma -X}P(X)

我们得出一个惊人的结果,可以看到总误差竟与算法无关!!!!  即对于任何两个算法a和b,我们都有

E_{ote}(a|X,f)=E_{ote}(b|X,f)

也就是说,无论学习算法a 多聪明、学习算法b 多笨拙,它们的期望性竟然相同!这就是"没有免费午餐"定理。

这下子,你对想学习机器学习和深度学习的热情可能被一盆水浇透了:既然所有学习算法的期望性都跟随机胡猜差不多,那还有什么好学的?

聪明的你可能注意到,NFL有一个重要前提:所有问题出现的机会相同、或所有问题同等重要,但实际情形并非如此,很多时候我们都会只关注自己正在试图解决的问题,希望为它找到一个好的解决方案,至于这个解决方案在别的问题、甚至相似的问题上是否为好方案,我们并不关心。

所以我们可以在解决特定的问题的时候,能够找到在这个情况下,较好的算法,例如在解决非线性问题的时候,例如拟合非线性函数,神经网络其强大的学习能力明显具有很大的优势!!


最后,NFL定理告诉我们的是,如果脱离实际背景,空谈什么都是毫无意义的,还不如随机胡猜来的快!!!

正如这个形象的名字,世上没有免费的午餐,天上不会掉馅饼,努力奋斗才能梦想成真!

加油!

由于水平有限,根据自己的理解编写,有错误望指出!

注:转载请注明原文地址

部分引用周志华的《机器学习》,百度百科,CSDN

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容