《机器学习基石》学习笔记<5>

Why Can Machines Learning?

按例放上学习进度:D

Roadmap

前面的4课解决了机器能学习的条件,即when,
现在开始思考机器能学习的原理。

一、Recap and preview

首先整理下之前get到的知识:P

目前,我们已经知道了,当h的个数M有限时,且N足够大,A选中的那个g,会有Ein(g)≈Eout(g)(现成资料D里的g的错误率可以推出机器预测未知的资料的出错率,并且很接近哦);当A选择的g,Ein(g)≈0的时候,Eout(g)≈0是PAC的。Eout(g)≈0,就是说机器是可以学习的。
整个flow里可以理解为train(训练已有资料)和test(用新的资料来测试结果)两部分。

learning可以说是在bath的D,监督式学习,二元分类器等条件下,通过保证Ein(g)≈Eout(g)和Ein(g)≈0,使g≈f (Eout(g)≈0)。

那么learning可以分为2个核心问题:

  • Ein(g)≈Eout(g)?
    (M finite,N large)
  • Ein(g)≈0?

关于上面的两个问题:

  • 如果M很小,从公式可以推出,P[BAD]小,但是,选择也变得小了,那么不一定找得到Ein(g)≈0的优秀线
  • 如果M很大,选择多了,可P[BAD]也大了 :(

emmmm……
所以用合适的M超级重要呢~
前面的讨论都是M有限的情况,如果M无限大呢?


解决方案是,用一个有限的m去替换无限的M:)

所以,现在问题变成:怎么找到一个合适的m来替代M?

二、Effective number of lines

先考虑为什么公式在infinite情况下不可行的?


每种BAD在独立来看都是不一样的,但是union bound 后就会有重叠部分,叠加infinite个独立p后变得无限大,此时就变得无意义了。


BAD重叠可以理解为h1≈h2
总之,B1,B2,B3……这些BAD其实是重叠了的,但是union bound公式是没有考虑重叠的,把每个BAD当成独立的来计算,造成了无限大的上限。所以此时infinite个h是无法计算的。
好嘛,既然是因为重叠了才不可计算,那就想办法找出重叠部分:D


先考虑这样一个问题:
如果平面上只有一个x,那么会有多少条h呢?
显然是可以分为两种,一种是把x划分为+1那边的,一种是把x划分到-1那边的。

那么,有2个点的时候呢?

可以根据把x1,x2划分到那一边算出有4种h。
那么3个点的时候呢?



对的,8种。
这时候你有一个猜想,哇,好像是2^n呢……
然而,如果3个点是在一条线上的呢?



emmm……
对的,有的情况无法用一条直线划分,所以这时候只有6条h.

当有4个点时,也会出现无法划分的时候。


总的来说,结论如下:


我们把这种有效的条数称为effective number of lines


从1,2,3,4个x可以发现它们的h总是有个上限的,没有重叠部分的,最大不会超过2N(每个点的情况都是两种,所以最多不会超过2N)。所以,D里面的N个点的最大不会超过2^N条h。
那么是不是可以用effective(N)来替代那个无限的M呢?

三、Effective number of Hypotheses

现在引入一个概念dichotomy:
把点x,划分到+1,-1的集合。


hypotheses H 与dichotomies H(x1,x2,...,Xn)的区别如图。
前面说到effective(N)的概念,effective(N)正是dichotomies H(x1,x2,...,Xn)的h的个数呢。
既然dichotomies H(x1,x2,...,Xn)是没有重叠部分的,那么可以作为替换M的候选了。


|H(x1,x2,...,Xn)|是依赖x的(比如上面提到的3个x的时候,摆放不同会有不同的结果,6和8),现在我们除去对x的依赖,只讨论|H(x1,x2,...,Xn)|的max,把这称为成长函数(Growth Function)
那么,怎么计算成长函数呢?

第一种情况:
把直线上一部分划分为+1,像射线一样,N个点可以把一条线划分为N+1个块,这时有N+1条线可以划分。

第二种情况:
一部分划分为+1。
此时N个点还是把线分为N+1块,既然是取部分划分为+1,那么取两个块作为线的端点,所以一共Nx(N+1)/2种,还有一种是全部取为+1,所以
N(N+1)/2+1.

第三种情况:
凸的部分划分为+1。

此时可以凸边形做出来 ,即连点,突边形外内的都是里的都是+1,其他为-1.
所有点都可以这种方法划分出来,所以是
2^N*.
总结:

四、Break point


通过得到的式子可以看出,当成长函数为多项式时效果比较好,指数时效果不好。


在二维下,
3个x时存在shatter(原意打碎,破坏,在这里可以理解为全部命中,比如3个x,有8种可能,存在8种都可行的状态,即命中),这时有6和8的情况,所以是'存在'。
4个x时不存在shatter,因为最多只有14种。
可以推出,自4以后都是不存在shatter的。
假设k为inputs的个数,
当k个inputs让H不存在shatter时,称k为break point.
在二维下,4就是break point.
k+1,k+2,k+3……也是break point

五、Summary

总结:

  • 复习之前4个课程的知识
  • 当M无限大时,因为union bound是把每个BAD加起来,没有考虑除去重叠部分造成了无限大,如果用eddective(N)替代M也许能解决这个问题
  • 介绍了4种成长函数,其中多项式的替换效果比较好
  • 介绍了break point , 比如4
  • 总的来说解决了M 无限时的情况,大题的思路是找出一个有限的且有效的m去替代M,最后,我们找到了多项式的成长函数来替换

以上:D
注明:以上图片都来自Cousera台大林轩田老师的《机器学习基石》哦 QwQ

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容