机器学习——西瓜书(03)

1 基本形式

f(x)=w_{1} x_{1} +w_{2}x_{2}  +...+w_{d} x_{d} +b

其几何形式为:

f(x)=w^Tx+b

线性模型可以通过引入层级结构或高维映射扩展成更为强大的非线性模型。

ω 直观表达了各属性在预测中的重要性,因此线性模型有很好的可解释性 (comprehensibility)

2 线性回归

2.1 属性值转化

对离散属性,若属性值间存在"序" (order)关系,可通过连续化将其转化为连续值。如“高”“矮”可转化为{0,1},如“大”“中”“小”可转化为{0,0.5,1}。若属性值之间不存在序关系,只是类别。那么k个属性值的属性即可转化为k维向量。如瓜类{西瓜,冬瓜,南瓜}对应{(1,0,0),(0,1,0),(0,0,1)}。

2.2 估计参数

根据均方误差最小化——最小二乘法求解ω和b。

(1)一元线性方程

f(x)=wx_{i} +b

来源:周志华《机器学习》p54

由于上式是关于ω和b的凸函数,分别对ω和b求导,使两个导数均为0时,得到ω和b的最优解。

来源:周志华《机器学习》p54

从而得到:

来源:周志华《机器学习》p54
来源:周志华《机器学习》p55

其中,\bar{x} =\frac{1}{m} \sum_{i=1}^mx_{i} 为x的均值

(2)多元线性方程

f(x_{i} )=w^Tx_{i} +b

把ω和b用向量形式表示:

\hat{w} =(w;b)

给定数据集D={(x_{1} ,y_{1} ),(x_{2} ,y_{2} ),...,(x_{m} ,y_{m} )},其中x_{i} =(x_{i1} ;x_{i2} ;...;x_{id} ),y_{i} \epsilon R

来源:周志华《机器学习》p55

最优化条件表现为:

\hat{w} 求导

X^TX为满秩矩阵或正定矩阵时

\hat{w} ^*=(X^TX) ^{-1}X^Ty

\hat{x} _{i} =(x_{i} ,1),最终取得的多元线性回归模型如下:

f(\hat{x} _{i} )=\hat{x} ^T_{i}(X^TX )^{-1}X^Ty

但是,现实中X^TX往往不是满秩矩阵。一个具体的例子是我们可能遇到大量的变量,其数目超过样例数。此时就可以解出多个\hat{w} ,它们都能使均方误差最小化,此时就要引入第一章里提到的归纳偏好,在这里的常见做法是正则化(regularization)。

同时线性模型也是可扩展的,比如对y取对数,或者更一般地,考虑单调可微函数g(.),令

3  对数几率回归

对数几率回归也就是Logistic Regression。往往是为了解决二分类问题。在线性回归的基础上,如何让输出结果变成分类,直观的想法是在f(x)的基础上再外套一个函数g(z)。将实值转化为(0,1)值的最理想函数是“单位越阶函数”。

单位阶跃函数不连续,因此不能直接用作式 (3.15) 中的 g-(-),于是需要找到一个近似的替代函数,要求这个函数具有单调可微性。对数几率函数正好满足这个条件:

y=\frac{b}{1+e^{-z} }

4 线性判别分析

线性判别分析也就是LDA,其思想也非常易于理解:给定训练样例集,设法将样例投影到一条直线上 ,使得同类样例的投影点尽可能接近、 异类样例 的投影点尽可能远离;在对新样本进行分类时,将其投影到 同样的这条直线上,再根据投影点的位置来确定新样本的类别。

周志华《机器学习》p60
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,392评论 5 470
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,258评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,417评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,992评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,930评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,199评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,652评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,327评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,463评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,382评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,432评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,118评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,704评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,787评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,999评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,476评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,057评论 2 341

推荐阅读更多精彩内容