逻辑回归背后的数学原理

什么是逻辑回归

逻辑回归用于分类问题。在分类问题中,我们尝试预测目前观测目标属于哪一类,它会产生一个离散的二元结果y∈{0,1}。而线性回归模型产生的预测值为z=θTx是实数值,于是我们引入一个新的模型,使输出变量z的值到始终在0和1之间,于是便找到了Sigmoid function。


Sigmoid function的图像是一条值在0-1之间的S形曲线,如图:
Sigmoid function

通常,我们把Sigmoid fuction计算得到的值大于等于0.5的归为类别1,小于0.5的归为类别0。从Sigmoid function图像可以看出,当z≥0时,g(z)≥0.5;当z<0时,g(z)<0.5。

合起来,我们得到逻辑回归模型的假设:

hθ(x)的作用是,对于给定的输入变量x,根据给定的参数计算出输出变量y=1的可能性,即hθ(x)=P(y=1|x;θ),我们可以将其视为y=1的后验概率估计。

逻辑回归的代价函数

我们第一个想到的自然是模仿线性回归的做法,利用误差平方和来当代价函数:

但是问题在于,当我们将
带入到这样定义了的代价函数中时,我们得到的代价函数将是一个非凸函数(non-convex function)。
这意味着我们的代价函数有许多局部最小值,这将影响梯度下降算法寻找全局最小值。我们需要寻找一个凸函数作为代价函数。
那么我们不妨来换一个思路解决这个问题。前面说到,我们可以将hθ(x)视为y=1的后验概率估计,所以可以得到:
P(y=1|x;θ) = hθ(x) = g(θTx) = g(z)
P(y=0|x;θ) = 1- g(z)
将这两式写成一般形式:P(y|x;θ) = g(z)y(1- g(z))(1-y)
接下来我们就要用极大似然估计来根据给定的训练集估计出参数θ。
为了简化运算,我们对上面这个等式的两边都取一个对数 。
我们现在要求的是使得l(θ)最大的θ,而代价函数是求是J(θ)最小的θ。在l(θ)前加个负号,即可变为最小的,所以代价函数出现了,J(θ) = -l(θ)。
为了更好地理解代价函数,我们取一个样本来看:
J(g(z),y; θ)=− (y ln(g(z)) + (1−y) ln (1−g(z)))
也就是说:

代价函数图像为:
从图中不难看出,如果样本的值是1的话,估计值g(z)越接近1付出的代价就越小,反之越大;同理,如果样本的值是0的话,估计值g(z)越接近0付出的代价就越小,反之越大。

利用梯度下降法求参数

在得到这样一个代价函数以后,我们便可以用梯度下降算法来求得能使代价函数最小的参数了。算法为:

Sigmoid function有一个性质:g'(z)=g(z)*(1-g(z)),在梯度下降过程中会用到。

g(z)详细求导过程如下:

所以,在使用梯度下降法更新权重时

注:虽然得到的梯度下降算法表面上看上去与线性回归的梯度下降算法一样, 但是这里的 hθ(x)=g(θTx)与线性回归中不同,所以实际上是不一样的

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 198,932评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,554评论 2 375
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 145,894评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,442评论 1 268
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,347评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,899评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,325评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,980评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,196评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,163评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,085评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,826评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,389评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,501评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,753评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,171评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,616评论 2 339

推荐阅读更多精彩内容

  • Logistic regression(简称LR)是机器学习最常用的算法,经常用来处理二分类问题 我们举一个生活案...
    PrivateEye_zzy阅读 8,543评论 0 11
  • 逻辑回归是线性回归的变形,看了很多机器学习书籍,吴恩达的课程对线性回归和逻辑回归的讲解非常清晰,原理性和推导都很好...
    陈伯龙阅读 339评论 0 1
  • 课程介绍:馒头商学院社群运营课 主讲老师:刘珊珊 讲师介绍:凯叔讲故事前社群部总监 日期:2016年12月24日 ...
    白马不黑阅读 311评论 0 1
  • 李玟襄是个道士。 住在离京城二百五十里路小青山上的玄真观里。 小青山就是个土包包。玄真观也没有什么来头,更不知是谁...
    大大大汤匙阅读 620评论 0 1
  • 今天回到家已是11点多,看着还未入睡的女儿,满满的愧疚。婆婆见我进门就说,怎么这么晚,小孩一直不睡。 赶快换了拖鞋...
    我为女儿在奋斗阅读 143评论 0 0