EM算法

EM算法是含有隐变量的概率模型参数的极大似然估计法。

一、三硬币模型

  假设有3枚硬币,分别记作A,B,C。这些硬币正面出现的概率分别是\pi,p和q。进行如下抛硬币试验:
  先掷硬币A,根据其结果选出硬币B或硬币C,正面选硬币B,反面选硬币C;然后掷选出的硬币,掷硬币的结果,出现正面记作1,出现反面记作0;独立地重复n次试验(这里,n=10),观测结果如下:
            1,1,0,1,0,0,1,0,1,1
  假设只能观测到掷硬币的结果,不能观测到掷硬币的过程,问如何估计三硬币正面出现的概率,即三硬币模型的参数。

y是观测变量,表示观测结果01Z是隐变量,表示未观测到的掷硬币A的结果;\theta=(\pi,p,q)是模型参数。

示意图

y为可观测变量,取值为{0,1},观测结果取决于Z的取值,y,Z均服从0-1分布。
三硬币模型可以写作:
P(y|\theta)=\sum_{z}P(y,z|\theta)=\sum_{z}P(z|\theta)P(y|z,\theta)

因此:
P(y=1|\theta)=\pi p+(1-\pi)q

P(y=0|\theta)=\pi (1-p)+(1-\pi)(1-q)

等价于
P(y|\theta)=\sum_{z}P(y,z|\theta)=\pi p^y(1-p)^{1-y}+(1-\pi)q^y(1-q)^{1-y}

将观测数据表示为Y=(Y_1,Y_2...Y_n)^{T},未观测数据表示为Z=(Z_1,Z_2...Z_n)^{T},则观测数据的似然函数为:
P(Y|\theta)=\prod_{i=1}^n[\pi p^{y_i}(1-p)^{1-y_i}+(1-\pi)q^{y_i}(1-q)^{1-y_i}]

求参数\theta=(\pi,p,q)的极大似然估计:

\hat{\theta}=\mathop{argmax}\limits_{\theta}  logP(Y|\theta)

二、EM算法

E步:基于\Theta^t推断隐变量Z的期望,记为Z^t
M步:基于已观测变量XZ^t对参数\Theta做极大似然估计,记为\Theta^{t+1}

对于一个含有隐变量的概率模型,目标是极大化观测数据Y关于参数\theta的极大似然函数L(\theta)
L(\theta)=logP(Y|\theta)=logE_zP(Y,Z|\theta)=log\sum_zP(Z|\theta)P(Y|Z,\theta)

EM算法通过逐步迭代近似极大化L(\theta),假设第i次迭代后\theta的估计值是\theta^{(i)},则有L(\theta)>L(\theta^{(i)})

由Jensen不等式:E[f(X)]>f[E(X)]

因此:

L(\theta)-L(\theta^{(i)})

=log[\sum_zP(Z|\theta)P(Y|Z,\theta)]-logP(Y|\theta^{(i)})

=log[\sum_zP(Y|Z,\theta^{(i)})\frac{P(Z|\theta)P(Y|Z,\theta)}{P(Y|Z,\theta^{(i)})}]-logP(Y|\theta^{(i)})

>=\sum_zP(Z|Y,\theta^{(i)})log\frac{P(Z|\theta)P(Y|Z,\theta)}{P(Z|Y,\theta^{(i)})}-logP(Y|\theta^{(i)})

=\sum_zP(Z|Y,\theta^{(i)})log\frac{P(Z|\theta)P(Y|Z,\theta)}{P(Z|Y,\theta^{(i)})P(Y|\theta^{(i)})}

EM算法是不断求解下界的极大化逼近求解对数似然函数极大化。
因此:

Q函数:
Q(\theta,\theta^{(i)})=E_z[logP(Y,Z|\theta)|Y,\theta^{(i)}]

EM算法:
  • 选取参数初值:\theta^{(0)}
  • E步:计算Q(\theta,\theta^{(i)})
  • M步:求使 Q(\theta,\theta^{(i)})极大化的\theta,确定第i+1次参数迭代的估计值\theta^{(i+1)}
           \theta^{(i+1)}=\mathop{argmax}\limits_{\theta}Q(\theta,\theta^{(i)})
    重复E步和M步直到收敛。
  • 停止条件:

||\theta^{(i+1)}-\theta^{(i)}||<\varepsilon_1||Q(\theta,\theta^{(i+1)})-Q(\theta,\theta^{(i)})||<\varepsilon_2

三、EM求解三硬币模型

E步:

\mu_j^{(i+1)}= P(Z=1|Y,\theta^{(i)})=\frac{P(Y,Z|\theta^{(i)})}{P(Y|\theta^{(i)})}=\frac{P(Y|Z,\theta^{(i)})P(Z))}{P(Y|\theta^{(i)})}
       =\frac{\pi^{(i)} (p^{(i)})^{y_j}(1-p^{(i)})^{1-y_j}}{\pi^{(i)} (p^{(i)})^{y_j}(1-p^{(i)})^{1-y_j}+(1-\pi^{(i)})(q^{(i)})^{y_j}(1-q^{(i)})^{(1-y_j)} }

P(Y,Z=1|\theta)=P(Z=1|\theta)P(Y|Z=1,\theta)=\pi p^{y_j}(1-p)^{1-y_j}

P(Y,Z=0|\theta)=P(Z=0|\theta)P(Y|Z=0,\theta)=(1-\pi) q^{y_j}(1-q)^{1-y_j}

代入Q(\theta,\theta^{(i)})=\sum_zP(Z|Y,\theta^{(i)})logP(Y,Z|\theta)

M步:

对Q求偏导得到\theta^{(i)}的估计为:

参考:
李航《统计学习方法》
https://blog.csdn.net/wendaomudong_l2d4/article/details/79005461

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容

  • 接触机器学习时间也不短了, 趁国庆放假, 做一下深度整理. 1. 大纲 若想在企业胜任算法相关岗位知识, 除了掌握...
    婉妃阅读 3,391评论 2 92
  • 整理自李航老师的《统计学习方法》一书 1、引言 概率模型有时既含有观测变量,又含有隐变量或潜在变量,如果概率模型的...
    文哥的学习日记阅读 6,915评论 0 2
  • 在上一篇文章写到了EM算法的收敛性证明以后便匆匆的结尾,然后我出去玩了几天,玩的爽了,回来开始继续补之前的flag...
    云时之间阅读 3,084评论 2 8
  • 一、研究市场营销学的意义 1.迎接新经济时代的营销挑战 2.促进经济增长 3.培育企业成长 研究市场营销学,我们可...
    唐小玮阅读 9,070评论 0 4
  • 大同古都灯会,摄于城墙之上。 ——2018.2.25
    透明的双手阅读 184评论 4 9