数学之美--隐含马尔科夫模型

保留初心，砥砺前行

这是令人兴奋的一个章节。

因为科研中总是充满了马尔科夫。

隐含马尔科夫模型也是机器学习的主要工具之一。

引用这句话的目的也是为了证明这一章节的重要性。

引例：

在通信模型中，信息源发出信号s₁,s₂,s₃,...，接收器收到o₁,0₂,0₃,...。解码操作就是通过收到的o₁,0₂,0₃,...还原回s₁,s₂,s₃,...。
如何根据o₁,0₂,0₃,...得到s₁,s₂,s₃,...，可以把这项工作理解成由o₁,0₂,0₃,...，最有可能产生哪一种s₁,s₂,s₃,...。解释成概率论的语言就是在o₁,0₂,0₃,...已知的情况下，求P(s₁,s₂,s₃,...|o₁,0₂,0₃,...)达到最大时的那一串s₁,s₂,s₃,...。也就是如下公式：

![](http://www.forkosh.com/mathtex.cgi? S_{1},S_{2},S_{3},S_{4},\ldots =ArgMaxP\left( S_{1},S_{2},S_{3},\ldots |O_{1},O_{2},O_{3},\ldots \right))
利用贝叶斯公式，可以把上式等价变成

![](http://www.forkosh.com/mathtex.cgi? \dfrac {P\left(O_{1},O_{2},O_{3} ,O_{4} ,\ldots |S_{1},S_{2},S_{3},\ldots \right)\cdot P\left( S_{1},S_{2},S_{3}\right)} {P\left( O_{1},O_{2},O_{3}\right)})

其中，分子的左边的P代表在信息s₁,s₂,s₃,...经过传输后变成o₁,0₂,0₃,...的可能性；右边的P代表是一个正常信号的概率；分母代表接发送端产生信息o₁,0₂,0₃,...的可能性。

o₁,0₂,0₃,...一旦产生，就不会再发生变化，因此P(o₁,0₂,0₃,...)可以看作一个常数，上面公式就可以等价成

![](http://www.forkosh.com/mathtex.cgi?{P\left(O_{1},O_{2},O_{3} ,\ldots |S_{1},S_{2},S_{3},\ldots \right)\cdot P\left( S_{1},S_{2},S_{3}\right)} )

这个公式可以用隐含马尔科夫模型来估计。

隐含马尔科夫模型

马尔科夫假设在随机过程中每个状态s_t的概率分布，只与它的前一个状态s_t-1有关，即![](http://www.forkosh.com/mathtex.cgi?{P\left(S_{t} |S_{1},S_{2},S_{3},S_{4}, \ldots ,S_{t-1}\right)={P\left(S_{t} |S_{t-1}\right) )
符合这个假设的随机过程成为马尔科夫过程，也称为马尔科夫链。

这一段是重点内容：
可以把这个马尔科夫链想象成一台机器，它随机的选择一个状态作为初始状态开始运行，并且按照马尔科夫链的规则持续选择后续状态。这样在运行了一段时间T后，就会产生一个状态序列：s₁,s₂,s₃,... ,s_T。根据这个序列，很容易得到某个状态s_i出现的次数#(s_i)，也很容易得到s_i转换到s_j的次数#(s_i,s_j)。从而得到s_i转移到s_j的概率：#(s_i,s_j) / #(s_i)。

隐含马尔科夫模型是上述马尔科夫链的一个扩展。

隐含马尔科夫模型中任意时刻t的状态s_t是不可见的。因此上述的根据观察序列得到概率的方式都不再working。幸好隐含马尔科夫模型在每个t都会输出一个符号o_t，这个o_t与s_t相关并且只与s_t相关，这个被称为独立输出假设。

隐含马尔科夫模型

上图中下边一层的4个状态s不可见，这些s是典型的马尔科夫链，而它们输出的符号o是可见的。

根据上述的独立输出假设，我们可以得到如下公式：

![](http://www.forkosh.com/mathtex.cgi?{P\left(O_{1},O_{2},O_{3} ,\ldots |S_{1},S_{2},S_{3},\ldots \right)=\prod {t}P\left( o{t}|s_{t}\right)} )

根据上述的马尔科夫假设，我们可以得到如下公式：

![](http://www.forkosh.com/mathtex.cgi?{P\left( S_{1},S_{2},S_{3},\ldots\right)=\prod {t}P\left( s{t}|s_{t-1}\right)} )

使用以上两个公式与之前的通信问题中的最终推导式

![](http://www.forkosh.com/mathtex.cgi?{P\left(O_{1},O_{2},O_{3} ,\ldots |S_{1},S_{2},S_{3},\ldots \right)\cdot P\left( S_{1},S_{2},S_{3}\right)} )

相比较，可以容易地看出这些公式在形态上相似。把独立输出和马尔科夫假设的两个公式相乘，可以正好得到之前在通信问题中我们所要求的内容。因此通信的解码问题完全可以使用隐含马尔科夫模型来解决。

就像前文所说的那样，我们要找到的是那个公式的所有参数情况下，概率最大的那一组s₁,s₂,s₃,...。至于如何找到最大的概率进而找到这组状态串，可以利用维特比算法，在后边的章节会介绍。

最后编辑于：2017.12.08 03:14:16

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,378评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,356评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,702评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,259评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,263评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,036评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,349评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,979评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,469评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,938评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,059评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,703评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,257评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,262评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,485评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,501评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,792评论 2赞 345

数学之美--隐含马尔科夫模型

保留初心，砥砺前行

引例：

隐含马尔科夫模型

推荐阅读更多精彩内容