【基础知识】LSTM-CRF

标准RNN网络

image.png

数学公式

image.png

弊端

没法恢复久远的记忆,主要原因如下

  • 梯度消失
  • 梯度爆炸

LSTM网络

image.png

LSTM-cell

image.png

数学公式

image.png

[图片上传失败...(image-86f9c8-1510984579946)]=\frac{P(x)}{Q(x)})
输入门$i_t$:控制有多少信息可以流入memory cell(第四个式子$c_t$)。
遗忘门$f_t$:控制有多少上一时刻的memory cell中的信息可以累积到当前时刻的memory cell中。
输出门$o_t$:控制有多少当前时刻的memory cell中的信息可以流入当前隐藏状态$h_t$中。

Bidirectional LSTM 网络

image.png

根据前面的信息推出后面的,但有时候只看前面的词是不够的

例如,

我今天不舒服,我打算__一天。

只根据‘不舒服‘,可能推出我打算‘去医院‘,‘睡觉‘,‘请假‘等等,但如果加上后面的‘一天‘,能选择的范围就变小了,‘去医院‘这种就不能选了,而‘请假‘‘休息‘之类的被选择概率就会更大。

image.png

计算公式

即正向计算时,隐藏层的 $s_t$ 与 $s_{t-1}$ 有关;反向计算时,隐藏层的 $s_t$ 与 $s_{t+1}$ 有关:

image.png
image.png

CRF 条件随机场

image.png

特征函数

输入 :

  • 句子 $s$
  • 单词在句子中出现的位置,即单词 index,$i$
  • 当前词语的标记类型,$l_i$
  • 前一个词语的标记类型,$l_{i-1}$

输出:

  • 实数值(通常0或1)

预测

定义好一组特征函数后,我们要给每个特征函数$f_j$赋予一个权重$λ_j$。现在,只要有一个句子$s$,有一个标注序列$l$,我们就可以利用前面定义的特征函数集来对$l$评分。

image.png

上式中有两个求和,外面的求和用来求每一个特征函数$f_j$评分值的和,里面的求和用来求句子中每个位置的单词的的特征值的和。

对这个分数进行指数化和标准化,我们就可以得到标注序列$l$的概率值$p(l|s)$,如下所示:


image.png

如何得到特征函数

人工构造,如CRF++中通过指定特征模板,然后依据特征模板生成特征函数

参数$\lambda$学习

拟牛顿法

预测

  • 暴力法:列出所有可能
  • 多项式时间算法:维特比算法

优点

  • 理论完善、技术成熟
  • 小空间搜索优势明显(全局最优)

缺点

  • 不能处理长期依赖
  • 计算联合概率,不能实时输出

LSTM-CRF 网络

image.png

简单来说就是在输出端将softmax与CRF结合起来,使用LSTM解决提取序列特征的问题,使用CRF有效利用了句子级别的标记信息

在LSTM+CRF模型下,输出的将不再是相互独立的标签,而是最佳的标签序列。

对于输入:

$$X=(x1,x2,...,xn)$$

我们可以定义LSTM的输出概率矩阵 $P_{n∗k}$ 其中$k$是输出标签的个数。 $P{i,j}$ 是指第$i$个字被标记为第$j$个标签的概率。对于待预测的标签序列:$$y=(y1,y2,...,yn)$$

我们可以有如下定义:
$$
s(X,y)=∑n_{i=0}A_{y_i,y_{i+1}}+∑n_{i=0}P_{i,y_i}
$$

其中$A$是状态转移矩阵, $Ai,j$代表从第$i$个tag转移到第$j$个tag的概率。

通过求得最大的 $s(X,y)$,即可得到最佳的输出标签序列。这里引入的CRF,其实只是对输出标签二元组进行了建模,然后使用动态规划进行计算即可,最终根据得到的最优路径进行标注。

BI-LSTM-CRF 网络

image.png

相比之前的LSTM-CRF,该网络可以使用未来的输入特征。

image.png

BI-LSTM-CRF with MaxEnt features

image.png

该网络中,特征与输出有直接的相连。

类似最大熵,潜在特征冲突问题

Deep-BI-LSTM

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,311评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,339评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,671评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,252评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,253评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,031评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,340评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,973评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,466评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,937评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,039评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,701评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,254评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,259评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,497评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,786评论 2 345

推荐阅读更多精彩内容