SMN论文阅读

注：论文的一些比较经典的描述尽量用原文，并且主要关注模型的特点和具体的结构，论文关于相关工作以及效果就不赘述了。

SMN的一些特点：

image.png

SMN 首先在不同的粒度上把一个response 和每个上下文语句进行匹配。（1对N）产生N个匹配对。
然后从以上的每个匹配对的word中以及Segment中挖掘重要的匹配信息，然后经过卷积和池操作（CNN）变成一个向量。（N对产生N个向量）
然后这N个向量会通过GRU，按照一个时间序列来累积成一个最终向量。
之后设计好L函数在最后利用最终向量可以计算出一个匹配积分。

解决多轮和单轮的不同的地方：
在于上下文也要和response进行匹配。
1：如何从上下文中分辨出重要的信息。（关键信息）
2：如何对上下文语句的关系进行建模。（信息顺序）

那么看看SMN是如何实现：关键信息信息顺序不同粒度挖掘上下文每局话以及response。

对于每个上下文中的每句话以及 response，模型都通过 word embedding 和 GRU的隐藏层输出的隐含状态分别建立了一个 word - word 相似度矩阵，以及一个 sequence - sequence 相似度矩阵。
对于这两个矩阵就可以从word level 以及 sequence level捕捉到重要的匹配信息。
并且这个信息会通过卷积和池操作被挖掘以及融合成一个matching vector。
通过这种方法，来自不同粒度的上下文信息就会被识别出来。并且相似度高的特征会被CNN挖掘出来，从而实现了关键信息。
然后这些matching vector会被按照顺序（讲话的顺序从上到下）传入GRU来形成一个最终向量。
这就模拟了语句之间的联系关系和独立关系，也就是实现了信息顺序。

SMN 相当于扩展了MM（Match Matrix）。在多轮中使用 2D matching paradigm。

SMN的优点：
1：在从一开始，一个response匹配多个上下文语句，因此每个语句的匹配信息都能够被充分挖掘，并且最后应用到最后的积分的时候引入的loss比较小。
2：从每个上下文语句中提取的信息是来自于不同的粒度的，并且是under sufficient supervision form the response。所以每个话之间的，并且对response selection有用的语义结构都能够被充分挖掘出来。
3：匹配和语句关系是连着的，不是相互独立建模，因为语句之间的关系（比如语句的顺序）会被计算进去。（最后那个GRU）

具体每个层在做的事情：
1：Utterance-Response Matching。
首先：
令
word bedding -> $M_1$
GRU -> $M_2$

然后可以构造word-word similarity matrix $M_1$ 以及 sequence-sequence similarity matrix $M_2$ 。

其中：
$U =[e_{u,1},...,e_{u,n_u}]$
$R =[e_{r,1},..,e_{r,n_r}]$
其中e是每个word的word embedding。
$M_1$ 是词之间的比如可以有 $m_{i,j} = e^T_{u,i} * e_{r,j}$
$M_2$ 是句之间的这个就比如用GRU 把 U和R转化成两个vector。（拿出隐层的输出隐藏状态）
而这两个vector可以理解成语句的vector。
对于隐藏层输出为 $H_U = [h_{u,1},...,h_{u,n_u}] , H_R = [h_{r,1},...,h_{r,n_r}]$
对于 $M_2$ 有 $m_{i,j} = h^T_{u,i}Ah_{r,j}.$
A是一个m*m的矩阵，在这里做一个线性变换用的。
注意：M_1和M_2就一个。M_1上面的一个元素都是一个值，这个值用对应的两个word embedding计算出来。（比如上面用dot product）
M_2 上面的一个元素也是一个值，这个值用H_U和H_R对应的两个向量（h向量）计算出来的。

然后：
这两个矩阵可以作为CNN的两个输入端，然后CNN 会挖掘特征以及把重要的信息转化成一个matching vector v。

CNN 会做alternates convoution 以及 max-pooling 操作。
通过CNN的特点（略），可以了解到以下事实：
对于识别出合适的回答是有效果的上下文语句中的单词之间或者段落之间是会有比较大的相似度的。并且这样在相似矩阵里面的值也会比较大。
所以CNN 会选择这些比较大的相似特征的地方并且提出一个matching vecotr。
这就是为什么SMN 能够识别重要的信息。并且是基于我们的response的。
（important information in context and leverage it in matching under the supervision of the response）。

之所以考虑multiple channels 是因为想要从多个粒度去捕捉重要的信息。

2： Matching Accumulation。
我们假设 $[v_1,...,v_n]$ 是上面那层的输出.matching vector。
然后输入进GRU。用GRU的隐含状态来表示。
(encodes the matching sequence into its hidden states）
$H_m = [h'_1,...,h'_n]$ 。
这个层的作用有两个：
1：模拟句子的上下顺序。
2：可以清理一些CNN引入的噪音。（要细看）reset gate 和 update gate可以控制信息。

3：Matching Prediction and Learning。
对于输入到这层的 $H_m = [h'_1,...,h'_n]$ ，我们可以有。
$g(s,r) = softmax( W_2L[h'_1,...,h'_n]+b_2)。$
对于L(H_m) 有三种函数表示：
1) $L( [ h'_1,...,h'_n ] ) = h'_n$
2) $L( [ h'_1,...,h'_n ] ) = \sum^n_{i=1} w_ih'_i$
3)attention mechanism
训练损失函数。
$- \sum^N_{i=1} y log( p ) + (1-y) log( 1- p )$

最后：
Response Candidate Retrieval。
实际中，做一个基于索引的chatbot。需要检索一定数量的response candidates from a index beforehand。但是candidate retrieval 并不是本文的重点。但是在现实的系统中是十分重要的。
可以使用5 keywords based on ti-idf scores。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,445评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,889评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,047评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,760评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,745评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,638评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,011评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,669评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,923评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,655评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,740评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,406评论 4赞 320
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,995评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,961评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,197评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,023评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,483评论 2赞 342

SMN论文阅读

推荐阅读更多精彩内容