GNN和bert做Hot-potQA

hot-pot QA

  • reasoning提供sentence-levelsupporting fact
  • 数据集长这种形式,需要supporting facts的原因是需要对推理作出解释,所以不仅要找到正确答案还要把supporting facts找出来。

Cognitive Graph for Multi-Hop Reading Comprehension at Scale

  • 问题的意思是谁导演了2003年的一个电影,这个电影有一个场景在洛杉矶的Quality Cafe拍摄的,然后有5个段落,两个段落是介绍Quality Cafe的,一个是介绍Log Angeles的,然后是两个段落分别介绍两部电影的。实心的线是理想的推理路线,圆形的是答案和候选答案。
  • 两个系统,系统1负责提取和问题有关的entities以及answer candidates,系统2负责进行推理得到正确的答案。
  • Cognitive Graph 是一个有向图,每一个图中的节点要么是entity 要么是候选答案.
  • 系统1从关于实体x的介绍段落中得到answer candidates以及next-hop entities,注意这两个不同种类的节点是用不同的方式提取的。
  • clue是一个conceptfrontier nodes是新加入图中的节点和与新加入节点有连接边的节点。
  • 从图中我们可以看到x是一个frontier nodes,然后将questioncluesx以及关于x的段落paragraph[x]得到第一是句子的表示sem[x,q,clues]以及x的下一个节点hop span以及ans span,然后GNN是根据和x之前节点的表示过一个矩阵然后将所有的差值相加,然后在个x句子的表示共同得到的x的表示。
  • 可以看到GNN更新的时候这次只更新了x并不是更新了完整的图,而且没有用到x的表示,而且sem[x,q,clues]不是最后一层的表示的而是倒数第三层的表示。
  • 还有不懂的是怎么得到的clues以及successor Node y
  • clues是提取节点x的那个句子。
  • 对于answer candidate来说没有para[x]那么直接用sem[x,q,clues]来初始化节点的表示。如果连clues[x]也没有那么就用question来初始化
  • 提取span,因为answer candidatenext hop两种节点有不同的模式,比如如果问题是where开头的,那么answer candidate更有可能是纽约而不是2019,而下一个跳的entity的模式不是这样的。可以看到提取span的方法也很暴力,就是有四个指针指示从哪里开始哪里结束,那么问题来了,岂不是一个节点只能有一个answer candidate和一个next hop nodeSansEans等等都是可学习的参数,有一个细节是选择Kspans并且如果谁的概率低于cls位置的概率那么就被丢弃,这个位置的概率被称为negative threshold
  • 说是因为最后一个层的cls hidden state用于进行span prediction就是上面的threshold所以这次是用,倒数第三层的当做句子的表示。
  • 作者发现光更新frontier node和一次性更新全部节点是没有什么区别的。
  • 得到答案是取出图中的节点然后过全连接层得到表示。
  • 训练集中的下一条和答案spans以及被提前取出来,因为答案只有一个,所以答案的开始为1,而一个句子中可以有k个跳所以初始化为1/k表示每个跳跃的概率是一样的,但是这个模型只能建模一个paragraph中只有一个跳的情况,那么就需要能够很好的预测第一个跳的位置。
  • 每个答案有两个negativerandomhop node中提取出来出来的span
  • 构建图的方法,x是节点可以指向para,para中的supporting fact中有片段和gold entity 以及 answer 大致可以匹配到那么就将边x,y连接起来,这个就是连接初始边的方法,后面的方法都是可以推断得到的。实际上是直接把clues当成supporting fact
  • 评估的时候不仅要把答案找到还要找到supporting facts,可解释性就很强。
  • 还有一个表示逻辑推断严格性的一个指标。
  • GNN真的很重要,直接提高了50%
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345