论文笔记 | GraphRel:用于文本中的实体与关系联合抽取的关系图模型

本文主要复述论文["GraphRel: ModelingTextasRelationalGraphsforJointEntityand RelationExtraction"] 的内容,以便自我回顾,也希望可以给大噶带来帮助~

摘要

这篇论文的目的是使用一个端到端的关系抽取模型,来实现命名实体与关系的联合信息抽取。使用图卷积神经网络(GCN),构建一个线性从属结构的模型来提取文本中的顺序特征与区域特征,并进一步地使用一个完整字词图谱抽取文本中的隐性词对的特征。作者还重点介绍了词对重叠关系的改进。数据集选择的是NYT和WebNLG,实体与关系抽取模型的F1值分别提高了3.2%和5.8%。

介绍

实体的语义关系这里也选择的是三元组来表示,比如 (Barack Obama, President Of, United States)。这个任务的处理过程有三个关键点需要注意:

  • 端到端的实体识别与关系抽取模型;
  • 重叠关系的预测,比如共享同一实体识别的三元组;
  • 关系之间的相互作用,尤其是重叠关系。

关系抽取任务中的关系之间相互作用对重叠关系的处理很重要,比如三元组 (Barack Obama, President Of, United States)与(Barack Obama, Governance, United States)这两组的关系共享实体,另一范例比如三元组(Barack Obama, LiveIn, White House) 与 (White House, Presidential Palace, United States)属于单一实体重叠。
GraphRel模型结合了Bi-LSTMs的序列编码与GCN的依赖树编码,实现自动提取每个词的隐性特征。模型中设计了两个阶段具有关系权重矩阵的GCN,第一阶段会沿节点之间的依赖关系链接提取特征,同时建立具有关系加权边的新全连接图。第二阶段会在第一阶段生成图的基础上考虑实体之间或者重叠关系之间的相互作用。这两个阶段都会生成相应任务的损失值。

方法

整个模型的结构图见Figure2。第一阶段应用Bi-LSTM于GCN抽取序列性、区域性的词特征,特征输出时对每个词预测三元组类型与实体类别。第二阶段会对每个关系建立完整的关系图,对这些关系图使用GCN来提取关系信息。
1st-phase Prediction

在Bi-LSTM网络中迭代之前,每个词的初始特征被初始化为h^0(u)=Word(u)⊕Pos(u),其中u为单个词,这里的词特征以及POS特征是由Glove embedding预训练得到的。
先对序列式的原始输入进行依赖关系解析,生成相应的依赖树作为图网络输入节点的邻接矩阵,这里的图网络考虑连接边的方向性,因此作者总结了双向图网络(Bi-GCN)。h^l(u)表示第l层节点u的特征向量,箭头表示每个节点上的边出入方向,w,b表示卷及网络的权重。

从B-GCN网络中得到词特征向量后,对每个词预测其实体类别与三元组关系对。
这里的实体类别预测是对每个词都进行一遍,由来表示。
关系预测,则是先移除所用的依赖边关系,对所有的词对都进行关系预测,设当前关系,有三个权重矩阵,并计算倾向分数。
需注意这里的与是不同的。使用softmax分类器得到每对关系的,记为。

2-nd Prediction

前一阶段得到的实体与关系之间比较独立,第二阶段则着重于二者之间的相互影响。

从第一阶段的结果构造了每个关系r的权重连接图,可由Figure3描述。第二阶段在每个关系图上采用Bi-GCN,考虑了不同关系的不同影响程度,并总结了综合词特征。这个过程可表示为:

表示节点u到v在关系r下的边权重,是所有的节点集合,是所有的边集合。再次进行实体与关系预测后得到和。

实验

数据集:

实验结果:
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345