ECPE任务
论文:Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts
一个简介:https://mikito.mythsman.com/post/5d2bf2685ed28235d7573179/
-
开源项目:
- https://github.com/HLT-HITSZ/TransECPE torch
- https://github.com/bbruceyuan/ECPE-PyTorch 看起来很好但是实际上没写完
- https://github.com/NUSTM/ECPE-MLL official,tf1.13,python2
ECE:Emotion cause extraction
ECPE: emotion-cause pair extraction
区别:
任务定义:给定以字句构成的文档
d
,提取情感-原因对
:-
数据示例:
即`句子4`中的**anger**的情绪是由于`句子1`和`句子2`
- 解决方案:
- step1:Individual Emotion and Cause Extraction
- step2:Emotion-Cause Pairing and Filtering
- 评价方法:
- 论文中的结果
对比Independent
、Inter-EC
、Inter-CE
的结果,可以看到 Inter-~ 都会有所提升
the improvements of Inter-EC on the cause extraction task are much more than the improvement of InterCE on the emotion extraction task
it is because cause extraction is more difficult than emotion extraction, hence there is more room for extra improvement.
By comparing the results of Inter-EC-Bound and Inter-EC, we found that although Inter-EC performs better than Indep, it is far poorer than Inter-EC-Bound
is caused by lots of errors in the predictions of emotion extraction. We can draw the same conclusion when comparing InterCE-Bound and Inter-CE.
具体方法:
Step1: Individual Emotion and Cause Extraction
这部分的目的是为了从文档d
中提取可能的情感相关子句
和原因相关子句
,这里分为两种方法:
1. Independent Multi-task Learning
用白话描述就是对于每个子句,均由词语组成,是故最下层的BiLSTM-Attention结构用于将子句转为句子级别的表示。然后将得到的表示向量分别给两个BiLSTM进行分类,从而确定Emotion set
和Cause set
。
- Interactive Multi-task Learning
按照作者的表述,Interactive
是Independent
的增强版。在这种方法中,也分为以下两种方式:
- Inter-EC:用Emotion的信息增强Cause
- Inter-CE:用Cause的信息增强Emotion
那么,怎么增强呢?先做其中一个,再把hidden state拿出来做另外一个。
2. Step 2: Emotion-Cause Pairing and Filtering
这部分的目的是为了对上一步提取出的情感相关子句
和原因相关子句
进行匹配以及筛选。按照以下的步骤来做:
- 每两个互相匹配:
- 每对之间计算笛卡尔积:
- 构建特征:
-
Logistic regression model:
- 备注:总体感觉这篇论文是以子句为单位,将情感-原因的抽取转为分类问题,所以比较重要的就是子句的划分以及分类的准确。论文里以multitask为思路提出了两种方法,论文没有对比pipeline处理的结果好坏,猜测可能分开做不能利用情感-原因之间的内在联系。极端点来说,可以将第一步中的句子选择改为全部句子的match,将任务转为一个句子对匹配的任务,不过这样会使问题变成,因此感觉Step1中的选取句子更像是为了Step2提前做剪枝。