1. 序列标注和分类问题对比
我们知道序列标注问题有时候也被当做一个分类问题去对待,那么为什么传统分类算法较少用于序列标注的任务比如NER。核心的问题是,序列标注不仅考虑当前token的分类情况,也考虑前面token的分类预测情况,从而给该序列(一个整体)预测出一个label;或者这样理解,你想预测当前token的label,就必须知道前一个token label,依次往前,从而把整个序列放在一起考虑得到最终的label,而分类则是根据当前的特征或者context决定当前类别。
我们知道序列标注问题有时候也被当做一个分类问题去对待,那么为什么传统分类算法较少用于序列标注的任务比如NER。核心的问题是,序列标注不仅考虑当前token的分类情况,也考虑前面token的分类预测情况,从而给该序列(一个整体)预测出一个label;或者这样理解,你想预测当前token的label,就必须知道前一个token label,依次往前,从而把整个序列放在一起考虑得到最终的label,而分类则是根据当前的特征或者context决定当前类别。