论文:A Comprehensive Survey on Graph Anomaly Detection with Deep Learning
论文地址:https://arxiv.org/abs/2106.07178
本文的写作动机
异常检测是一种数据挖掘过程,旨在识别偏离数据集中大多数数据的异常模式。在这一领域的早期工作中,检测方法在很大程度上依赖于手工制作的特征工程或领域专家构建的统计模型。这内在地限制了这些技术检测未知异常的能力,而且是非常消耗人力的。
因此提出了利用图中包含的结构信息,检测图中的异常在非欧几里德空间的异常检测问题-图异常检测(GAD,Graph Anomaly Detection),其目的是识别单个图中的异常图对象(即节点、边或子图)以及图集/数据库中的异常图。通过提取表达性表示,将图形异常和正常对象分离,或者通过深度学习技术直接学习异常的偏差模式,图形异常检测与深度学习(GADL,Graph Anomaly detection with Deep Learning)开始在异常检测领域处于领先地位。
本文作者将 Graph Anomaly Detection 任务划分为了 4 个特定场景的任务:
- Anomalous Node Detection (ANOS ND)
- Anomalous Edge Detection (ANOS ED)
- Anomalous Sub-graph Detection (ANOS SGD)
- Anomalous Graph Detection (ANOS GD)
下图是作者整理出的相关论文发表的 TimeLine:
Graph Anomaly Detection(GAD) 的四个技术挑战及七个数据挑战
技术挑战
- Anomaly-aware training objectives 异常感知训练目标:如何通过训练有效地将异常对象分离
- Anomaly interpretability 异常解释能力:如何很好的解释所检测出的异常
- High training cost 高额的训练代价:如何平衡效果和代价
- Hyper parameter tuning 超参数调整:如何调整超参
数据挑战
- 有标记样本很少
- 不同类型的图
- 不同类的图异常
- 数据的高维度和大尺度
- 不同实体间的关系以及其动态变化
- 样本不平衡
- 异常的未知性和伪装性
不同图的基本定义
平面图
属性图
动态图
图数据库