一、基本信息
题目:Anomaly detection with robust deep autoencoders
期刊/会议:ACM SIGKDD
发表时间:2017年
引用次数:26
二、论文总结
2.1 研究方向
提高自编码模型的抗噪声能力
2.2 写作动机
受鲁棒PCA的启发,将原始数据分成正常数据和噪声、异常数据两部分,然后进行交替训练。
2.3 创新之处
除了使用传统的L1正则化去约束噪声部分之外,还使用了L21正则化寻找特征异常或者样本异常。L21正则化是对矩阵每一列求2范数然后求和。
正则项系数控制模型识别异常的严格程度,系数越小,误报率越高,需要通过F1-Score选取最佳系数。
2.4 算法细节
主要是使用了交替优化的思想,首先优化AutoEncoder,然后优化正则项,当正常数据和噪声数据之和接近原始数据或者误差无法继续优化时停止。
其中S是稀疏的,值为0表示该位置数据正常,不为零表示该位置是噪声或者异常数据。