Abstract
本文提到的copy-move检测方法可分为3类:
- 基于块的方法
- 基于关键点的方法
- 基于深度学习的方法
1 Introduction
- 图像鉴定的方法可大致分为主动的技术和被动的技术。
- 主动技术:如数字水印或数字签名,需要事先在图像中嵌入额外的信息,这无疑会破坏图像的品质
- 被动技术:利用图像内在的性质,分析它们的特征,找到可见的线索,图像的品质不会被破坏。
- Copy-move是最方便也最常见的图像篡改方式,定义是图像中的一个或多个区域被复制,并粘贴到同一张图的另外的区域上。
- Copy-move检测方法的4步:
- 预处理。可以让提取图像特征的过程更有效。
- 特征提取。从邻近的像素或一些关键点上提取出特征信息。
- 特征匹配。特征匹配算法从两个或多个特征中找出相似的特征。
- 后处理。一些“假”匹配的像素被“过滤”掉,一些分散的像素被合并到邻近的更大的区域当中。
2 Block-based methods
预处理阶段图像被分成重叠或不重叠的块;特征提取阶段这些块中适当的特征会被提取出来;特征匹配阶段这些特征会被排序并通过适当的数据结构找出相似的特征;最后在后处理操作后伪造区域能够被定位出来。
基于块的方法可以根据特征样式的不同分为4类:
①基于频率转换的方法
②基于纹理的方法
③基于不变矩的方法
④基于维度缩减的方法
基于频率转换的方法
频率转换是基于块的方法中最常使用的特征。常用的频率转换包括离散余弦变换(DCT)、离散小波变换(DWT)、二进小波变换(DyWT)、傅里叶变换(FT)
1. Discrete Cosine Transform(DCT)(离散余弦变换)
在频率转换函数中,DCT在copy-move定位领域应用最广泛。基于DCT的算法对噪声和JPEG压缩攻击具有鲁棒性。
2. Discrete Wavelet Transform(DWT)(离散小波变换)
DWT被广泛应用于时间-频率定位性质的图像处理和图像分析的多种领域中。
相比DWT,DyWT具有平移不变性的特征,更适合于数据分析
3. Fourier Transform(FT)(傅里叶变换)
DWT和基于FFT的算法不能定位经过几何转换攻击的区域。
总结来说,基于DCT和DWT的方法对很多额外操作(如JPEG压缩,模糊,噪声攻击)很有鲁棒性,但缺少处理几何变换操作的能力,因为DCT和DWT算法是对于几何变换不变的。一些基于FMT的改进算法在对待几何变换操作时就表现得很好。
基于纹理的方法
纹理就是像光滑度或者粗糙度这样的一些图像的常规属性。当篡改图片时,这些性质得到了保留并转移到了另外的区域,所以纹理可以被用作相似性匹配阶段的特征。
Novozámský et al. [Novozámský and Šorel (2018)]提出了一种提升定位效果的方法,尤其是对于包含纹理的小区域。这种方法将Tamura纹理与平均灰度值相结合,提取并分析纹理特征。
总结来说,基于纹理的方法对contrast-changing、高斯模糊、JPEG压缩攻击具有鲁棒性,但在几何变换方面表现不好。
基于不变矩的方法
一些额外的操作如平移旋转缩放通常在图像篡改后被应用。图像矩是一组对于这些操作不变的特征。
总结来说,基于不变矩的方法对几何变换有鲁棒性,但是相比起其他方法来说,此方法的计算复杂性高。
基于维度缩减的方法
基于维度缩减的方法用于减少图像特征的维度,提升表现。这类算法很少能影响到定位的准确性。这类算法主要包括PCA,奇异值分解(SVD),局部线性嵌入(LLE)
基于块方法的优缺点比较
大多数基于频率的方法对一些额外的操作具有鲁棒性,DNA处理几何变换时候能力有限。纹理特征经常与其它图像的固有信息结合在一起以增加对于额外操作的鲁棒性,尤其是对于小的复制区域来说。然而基于纹理的方法在定位几何变换的伪造区域时效果也较差。因此,一些基于图像矩的方法被提出用于处理几何变换。之后基于维度缩减的方法被提出以加快处理速度。
(未完,接下图)
3 基于关键点的方法
对于基于关键点的方法,去掉预处理阶段的分块操作。
基于关键点的方法描述了从极值点提取出的局部特征。这些极值点存在于角,spots(斑点?)以及边缘部分。每个局部特征是由在极值点周围产生的描述符的一个集合,这样有助于提升特征的效果。每个描述符被与其它描述符匹配以找到复制区域。
基于关键点的方法可以分为两大类:Scale Invariant Feature Transform(SIFT)(缩放不变特征变换)和Speed Up Robust Feature(SURF)(加速健壮特征)
基于SIFT的方法可分为3步:尺度空间极值检测,关键点定位,方向分配,以及关键点描述(这不是4步么...)
基于SURF的方法可分为3步:快速关键点检测,方向分配,使用海森矩阵和图像积分的64元素关键点描述子
SIFT方法
经几何变换的篡改区域可以准确地被定位,因为基于SIFT的方法依靠关键点检测和产生描述子。但是,这些基于SIFT的方法不能定位光滑(平滑)的区域。
SURF方法
SURF技术在整体性能上比SIFT技术更好,因为它有少维度的描述子。但是,SIFT技术的定位准确率更高。因此,结合这两者的优势可以在确保准确性的同时加快计算速度。
基于关键点方法的优缺点比较
关键点检测方法因为对几何变换有鲁棒性被广泛应用,但因为需要检测很多极值点以产生描述子,计算代价在特征匹配阶段要更大。所以一些维度缩减的方法如PCA和DWT被应用进来。另外,一些不变矩的方法也与SIFT或SURF结合来解决平滑区域上的问题。
4 Deep learning-based methods
传统方法只能针对某些特定的伪造进行处理,但是在没有先验信息的情况下不可能知道某张图像采用了哪种篡改方法。
基于深度学习的方法不需要显式的特征抽取过程,而是在网络的训练阶段自动学到相关特征。
传统方法只能定位出相似区域,而像BusterNet那个模型不仅能定位相似区域,还能区分源和目的区域。
5 Future research directions
现有的方法虽然能够在copy-move伪造检测问题上达到较好的表现,但仍存在一些待解决的问题。
提取有效的局部特征描述子
基于关键点的方法不能准确地定位平滑区域。一些改进的方法:Yang et al. [Yang, Sun, Guo et al. (2018)]:使用自适应阈值检测关键点。关键点的数量被阈值控制,这样可以在平滑区域产生更多的关键点,此外此方法还利用到圆形区域而非方形来提升镜像反射变换的表现。Wang et al. [Wang, Li, Niu et al. (2017)]提出基于局部信息熵的方法,将非重叠块分成不规则的超像素,再从这些超像素中提取出具有鲁棒性的关键点,最后使用指数矩为每个关键点创建局部特征,但此方法最大缺陷是计算复杂度过高,在实际应用中不可行。因此需要提取出有效的局部特征描述子以定位平滑区域。
传统方法针对一些附加处理的鲁棒性
现有的方法在无附加处理的情况下已经能达到令人满意的效果。但是当存在一个或多个附加处理时,这些方法的定位准确率可能会大幅下降。因此对于能对抗一些附加处理的方法应给予更多关注。
考虑基于深度学习的方法中将额外操作加入训练过程中
虽然现在基于深度学习的方法在无附加处理的情况下表现很好,但在有附加处理的情况下的表现仍需要提升。这主要是因为附加处理没有在训练过程中被考虑到。因此未来需要构造网络模型来模仿附加处理,并在训练过程中考虑到加入这些附加处理网络以提升模型对抗附加处理的鲁棒性。
词汇表
- integrity 完整,正直
- jeopardize 危害
- verify 核实,查证
- spurious 假的
- adjacent 邻近的,毗邻的
- image moments 图像矩:用于描述图像各种特征的数据