翻译原作者如图水印 : 头条号 不靠谱的猫
在这篇文章中,我试图对Kfir Aberman等人的论文《神经最佳伙伴:稀疏跨域通信》(Neural Best Buddies:Sparse Cross-Domain Correspondence)进行解释(https://nurture.ai/papers/neural-best-buddies-sparse-cross-domain-correspondence/)。论文研究了计算机视觉中一个基本的图像对应问题,给出了一种有效的方法来提取具有稀疏性的跨域对象之间的对应关系。它利用卷积神经网络(CNNs)提取深层特征,并利用最近邻域对其进行进一步分析。早期的特征匹配方法,如SIFT,处理同一类不同形态学视点的图像,具有dense的对应关系。但文章主要研究的是具有不同形状和外观的“有意义”特征匹配点的跨域对象。
找出问题:
(http://p3.pstatp.com/large/pgc-image/153295261030854c6dcff74.jpg)
找出解决方案:
(http://p3.pstatp.com/large/pgc-image/153295288079462554a8d30.jpg)
It is all starts from the deep….:
卷积神经网络广泛用于计算机视觉问题,如物体检测,分类和loacalization。已经表明,训练有素的分类网络的较深层提取具有位置和外观不变性的高级判别特征,而较浅层编码低级图像特征,例如边缘和角落等.CNN的较深层可以用于提取有意义的特征,而浅层则匹配对象之间的相应特征。
风格转移:
这篇论文想用风格转换算法来补偿在底层的cnn层的视觉差异。他们感兴趣的local region进行风格转换以考虑性能。该方法采用了一种神经类型的transfer 算法,对特征统计量进行归一化,该方法认为该类型主要包含在深度特征通道的均值和标准差范围内(采用的是eq-4)。
神经最佳伙伴:
神经最佳伙伴(NBB)是一对神经元的激活,它们是相邻的对象之间的近邻。映射两个图像之间的对应关系包括提取单个特征和执行基于度量的匹配。假设P和Q是在层1处的图像A和B的特征向量F_Al和F_B1的局部区域(从1-1层获得)。我们说神经元p属于P而q属于Q是最近邻,当且仅当p在相似距离函数下的集合Q下(方程2)。该度量被定义为区域P和Q的局部样式转移,例如C_A和C_B,在输入图像A和B中对应于两个合成图像的L2范数距离的表示。
算法:
评价:
根据作者的知识,以前没有做过这样的工作。作者还进行了一项用户研究,并询问参与者两幅图像之间最佳对应的特征。他们观察到基于人类的映射和算法生成的映射之间的强烈共识。
(http://p1.pstatp.com/large/pgc-image/1532953838486c423f67a6f.jpg)
限制:
该算法的基本假设是该对象包含几何相似的区域。从下面的图像可以看出,该算法对于具有不同姿势的对象非常有效。深层特征可能不是纯语义的,并且几何形状影响深贴片的相似性,因为该算法从深层构建对应,这可能导致错误匹配。
(http://p1.pstatp.com/large/pgc-image/15329538804073c4da17317.jpg)
应用:
该方法可用于高精度跟踪应用,也适用于混合图像的创建,跨域图像对齐,图像变形等。
(http://p1.pstatp.com/large/pgc-image/1532953911030a3eb6a9c30.jpg)