双目立体匹配GANet阅读笔记


        双目立体匹配解决问题为在极线上查找同一物理点在左右相机图像的对应投影位置,从而得到视差图,用于双目系统的物体深度估计。其核心思想是计算两个像素的相似度度量,选择最佳匹配点。基本步骤为预处理,代价计算,代价聚合,视差计算,视差优化,后处理6个步骤。随着大量合成数据集出现,基于深度学习的算法性能已经显著超过非深度学习算法。GANet将人工设计的算法转换为,基于数据的函数逼近学习过程,性能在KITTI 立体匹配竞赛中名列前茅。本文主要介绍GANet涉及算法,包含经典非深度学习算法(代价滤波、SGBM),首个端到端网络GCNet 和GANet原理;最后对比室外场景下性能效果。

1. cost filtering

        基于单像素相似度度量的方式,视差结果存在较大噪声。基于滤波的代价聚合方法,能有效降噪;使用原图的引导滤波器[1]方式或者十字交叉臂[2]的自适应形状的代价聚合方式,可实现快速降噪同时保持边缘特性。

2.SGBM

    SGBM是opencv实现经典立体匹配算法之一,代价聚合融合局部均值滤波和SGM聚合两种方式,整体流程图见图1。


图1 sgbm流程图,来源3

1)代价计算

        分别计算水平梯度方向图像和原始图像的BT代价(考虑采样影响的亮度差值),两者简单相加求和得到初始代价值。

2)代价聚合

        代价聚合包含局部均值滤波和SGM聚合。局部均值滤波使用固定窗口大小的均值滤波聚合代价。SGM聚合[4]是经典算法,核心思想是多路径代价聚合,每条路径上计算本身代价项和惩罚项。

        SGM全局能量函数定义为:

D为视差图,大小为HxW, 每个像素取值最大为D_{max} .给定视差DC(p, D_{p} )为像素p处本身代价值,第二项为邻域像素视差差值为1的惩罚项,控制平滑性,第三项为邻域像素视差差值较大的惩罚项,控制图像边缘位置不连续性。D共有D_{max}^\left\{ HW \right\}  可能性,直接优化困难。

        SGM将其转换为16个方向1D路径代价求和方式来近似加速计算,时间复杂度o(HWD_{max} )

        单个路径方向r上代价计算为,其中第一项为本身代价值,第二项为惩罚项,第三项为防止累积造成数值过大。


多条路径代价求和得到最终聚合代价值

        对于每个方向的每个像素计算Dmax次,中间项minL_{r} (p-r, i) + P_{2} 可以预先计算,时间复杂度为O(Dmax)。

3)视差计算

        每个像素位置采用WTA(赢家通吃)的策略,选择代价最小的视差值

4)后处理

        使用显著性一致校验检测异常点,亚像素级增强使得离散视差值连续化,获取更高精度的视差,最后使用左右一致性检测异常点。

3.GCNet

        基于深度学习强大的特征提取能力,深度卷积网络特征逐渐被用于匹配代价计算。随着大量合成视差估计数据集的出现,DispNet[5]成为首个实现端到端可学习的视差估计网络。该网络借鉴了光流估计FlowNet思想,本质上两者处理问题一致,均解决输入同一场景两幅图像,输出每个像素偏移量的问题。GC-Net[6]提出4D代价空间和3D卷积做代价聚合,真正实现视差估计全流程参数化学习过程。

        整体计算过程为:

        (1)左右相机图像使用深度卷积网络提取特征图h\times w\times c;

        (2)拼接每个像素位置对应视差水平的特征,得到4D代价空间,维度为h\times w\times (D_{max} +1)\times 2F

        (3)在高度、宽度和视差3个维度做3D卷积,代价聚合;

        (4)使用soft argmin回归视差,训练损失函数为smooth L1。

        相对直接度量特征距离的方式,GCNet巧妙使用组合4D代价空间和3D卷积代价聚合,通过可学习权重得到更多代价聚合方式。如果直接计算c维特征的距离度量,得到h\times w\times (D_{max} +1)维的代价空间,这种方式只能衡量特征的相对大小,限制代价计算方式多种可能性。GCNet中每组3D滤波器,计算每一个特征线性加权代价,并融合空间域和视差域的代价,最后所有特征对应代价求和得到聚合代价值。公式如下:

                    cost = \sum_{f=0}^F \sum_{d=1}^K  \sum_{h=1}^K \sum_{w=1}^K (l_{w}\times l_{f}+ r_{w}\times r_{f} )

        传统立体匹配算法通常选择代价最小的视差,即argmin操作。这种操作得到离散精度视差,视差精度低,同时操作不可微,不能使用BP算法训练。GCNet提出soft argmin方式回归视差,即计算代价归一化概率加权的视差值,因为视差和代价成反比,所以有负号。

                    softargmin :=\sum_{d=0}^Dd\times softmax(-c_{d} )

4.GANet

        视差回归属于稠密像素级预测任务,而高分辨率特征图对稠密任务性能起到至关重要的作用。GCNet采用encoder-decoder方式做代价聚合;PSMNet[7]使用stacked hourglass 提取特征,进一步使用类似stacked hourglass方式堆叠更多3D滤波器做代价聚合,提升匹配效果。GANet[8]提出guided SGA和LGA层进行代价聚合操作,提升立体匹配的性能同时也降低计算量。

        整体结构见图2:左右图像首先经过特征提取器提取特征,组合4D代价空间,然后使用3D卷积和guided sga做代价聚合,最后回归像素点的视差值。


图2 GANet计算流程图

1)SGA

        相比传统SGM算法,SGA层使用归一化权重加权和计算单一路径代价,权重由图像几何纹理特征控制。公式如下:

最后在4个方向上取最大的代价输出



         相对于SGM中使用固定惩罚项的方式,SGA层学习可变权重,而且权重由图像空间纹理和上下文信息引导学习,使得不同区域(平坦、边缘)具有不同的权重值。

          3D卷积代价聚合方式,可以被堆叠多次,扩大聚合像素范围,每个像素位置计算复杂度为o(K^3 C_{in} C_{out} );SGA层每次计算均聚合整行或者整列像素的代价,计算复杂度为o(4KC_{out} )。所以说SGA层代价聚合效果优于3D卷积,同时计算复杂度低;代价是需要更多的参数量,每个像素位置均需要存储一组加权参数。

2)LGA层

  LGA层使用归一化权重加权代价和,聚合代价。公式如下


        乍看很像归一化权重的3D卷积操作,不同点是3D卷积在空间和视差水平上权重共享,而lga层权重不共享,每个像素位置,视差水平都有一组权重。这种操作更类似快速边缘保持滤波器guided filter,   文章后续试验表明添加lga层在物体边缘位置效果更好。


5.性能对比

        测试对比sgbm和ganet在室外场景图像效果。sgbm算法在不同场景下有一定的偏差,但效果整体比较稳定;GANet在大部分区域匹配非常精确, 在无纹理区域(地面、天空)更加平滑,物体边缘效果精确,但是在近距离的重复区域仍存在较大偏差。这主要是GANet特征提取器采用多次下采样,再上采样恢复高分辨率特征导致。HRNet[9]使用多分辨率子网并行计算,多尺度融合的方式获取高分率特征。在人体姿态估计、像素级分类等任务中,都被证明有效。试验HRNet做特征提取器,近距离的重复区域的立体匹配效果会更加精确。

6.总结

        随着大量标注数据集出现,基于深度学习的立体匹配算法在特定场景下的效果显著优于非深度学习算法。GANet将经典SGM算法参数化表示,基于数据学习参数;同时摒弃深度卷积网络权值共享的机制,添加基于图像纹理控制的权重操作层,在立体匹配数据集取得优异性能。这种结合领域知识设计的网络架构是无法通过最近盛行的网络架构搜索得到的。


参考文章

1. C. Rhemann, A. Hosni, M. Bleyer,等. Fast cost-volume filtering for visual correspondence and beyond[J].

2. Xing Mei, Xun Sun, Mingcai Zhou,等. On Building an Accurate Stereo Matching System on Graphics Hardware[C]// IEEE International Conference on Computer Vision Workshops, ICCV 2011 Workshops, Barcelona, Spain, November 6-13, 2011. IEEE, 2011.

3. https://www.jianshu.com/p/07b499ae5c7d

4. Heiko Hirschmüller. Stereo Processing by Semi-Global Matching and Mutual Information[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2007, 30(2):328-341.

5. Mayer N , Ilg E , Husser P , et al. A Large Dataset to Train Convolutional Networks for Disparity, Optical Flow, and Scene Flow Estimation[J]. 2015.

6.Kendall A , Martirosyan H , Dasgupta S , et al. End-to-End Learning of Geometry and Context for Deep Stereo Regression[J]. 2017.

7.Chang J R , Chen Y S . Pyramid Stereo Matching Network[J]. 2018.

8.Zhang F , Prisacariu V , Yang R , et al. GA-Net: Guided Aggregation Net for End-to-end Stereo Matching[J]. 2019.

9.Sun K , Xiao B , Liu D , et al. Deep High-Resolution Representation Learning for Human Pose Estimation[J]. 2019.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,271评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,725评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,252评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,634评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,549评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,985评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,471评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,128评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,257评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,233评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,235评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,940评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,528评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,623评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,858评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,245评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,790评论 2 339

推荐阅读更多精彩内容