CGNet: A Light-weight Context Guided Network for Semantic Segmentation

论文地址：https://arxiv.org/pdf/1811.08201
代码地址：https://github.com/wutianyiRosun/CGNet

1. 摘要

本文提出了一种新颖的上下文引导网络（CGNet），它是一种用于移动设备语义分割的轻量级网络。我们首先提出了Context Guided（CG）块，它学习了局部特征和周围环境的联合特征，并进一步改善了与全局背景的联合特征。基于CG块，我们开发了上下文引导网络（CGNet），它捕获网络所有阶段的上下文信息，并专门用于提高分割准确性。CGNet还经过精心设计，可减少参数数量并节省内存占用。在相同数量的参数下，CGNet显着优于现有的分割网络。在Cityscapes和CamVid数据集的大量实验验证了所提方法的有效性。具体而言，在没有任何后处理的情况下，CGNet在Cityscapes上的平均IoU达到64.8％，参数小于0.5M，并且在一张NVIDIA Tesla K80卡上的帧速率为50 fps，用于2048×1024高分辨率图像。

2. 引言

这些小网络的分割精度较低，因为他们只遵循图像分类设计原则而忽略了语义分割的固有属性。为了提高精度，我们设计了一个新的CGNet利用语义分割的内在特性。空间相关性和上下文信息在提高准确性方面起着重要作用，因为语义分割既涉及像素级分类，也涉及对象定位。因此，我们提出了作为CGNet基本单元的Context Guided（CG）块，以有效且高效地对空间依赖性和语义上下文信息进行建模。
1) CG块学习局部特征和周围环境的联合特征。因此，CG块从自身及其空间相关对象中学习每个对象的表示，其中包含丰富的共现关系。
2) CG块使用全局上下文来改善联合特征。全局上下文应用于通道明确地重新加权联合特征，以便强调有用的组成部分并抑制无用的组成部分。
3) CG块在CGNet的所有阶段使用，从下到上。因此，CGNet从语义层面（来自深层）和空间层面（来自浅层）捕获上下文信息，与现有方法相比，这更适用于语义分割。
4) 在所有阶段捕获上下文特征的结构更有效，当前的主流分割网络具有五个下采样阶段，其学习过于抽象的对象特征并且缺少大量的判别空间信息，导致过度平滑的分割边界。不同的是，CGNet只有三个下采样阶段，这有助于保留空间信息。
图2.语义分段的替代架构。CM：上下文模块，CF：上下文特征。（a）FCN形状模型遵循图像分类的设计原则，忽略上下文信息。（b）FCN-CM模型仅通过在编码阶段之后执行上下文模块从语义级别捕获上下文信息。（c）提出的CGNet从语义层面和空间层面捕捉所有阶段的背景特征。
贡献
1）们分析了语义分割的固有属性，并提出了CG块，它学习了局部特征和周围环境的联合特征，并进一步改善了与全局背景的联合特征。
2）我们设计了CGNet，它可以有效地应用CG块，并在所有阶段有效地捕获上下文信息。CGNet的骨干特别适合提高分割精度。
3）我们精心设计CGNet架构，以减少参数数量并节省内存占用。在相同数量的参数下，建议的CGNet显着优于现有的分割网络。

3. 相关工作

小型语义分割模型：
需要平衡准确率和系统开销。
ENet -> ICNet -> ESPNet。
这些模型基本都基于分类网络设计，在分割准确率上效果并不是很好。
上下文信息模型：
大多数现有模型只考虑解码阶段的上下文信息并且没有利用周围的上下文信息。
注意力机制：
CG block使用全局上下文信息计算权重向量，并使用其细化局部特征和周围上下文特征的联合特征。

4. 提出的方法

4.1 Context Guided Block

图3.（a）当我们只注意黄色区域本身时，很难对黄色区域进行分类。（b）借助其周围环境（红色区域）更容易识别黄色区域。（c）直观地，当我们进一步考虑全局背景信息（紫色区域）时，我们可以将黄色区域分类为更高的置信度。（d）Context Guided块的结构，它由局部特征提取器f_loc(*)，周围的上下文提取器f_sur(*)，联合特征提取器f_joi(*) 和全局上下文提取器 f_glo(*)组成。（·）表示逐元素乘法。
CG主要包含两个步骤: 1） f_loc()和f_sur()分别用于学习局部特征和相关的周围上下文信息。f_loc()被实例化为3 x 3标准卷积层，从8个相邻特征向量中学习局部特征。f_sur()被实例化为3x3空洞卷积层，空洞卷积可以扩大感受视野学习周围的环境。f_joi()是两者的输出的拼接，后面跟着BN和PReLU操作。 2）f_glo()提取全局特征改善联合特征，，全局上下文被视为加权向量，并应用于通道明确地重新组合联合特征，以便强调有用的组成部分并抑制无用的组成部分，将f_glo(*)实例化为全局平均池化，聚合全局上下文接着是多层感知器以进一步提取全局上下文。最后，我们使用缩放层来使用提取的全局上下文重新加权联合特征。
图 4
CG block还采用了残差学习。文中提出了局部残差学习（LRL）和全局残差学习（GRL）两种方式。 LRL添加了从输入到联合特征提取器的连接，GRL添加了从输入到全局特征提取器的连接。从直观上来说，GRL比LRL更能促进网络中的信息传递。

3.2 Context Guided Network

图5.提出的上下文引导网络的体系结构。 “M”和“N”分别是阶段2和阶段3中的CG块的数量。
表1. Cityscapes的CGNet架构。输入大小为3×680×680。“Conv”代表Conv-BN-PReLU的运营商。 “r”是周围环境提取器f_sur(*)中的Atrous / dilated卷积率。 “M”和“N”分别是阶段2和阶段3中的CG块的数量。
在阶段1中，我们仅堆叠三个标准卷积层以获得1/2分辨率的特征映射，而在阶段2和阶段3中，我们堆叠M和N 个CG块以将特征映射为输入的1/4和1/8。对于阶段2和阶段3，第一层的输入是通过组合其前一阶段的第一个和最后一个块来获得的，这鼓励了特征重用并加强了特征传播。为了改善CGNet中信息的流动，我们采用输入注入机制，该机制另外将1/4和1/8下采样输入图像分别馈送到第2阶段和第3阶段。最后，采用1×1卷积层来产生分割预测。
CG block用于第2和第3阶段的所有单元，这意味着CG block几乎用于CGNet的所有阶段。因此，CGNet具有从下到上、从深层语义层面和从浅层空间层面聚合上下文信息的能力。与现有的忽略上下文信息或只在编码阶段后通过上下文模块从语义层捕获上下文信息的分割框架相比，CGNet的结构经过精心定制，以提高语义分割的准确性。
此外，为了进一步减少参数数量，特征提取器f_loc()和f_sur()采用通道方式的卷积，这消除了跨通道的计算成本并节省了大量内存。之前的工作采用1×1卷积层，遵循通道方式卷积，以促进通道之间的信息流。然而，这种设计不适用于所提出的CG块，因为CG块中的局部特征和周围环境需要保持信道独立性。

4. 实验

采用Adam优化器，lr为1e-3,权重衰减为5e-4,batch_size为14，对于数据增强，我们在输入图像上使用随机镜，平均减法和随机比例来增强训练期间的数据集。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,530评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 86,403评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,120评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,770评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,758评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,649评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,021评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,675评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,931评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,659评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,751评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,410评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,004评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,969评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,042评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,493评论 2赞 343

CGNet: A Light-weight Context Guided Network for Semantic Segmentation

1. 摘要

2. 引言

3. 相关工作

4. 提出的方法

4.1 Context Guided Block

3.2 Context Guided Network

4. 实验

推荐阅读更多精彩内容