PVANet论文阅读笔记

论文：Lightweight Deep Neural Networks for Real-time Object Detection
Github：PVANet
C++ Demo ：PVANet_CPP

Abstract

许多目标检测问题中，算法的运行速度和精度同等重要。本文主要针对的就是算法的运算速度提升问题。作者提出了一个轻量级的网络，取得了state-of-the-art的效果。网络基于基本的设计原则：more layers with less channels. 此外，作者利用C.ReLU和Inception structure减少网络的冗余。

Introduction

Network compression and decomposition of convolution 表明：现在的网络结构是高度冗余的，所以减少冗余就成为了一种提升网络运行速度最直接的方式。作者提出的网络结构概要：

基于more layers with less channels的基本原则。
在网络初始几层采用C.ReLU，在后面几层采用Inception structure.
应用多尺度特征级联maximize the multi-scale nature of object detection tasks.
权重衰减策略采用plateau detection(一定迭代次数内loss不再下降，则将学习速率降低常数倍)
PVANet通过batch normalization, residual connections可以实现高效的训练。

PVANet结构介绍

PVANet网络可以分成两部分来看：特征抽取网络和检测网络。

1. 特征抽取网络

网络的总体结构如下所示，KxK的C.ReLU表示1x1 - KxK - 1x1的卷积层的堆叠：

PVANet特征提取部分

特征提取网络由两个building block组成，即mC.ReLU和Inception structure：

PVANet-building-block

特征抽取网络有以下三个关键点：

Modified C.ReLU
C.ReLU的设计思路来源于对CNN中的activation patterns的观察。具体什么意思没太看懂。总之作者在C.ReLU的基础上添加了一个bias layer，这使得两个相关的滤波器可以有不同的bias value。
Inception structure
作者发现Inception structure在捕获图像中的小目标，大目标方面是最高效（计算方面高效）的手段之一。
为了捕获图像中的大目标，需要足够大的感受野，这个可以通过堆叠3x3的滤波器来达到。但是为了捕获小目标，则需要小一点的感受野，1x1的卷积核正好合适。可以避免大卷积核造成的参数冗余问题。基于上述两点，Inception structure用于目标检测是非常合适的。
Deep network training
网络训练用了以下几个技巧：
1.在Inception模块加入残差连接(residual structures with pre-activation)
2.Batch normalization
3.权重衰减策略采用plateau detection

2.目标检测网络

在这部分，作者基本沿用了Faster R-CNN的框架，PVANet总体结构如下所示：
![PVANet网络结构](http://upload-images.jianshu.io/upload_images/1794530-b92f7ff18335b393.png?
imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

值得一提的是，作者输入RPN的feature maps只有128个，因为作者发现用128个效果和用512个是一样的，精度并没有损失。但是作者没有给出为什么，个人觉得应该是特征图冗余的原因吧，大部分网络都是有很多优化空间的。
此外，feature map 经过ROI之后产生一个6 x 6 x 512的张量。之后通过4096-4096-(21 + 84)的全连接层输出结果。正是因为这里用的是全连接层，所以给后面模型进一步压缩（且不损失精度）提供了机会。这也是Github所提供的compressed模型的由来。

实验结果

模型训练

模型在ImageNet 2012分类数据库预训练，中间有一些裁剪啦，学习速率调整之类的，此处不再赘述。
模型的fintuning训练在目标检测数据库上训练，具体可以看论文。
此外，作者还利用了Bounding box投票得到了PVANet+模型，以及优化前面所说的全连接层得到了PVANet compressed。

实验结果

mAP基本上和state of art的网络差不多啦，而且还是像题目所说的，轻量级，实时的网络！

结论

本文提出了一个轻量级的网络，取得了state of art的结果。此外，本网络结果的设计完全独立于network compression and quantization. 因此，还可以进一步利用最近的模型压缩技术来提升性能。例如，基于现有网络应用truncated SVD就可以实现显著的运行时间提升！

总的来说，作者的创新着重于特征提取部分，使用了时下各种流行的技术。Batch Normalization, C.ReLI, Inception structure, Residual connected。相比与R-FCN，SSD这些引入新的检测网络是完全不同的思路。因此可以考虑将作者提出的高效的特征提取网络和FCN， SSD这些网络的检测网络部分结合起来，实现进一步的性能提升。

最后编辑于：2018.08.14 20:56:30

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,839评论 6赞 482
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,543评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,116评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,371评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,384评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,111评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,416评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,053评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,558评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,007评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,117评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,756评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,324评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,315评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,539评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,578评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,877评论 2赞 345

PVANet论文阅读笔记

Abstract

Introduction

PVANet结构介绍

1. 特征抽取网络

2.目标检测网络

实验结果

模型训练

实验结果

结论

推荐阅读更多精彩内容