Faster R-CNN Explained

姓名:张志文 学号:19021210649
【嵌牛导读】
Faster R-CNN是目前最常用的图像检测算法之一
【嵌牛鼻子】
Faster RCNN;图像
【嵌牛提问】
什么是Faster RCNN网络呢?
【嵌牛正文】

Fast R-CNN解释

Fast R-CNN 有两个网络:建议窗口网络(RPN)生成建议窗口并使用这些窗口检测物体。与Fast R-CNN 的主要区别在于后者使用选择性搜索来生成建议窗口。当RPN与物体检测网络共享最多计算时,RPN中生成建议窗口的时间成本比选择性搜索小得多。 简而言之,RPN对区域框(称为锚点)进行排名,并提出最可能包含物体的框。 结构如下。

Fast R-CNN 结构

锚在Fast R-CNN 中扮演着重要角色。 锚是一个盒子。 在Fast R-CNN 的默认配置中,图像位置有9个锚点。 下图显示了尺寸为(600,800)图像的位置(320,320)的9个锚点。

锚点(320,320)

让我们仔细看看:

1. 三种颜色代表三种尺度或尺寸:128x128,256x256,512x512。

2. 让我们挑出红色的盒子/锚点。 三个盒子的高宽比分别为1:1,1:2和2:1。

如果我们以步长16选择一个位置,那么将有1989(39x51)个位置。 这导致17901(1989 x 9)盒子需要考虑。 绝对的尺寸不小于滑动窗和金字塔的组合。 或者你可以推断这就是为什么它的覆盖范围和其他最先进的方法一样好。 这里的好处是我们可以使用建议窗口网络,Fast R-CNN 中的方法来显着减少数量。

这些锚点适用于Pascal VOC数据集以及COCO数据集。 但是,你可以自由设计不同类型的锚/盒。 例如,你正在设计一个计算乘客/行人的网络,你可能不需要考虑非常短,非常大或方形的盒子。 一套趁手的锚可以同时提高速度和准确率。

建议窗口网络

建议窗口网络(RPN)的输出是一组窗口/盒子,将由分类器和回归器检查以最终检查物体的发生。 更准确地说,RPN预测锚是背景或前景的可能性,并细化锚。

训练建议窗口网络

背景和前景的分类器

训练分类器的第一步是产生训练数据集。 训练数据是我们从上述过程和准确值框中获得的锚点。 这里需要解决的问题是我们如何使用准确值盒来标记锚点。 这里的基本思想是我们想要将具有较高重叠的锚点标记为准确值框作为前景,将具有较低重叠的锚点标记为背景。 显然,它需要一些调整和妥协来分离前景和背景。 你可以在实现过程中查看此处的详细信息。 现在我们有锚的标签。

这里的第二个问题是锚的特征是什么。

假设应用CNN后,600x800图像会缩小16次成为39X51的特征图。特征图中的每个位置都有9个锚点,每个锚点都有两个可能的标注(背景,前景)。如果我们将特征映射的深度设置为18(9个锚点x 2个标签),我们将使每个锚点都有一个带有两个值(正常称为logit)的向量,表示前景和背景。如果我们将logit提供给softmax / logistic回归激活函数,它将预测标签。现在,训练数据包含特征和标签。

如果你想在这个过程中重新使用经过训练的网络作为CNN,你可能会注意的另一件事是感受野。确保要素图上每个位置的感受野覆盖它所代表的所有锚点。否则,锚点的特征向量将没有足够的信息来进行预测。如果你想了解更多关于感受野的话,这里有一个很好的解释。

边界框的回归

如果你遵循标记锚点的过程,你还可以根据回归量的类似标准来挑选锚点以进行细化。 这里有一点是标记为背景的锚点不应该包含在回归中,因为我们没有地面实例框。 特征图的深度为32(9个锚点×4个位置)。

本文使用左上方位置(x,y)的平滑L1损失,以及高度和宽度的对数,与Fast R-CNN 中的相同。

回归量的损失函数

RPN的总体损失是分类损失和回归损失的组合

ROI 池化

在RPN之后,我们得到了不同大小的建议窗口。 不同大小的窗口意味着不同大小的CNN特征映射。 要建立一个有效的结构来处理不同大小的特征映射并不容易。 池化感兴趣区域可以通过将特征映射减少到相同的大小来简化问题。 与具有固定大小的Max-Pooling不同,ROI Pooling将输入特征映射分成大致相等区域的固定数字(比如说k),然后在每个区域应用Max-Pooling。 因此,无论输入大小如何,ROI Pooling的输出始终为k。 这是关于ROI Pooling的一个很好解释。

使用固定的ROI Pooling输出作为输入,我们对最终分类器和回归器的体系结构有很多选择。

训练

本文提到了两种方式:先训练RPN,最后的分类器和回归器; 同时训练他们。 后者的速度提高了1.5倍,精度相似。 梯度以两种方式反向传播到CNN。

本文内容为转载,版权归作者所有

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容