【转载】快速理解YOLO目标检测

原文链接：http://www.cnblogs.com/sandy-t/p/7397713.html

YOLO（You Only Look Once）论文

近些年，R-CNN等基于深度学习目标检测方法，大大提高了检测精度和检测速度。

例如在Pascal VOC数据集上Faster R-CNN的mAP达到了73.2。而YOLO和SSD在达到较高的检测精度的同时，检测速度都在40FPS以上。这里主要对YOLO做简单介绍。

整个YOLO的网络结构如图，前面20层使用了改进的GoogleNet，得到14×14×1024的tensor，接下来经过4个卷积层分别进行3×3的卷积操作和1×1的降维操作，最后经过两个全连接层后输出为7×7×30的tensor。检测目标就能从7×7×30的tensor中得到。

作者首先取出前面的20层网络，另外再加上一个average-pooling层和一个全连接层，在ImageNet训练集上进行图像分类任务的欲训练，top-5达到88%的准确度。然后将经过图像分类训练的前20层网络加上后面的网络层进行检测任务的训练。

7×7×30 tensor的解释：

其实这里的7×7并不是将输入图像划分为7×7的网格，实际上指经过多个卷积层处理过后的特征map是7×7大小的，而且其中的每个cell是互相有重叠的，但是为了便于直观理解，直接将原始图像用7×7的网格进行划分。可以看到每个cell向量的前5维分别代表了一个检测框的x坐标，y坐标，宽度和高度，检测框中有目标物体的置信度（P(Object) ∗ IOU）。

在论文中每个cell有两个检测框，6到10维向量代表了另外一个检测框的x坐标，y坐标，宽度和高度，检测框中有目标物体的置信度。

cell还剩下20维向量，代表这个cell中的物体属于20个类别的概率值。将cell两个检测框的置信度分别乘以20类别的概率值。

最后得到了7×7×2=98个检测框的20个类别的概率值。

接下来要从候选的检测框中找出最后的目标框：

对每个类别，进行阈值比较、降序排列、对有重叠的候选框使用非极大值抑制（NMS）操作。

最后候选框的最终分数得到最终的类别和分数：

标出检测框：

关于非极大值抑制（NMS）：

用bbox_max代表分数最大的候选框，将其与其他候选框bbox_cur进行比较，如果IoU（bbox_max，bbox_cur）>0.5，将候选框bbox_cur的分数置为0。

第一轮循环后，由于橙色框（bbox_max）和绿色框的重叠度大于0.5，所以将绿色候选框的分数置0。

第二轮循环，将剩下的第二大分数的候选框设为bbox_max（图中的蓝色框）

同样的道理，由于蓝色框（bbox_max）和粉色框的重叠度大于0.5，所以将粉色候选框的分数置0。

使用非极大值抑制循环结束后，很多情况下，都只有少数的几个候选框大于0。

关于Intersect over Union (IoU)

关于Yolo v2

后来作者对YOLO进行了改进，公布了YOLO v2，论文

在精度（73.4 mAP on Pascal voc）和速度两个方面都有提高，并且提出了能够检测9000类物体的方法。

具体改进的地方有：

增加了batch normalization

在ImageNet上的预训练使用224×224和448x448两种尺寸的图像。

用Faster-RCNN类似的anchor boxes ，代替7×7grid-cell。

用kmeans方法得到box形状，代替人工选择box形状。

在ImageNet和MS-COCO数据集上进行训练。

提出了能够在分类数据集上训练检测任务的方法。

使用WordTree结合多种不同标签的数据。

参考：

deepsystems.io

有些人，一辈子都没有得到过自己想要的，因为他们总是半途而废

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

【转载】快速理解YOLO目标检测

推荐阅读更多精彩内容