吴恩达Convolutional Neural Networks 第三周笔记

学习目标
Understand the challenges of Object Localization, Object Detection and Landmark Finding
Understand and implement non-max suppression
Understand and implement intersection over union
Understand how we label a dataset for an object detection application
Remember the vocabulary of object detection (landmark, anchor, bounding box, grid, ...)

object localization:
这两天网速太挫,视频老是加载不出来,只能曲线救国,去网易云课堂了。所以以下的截图全都带有云课堂的标识。
localization是classification的进阶版,不仅要label中一张图片属于什么,还要找到他的位置(只有一个 object(,where is the car。classification with locallization means not only do you have to label this as say a car but the algorithm also is responsible for putting a bounding box, or drawing a red rectangle around the position of the car in the image. detection的话,图片当中不止一个object ,要把object 圈出来,并且告知这个object是什么。即 there might be multiple objects in the picture and you have to detect them all and and localized them all.



classification with localization:
在分类的基础上加了bounding box 的回归,多了四个参数。



有一个类似于flag的值Pc,代表是否有object,有object 为1,没有为0 用的损失是均方差损失。

landmark detection
landmark :地标 感觉类似于关键点 X and Y coordinates of important points and image,体现在人脸上的话,就是眼睛鼻子嘴巴的定位点 ,假设要找的关键点有64个,那么该神经网络的输出就是129个 64×2+1(判断是否是脸) attention:label要一致,以人脸为例,所有的landmark的顺序要一致,比如第一个landmark是左眼左,第二个是左眼右,那么所有的标定都要是这个顺序。


object detection:
一个图像中不只一个物体,



第一种方式:sliding windows:计算代价大,如果你用较细的粒度,但是你要是粗一些,又会影响准确率,这两者之前的平衡点。之前sliding windows work,是因为分类器都很简单,不像convnet这样复杂,所以可以handle这个问题。用convnet的话,以滑窗的方式就比较不现实。


convolutional implementation of sliding windows:
first,先将FC层转化为卷积层,用上一层feature map 的大小 作为滤波器的size



就是共享卷积特征,不是说在原图上做滑窗,而是把整张图像丢进去,最后得到的feature map 的大小就会是原来需要滑窗次数乘以原feature map 的大小 缺点是the position of the bounding boxes is not going to be too accurate 这个是overfeat 的实现



bounding box predictions:
上面的方法本质上还是基于滑窗,那么bounding box 的位置会受限,看你滑窗怎么样,有时候并不能准确的框到目标 ,比如蓝色的框



yolo 算法
在图像上分grid cell 比如3×3的, 每一个cell 都有一个标签,每个标签都是个向量



会把这个cell归一化一下 左上(0,0)右下(1,1)、yolo不是很好读懂

intersection over union:
intersection over union既iou,就是和bounding box 重合的面积


non-max suppression
非最大值抑制:对同一个物体而言,算法可能会画很多个框。也就是说一个物体不只被检测到一次。以下图grid cell 的为例,会有很多的cell被认为是。非最大值抑制就是把这些框框去掉


抑制前,一辆车有好几个

抑制后,一辆车就只剩一个了

实现:
在PPT中,先把问题简化成了单单car识别的问题,就不存在三类了。pc表示的是物体的概率,不是是否有物体。所以输出的是六个。
首先,排除pc<=0.6的,然后选取pc值最大的,然后再排除iou <0.5的

如果有三类物体的话,就分别做三次

anchor boxs
前面的方法,每一个grid cell 只能predict 一个object ,那么how about multiple objects in a grid cell ? 这里就可以用anchor box
yolo algorithm



根据anchor box 的数量,那么每个cell输出的大小也变了 要乘以anchor box 的数量



yolo algorithm:
把之前讲的都串起来,训练 预测以及怎么最大值抑制的





pedestrain

region proposals
在two-stage 的检测用到,sliding Windows 的方法会有很多空的滑窗。所以就先选框。比如用分割的方法先得到候选框



rcnn quit slow ,每个候选框都要提特征
fast 用了roi-pooling,不用每个图都要提特征,但是还是用的ss,
faster 用了rpn来替代了ss


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容

  • 日精近打卡第38天 姓名:耿洪力 单位:宁波慈星股份有限公司 组名:六项精进277期谦虚三组 【知~学习】 【六项...
    耿洪力阅读 199评论 0 0
  • 指读《悯农》和《静夜思》一遍,这两首诗彤彤已经非常熟悉了,现在基本就是自己指自己读了。把家里贴的词语都指读...
    简乔儿阅读 139评论 0 0
  • 曾经,我知道女娃们很能吃,但是,顶多也就和我吃的的差不多吧……哈哈 现在,我知道女娃们真的很能吃,一个女娃最少能顶...
    笨_阅读 376评论 0 0
  • 我住的城市,有山有水有断桥 我住的城市,逗猫遛狗养旅人 我住的城市,还有绵长的细雨 有说不完的故事和上古的传说
    f5e0431e3756阅读 158评论 0 1