浅析计算机视觉中的自监督学习

在计算机视觉(CV)领域,目前的方法主要依赖大量的标注样本来学习丰富的视觉表征,从而在各项CV任务中取得较好的表现。然而在许多情况下,大规模的人工标注并不容易获得。因此,我们希望可以利用无监督方法去学习那些不带标注的样本。那么问题来了,一个样本没有了标签,我们该设计怎样的目标任务,才能促使网络学习到好的特征表示呢?


首先,我们来听一个隔壁领域的小故事。

在自然语言处理(NLP)领域,上下文信息(context)常常作为特征学习的监督信号。举个栗子,我们学生时代的老朋友——“完形填空”:给定一个很大的语料库,我们要训练一个模型,能够将每个词映射为特征向量,然后根据上下文信息去预测某个被挖掉的词。在特征空间中哪个词和上下文词距离越近,那么要填这个词的可能性越大。这可以看作是把一个无监督问题(找到单词间的相似性度量)转化为了“自监督问题”:学习一个函数,能够表示挖掉的词与他旁边的词的关系。这里的“完形填空”就作为一个pretext task(直译借口任务,或称代理任务)促进模型学习词特征,进而在很多真实任务中起到很大帮助。

于是,这样的思路被带进了CV领域。CV中的自监督学习隆重登场。


下面正式地向大家介绍——“自监督学习”(Self-supervised Learning)

自监督学习,是无监督学习的一种,即无需额外的人工标签,仅利用数据自身的信息作为监督(自己监督自己)。利用来自数据自身的监督信息,设计一个pretext task,训练网络去完成该pretext task,从而促使网络学习到数据特征。

如何检验 pretext task 的有效性,或者说学习到的数据特征是否足够好?

通过迁移学习,将pretext task中学到的特征迁移到downstream task(直译下游任务,或称后续任务)中,包括图像分类、检测、分割等任务,类似于提供了预训练模型。如果能促进这些 downstream  task 中取得很好的表现,则说明学习到的特征是好的。

自监督表征学习流程

说到这里,想必大家可以发现,自监督学习中最重要的一环,就是如何设计一个pretext task,让模型可以学到更好的数据特征。接下来,带大家看看各种脑洞大开的pretext task。

[1] 相对位置预测:预测一张图像中随机选择的两个图像块之间的相对位置。

[2] 图像修复:预测一张图像中被遮挡的部分。

[3] 拼图游戏:将图像中打乱的9个图像块复原。

[4] 旋转角度预测:预测图像中物体的旋转角度。

[5] 图像着色:Lab图像中利用L亮度通道,预测ab色彩通道。

[6] 跨通道预测:L通道和ab通道相互预测。

[7] 计数:预测鼻子、眼睛、爪子、头的数量。

[8] 实例区分:分类,一张图像和其增强的图像为一类,和其他图像为不同类。

[9] 对比预测编码:根据“过去的”信息,预测“未来的”信息。



欲知后事如何,且待明天继续更...

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342