论文 | CVPR2020 《Cascaded Deep Monocular 3D Human Pose Estimation with Evolutionary Training Data》论文解读

一 写在前面

未经允许,不得转载,谢谢~~~

这篇文章主要做的是3D human pose estimation,从单图中恢复3D的人体skeleton信息。

主要信息:

二 主要内容

2.1 相关背景

尽管现有的3D human body estimation方法比较成功,但是仍然需要面临以下2个问题:

  • 对于RGB图像的3D标注工作非常耗费人力/时间/资金;
  • 现有的数据集非常的biased,大多数是室内的数据集,而且包含的动作也是少数被选择的日常行为。

这就导致现有方法仍然是data-hungry以及不能很好的恢复novel pose。

而现有的很多方法是基于two-stage模式的:

  1. locates 2D human keypoints;
  2. lifts the 2D joints into 3D skeleton;(using geometric info)

其中stage1比较方便,且可以利用很多wild的数据集,所以训练数据不会很受限,但是stage2能用的training data就很少。

2.2 本文工作

针对这些现象,文章提出了2个问题:

  1. are 2D-to-3D networks influenced by data bias;
  2. if yes,how can we improve network generalization when the training data is limited in scale or variation?

本文的工作可以说都针对以上2个问题进行展开:

  1. 首先提出用层次化的人体模型来表示training data,将human pose表示为local bone orientation的集合;
  2. 然后提出dataset evolution framework来处理数据集受限的问题。(可以理解为数据增强算法)。利用一些简单的先验知识,在不用任何标注的情况下,通过crossover(交叉),mutation(变换)等操作实现3D空间中新3D skeletons的生成;
  3. 在增强好的数据上,提出一个级联网络cascaded network(TAGNet),用来预测最后的3D skeleton。TAGNet主要包含1)2D joint detector 2) a novel cascaded 2D-to-3D network;
  4. 把他们增强好的数据集release出来了。(目前暂时没有找到)

经过对dataset进行增强后,其效果比之前的方法都好,能解决dataset biased的问题,且能较好的处理novel pose。


三 具体方法

3.1 Hierarchical Human Representation

首先是3D skeleton的表示:


如图,从整体上看是一个tree(注意不是graph),而是有方向的树,从parent节点指向child节点。然后对于每个parent,都有一个以当前parent为坐标中心的local坐标系。其中local 坐标系是由三个基向量[i,j,k]定义的旋转矩阵定义的。

这样将全局的向量表示转换到local的向量表示:


最后为了便于计算,还将其转换到椭圆坐标系上:


3.2 Synthesizing New 2D-3D Pairs

主要想法:主要是3D data比较少,所以对现有的3D skeleton进行新数据的生成,再利用相机参数将其映射回去,得到对应的2D keypoints就得到了新的数据。

主要的操作包括以下两种:


1) crossover(左边)
随机选择一个顶点,图中为左手臂靠近脖子的第一个,然后将pose A和pose B这个点以下的部分全部交换。

2)mutation(右边)
对旋转角度加一些高斯变换,改变其方向。

此外,也包括对整个人进行角度的转换,以及bone的长度的改变,以更好的增加数据集多样性。

3.3 Model Architecture

网络部分比较简单。

第一个阶段是获取热力图以及对应的2D keypoints,文章的重点是在从2D keypoints到3D keypoints的转换过程,也就是第二个阶段。

这里是直接针对坐标进行学习的网络,了解这个就比较清楚了,也就是输入输出都是坐标的数值。具体的网络模型的设计(第2排)用级联的方式达到一个循序渐进的效果。

四 实验结果

4.1 与弱监督的方法比(H3.6M for training and testing)

4.2 与SOTA比 (H3.6M for training and testing)

4.3 跨数据集的生成能力 (H3.6M for training,3DHP for testing)

4.4 数据增强算法可视化

left:before augmentation
right:after augmentation


五 写在最后

感谢阅读~

以及关注下,点个赞再走么~(´∀`)ノ

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,013评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,205评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,370评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,168评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,153评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,954评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,271评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,916评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,382评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,877评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,989评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,624评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,209评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,199评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,418评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,401评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,700评论 2 345