深度学习 Caffe 内存管理机制理解

本文是作者原创，如有理解错误，恳请大家指出，如需引用，请注明出处。

Blob内存管理分析

在caffe的分层结构中，Blob充当了内存管理的角色，屏蔽了上层逻辑代码对于数据的申请释放的感知，同时也屏蔽了底层设备对上层逻辑的影响，本文主要分析Blob的管理机制和实际内存申请单元SyncedMemory 的机制。
首先我们看一下Blob和SyncedMemory的关系，类图如下：

blob_class.jpg

实际上整个Blob的实现就是在SyncedMemory上封装了一层，所以首先需要分析一下SyncedMemory的实现机制。

SyncedMemory的实现机制

SyncedMemory的目的是为了屏蔽上层代码对不同硬件设备的内存分配的感知，同时隐藏了CPU和GPU之间的同步过程。同时，SyncedMemory实现时，采用的是 “lazy”的模式，就是内存的实际申请时机是在第一次使用时进行的。有了大体的了解，下面我们来详细分析一下。
下面是SyncedMemory 提供的一组接口，

名称	功能
cpu_data()	获取CPU数据指针
gpu_data()	获取GPU数据指针

实现的代码如下：

const void* SyncedMemory::cpu_data() {
  to_cpu();
 return (const void*)cpu_ptr_;
}

const void* SyncedMemory::gpu_data() {
#ifdef USE_CUDA
  to_gpu();
  return (const void*)gpu_ptr_;
#else
  NO_GPU;
  return NULL;
#endif  // USE_CUDA
}

可以看出，每次调用接口时，都会有 to_cpu() 和 to_gpu() 的操作,那么这两个操作是什么作用呢，我们先看下SyncedMemory中的一些关键参数：

名称	功能
cpu_ptr_	cpu数据指针
gpu_ptr_	gpu数据指针
size_	当前SyncedMemory需要维护的数据个数
head_	当前 SyncedMemory处于的状态

前三个都比较好理解，最后一个比较特殊，它维护的是 SyncedMemory 当前的状态，分为 UNINITIALIZED，HEAD_AT_GPU，HEAD_AT_CPU ，SYNCED 四中状态。现在介绍一下具体的流程，当第一次调用 to_cpu（）时， head_处于UNINITIALIZED状态，那么系统会调用 CPU的申请内存的方式去获得内存区域，之后设置 head_ = HEAD_AT_CPU ,如果中间过程没有GPU设备则不会有状态变动，如果中间有代码调用了 to_gpu() ,则会发现 head_处于 HEAD_AT_CPU 状态，此时会调用同步函数，将数据从CPU同步到GPU，之后如果又回到CPU上，则同样会发现 head_ 处于HEAD_AT_GPU的状态，那么又会调用相应的同步代码，将数据同步回CPU，通过 head_这样一个状态参数屏蔽了GPU和CPU间的申请和切换的不同。

所以上层业务只需要知道当前自己需要的是CPU还是GPU的数据，然后调用不同的接口，就可以完成数据获取的操作。

Blob的实现分析

了解了SyncedMemory的实现，再来看Blob 就较为简单了，它仅仅做了一些上层的管理逻辑，向外界提供了几个关键的接口：

名称	功能
cpu_data()	获取CPU数据指针，不能改变数据内容
mutable_cpu_data()	获取CPU数据指针，可以改变数据内容
gpu_data()	获取GPU数据指针，不能改变数据内容
mutable_gpu_data()	获取GPU数据指针，可以改变数据内容
Reshape()	调整数据的维度信息

前四个就是对 SyncedMemory 的 cpu_data() 和 gpu_data()的封装,只需要确保每次获取数据前都调用相对的 to_cpu 或者 to_gpu就可以了。对于最后一个Reshape函数，主要是为了调整维度信息，同时可能是出于适配多种数据格式的目的，所以提供3个重载函数，如下：

void Blob::Reshape(const int num, const int channels,const int height, const int width);
void Blob::Reshape(const BlobShape& shape) ;
void Blob::Reshape(const vector<int>& shape);

前两个重载函数仅仅进行了数据格式的转换，然后调用第三个函数，所以 void Blob::Reshape(const vector<int>& shape);才是实际的执行者，这里需要介绍一下Blob里面较为关键的几个参数：

名称	功能
data_	数据的实际存储位置
shape_data_	数据的维度信息存储位置（NCHW）
capacity_	当前数据块的大小
count_	reshape后的数据块的大小

阅读代码不难发现，cout_中所存储的就是所有维度的的乘积，也就是当前要reshape到的数据大小，整个的reshape 过程如下：

reshape.jpg

结束

以上就是我对Blob的一些理解，希望对大家有帮助。

最后编辑于：2017.12.09 22:24:37

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

深度学习 Caffe 内存管理机制理解

Blob内存管理分析

SyncedMemory的实现机制

Blob的实现分析

结束

推荐阅读更多精彩内容