MXNet中的图是怎么构建的?

1. 介绍

这是一篇粗浅并且可能存在错误的个人理解

我们在使用MXNet的时候,都是通过调用python端提供的接口。通过一步步地构建symbol,在调用module进行训练的时候,其实MXNet帮助我们建立了graph。那么,这个图到底是如何建立的呢?反向传播又是如何进行的呢?以及我们在c++, cu端建立的op是怎么通过 python来进行调用的呢?

2. 从op到python

那么我们在c++端定义的operator到底是怎么引入到python的模块空间下面的呢?比如,我在{mxnet_root}/src/operator/下面定义了一个operator,然后重新编译mxnet,就可以通过mxnet.sym以及mxnet.module来进行调用啦。这是怎么做到的呢?这里我们以symbol为例分析。

首先我们在import mxnet的时候会运行{mxnet_root}/python/mxnet下面的__init__.py,该文件中运行from . import symbol ,该行代码运行了symbol文件夹下的__init__.py

之后依次运行:

  • __init__.py: from . import _internal, contrib, linalg, op, random, sparse, image
  • _internal.py:
if int(_os.environ.get("MXNET_ENABLE_CYTHON", True)) == 0:
    from .._ctypes.symbol import SymbolBase, _set_symbol_class
    from .._ctypes.symbol import _symbol_creator
  • __init__.py: from . import register
  • register.py: _init_op_module('mxnet', 'symbol', _make_symbol_function)

这里,register.py文件下进行 op 到symbol模块空间下的注册,也就是通过_init_op_module来完成。具体大家可以通过该函数进行跟踪。
其中比较重要的函数是同文件下的_generate_symbol_function_code函数。该函数直接生成op对应的方法的code,再通过pythonexec函数进行实际的定义,接着注册到对应的模块下面。

3. symbol

我们已经知道了op如何到symbol下面来让我们调用,那么我们调用symbol下的方法时,是怎么联系起来的呢?

直观上,我们通常通过mx.sym.var(tensorflow下tf.placeholder, pytorch下Tensor)来创建输入变量,输入变量作为某个op的输入,一步步构建新的symbol。最终的symbol往往是通过loss函数,输出一个标量。

每当我们调用某个op时,例如mx.sym.FullyConnected,会将输入参数通过一系列操作之后,传给_symbol_creator。我们查看该函数源码,会发现它首先调用了MXSymbolCreateAtomicSymbol来根据参数创建一个symbolhandle,之后调用symbolcompose进行具体op的调用。

MXSymbolCreateAtomicSymbol函数定义在src/c_api/c_api_symbolic.cc里面。输入的第一个参数creator其实是通过NNGetOpHandle返回的一个OpHandle,它是通过op_name得到的。得到op后通过CreateFunctor返回symbol,这里会建立symboloutputs

创建好symbol后,就通过s._compose(name=name, **kwargs)进行调用啦。其中kwargs应该(还未仔细确认)是指类型为Symbol的输入参数,例如我们指定的weight,data等。

那么重点就到了compose方法。

4. compose

symbol_compose接着调用了NNSymbolCompose,该函数输入参数为:symbol指针,name,参数个数,参数key,参数值的指针。
NNSymbolCompose主要调用了Symbol::Compose。该方法签名为:

void Symbol::Compose(const array_view<const Symbol*>& args,
                     const std::unordered_map<std::string, const Symbol*>& kwargs,
                     const std::string& name)

compose方法会首先进行一系列的输入的操作,检查。之后根据该symbol的输出是不是atomic(根据op的输入判断),相应地进行compose。这里仅分析一下普通情况,也就是不是atomic。

首先我们要了解一下DFSVisit这个方法

4.1 DFSVisit

查看该函数的源代码,我们看到,首先将传入的heads(这里传入的一般是该symbol的outputs),从类型NodeEntry转换为GNode

之后调用PostOrderDFSVisit,也就是post order深度优先遍历。后序遍历,我们知道,就是先子树,最后访问节点,也就是调用访问函数visit

PostOrderDFSVisit的访问参数如下:

  • head_nodes:根节点
  • `[fvisit](GNode n) {fvisit(*n);}:访问函数,直接调用visit函数
  • n->get();:hash函数,用于表示节点
  • (*n)->inputs.size() + (*n)->control_deps.size():入度的计算
  • 根据index返回输入的函数

继续看PostOrderDFSVisit源码,我们发现其实它是一个拓扑排序,用于DAG的遍历。它从每个根节点开始,不断将节点的输入加入visited, stack,当某个节点的所有输入都完成了访问(入度等于访问次数),就从stack删除,直到stack为空。

了解了DFSVisit的作用后(遍历DAG),我们再来看compose函数。

对于非atomic的情况,首先定义了一个访问函数find_replace_map,它建立了一个replace_map,这个map的key是类型为variable的节点,对应的value是对应输入参数的outpus[0]

接着又根据这个find_replace_map建立了一个新的访问函数find_replace_plan,它遍历每个节点的所有输入,如果输入节点存在在之前创建的replace_map中,就将map对应的那一项加入到replace_plan中,并且将该节点加入到update_node中。

之后遍历replace_plan完成替换,遍历update_node,完成更新。

这里,我理解是对node直接的denpendecy做一些必要的处理。

5. 图

那么图是哪里构建的呢?

我们使用symbol构建网络的时候,需要调用bind来进行必要的初始化。该方法返回一个executorexecutor的创建会调用GraphExecutor::Init。在这个函数里,进行了symbol到图的转换。

反向图的建立是通过Gradientpass完成的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335

推荐阅读更多精彩内容

  • 包(lib)、模块(module) 在Python中,存在包和模块两个常见概念。 模块:编写Python代码的py...
    清清子衿木子水心阅读 3,791评论 0 27
  • MXnet的学习笔记,这次主要是MXnet提供的example的综述介绍。关于MXnet在OSX下的编译安装,可以...
    ToeKnee阅读 8,210评论 1 13
  • 该文章为转载文章,作者简介:汪剑,现在在出门问问负责推荐与个性化。曾在微软雅虎工作,从事过搜索和推荐相关工作。 T...
    名字真的不重要阅读 5,153评论 0 3
  • 一只小鸟站在树枝上,不能把树枝当做永久的安乐窝,而要拥有即使树枝折断也可以随时飞走的能力 无论是居庙堂之高,还...
    甜点07阅读 115评论 0 0
  • 发奖啦!发奖啦!发奖啦!在“阅读月”活动中,爸爸陪伴宝贝每天坚持并阅读,用行动表达了对孩子的爱,同时还培养了孩子爱...
    花花_96e5阅读 250评论 0 0