WebAssembly 二进制编码介绍(九)

WebAssembly 是基于栈式虚拟机的虚拟二进制指令集(V-ISA),它被设计为高级编程语言的可移植编译目标。长安链使用的是wasm的二进制模块,我们这里着重分析WebAssembly的二进制模块。WebAssembly的各组件含义及关联关系需要一段时间的学习来掌握,需要大家自己不断的研究与琢磨。

WebAssembly的官方介绍: https://www.wasm.com.cn/docs/binary-encoding/

wasm的二进制模块包含11大组件:


二进制模块组件.png

官方文档中提供解析wasm二进制的方式:

  1. magic & version
    magic - uint32 - 0x6d736100
    version - uint32 - 0x1
  2. 根据不同的sec type 分别解析


    section信息.png
  3. 各section有详细字段说明


    section字段描述.png
  4. 在官方文档描述中,字段类型uint32、int32比较好理解4字节。但varuintN、varintN并未见过,这是LEB128编码格式,具体解码方式可参考下述代码
func DecodeUint32(r io.Reader) (ret uint32, num uint64, err error) {
    const (
        uint32Mask  uint32 = 1 << 7
        uint32Mask2        = ^uint32Mask
    )

    for shift := 0; shift < 35; shift += 7 {
        b, err := readByteAsUint32(r)
        if err != nil {
            return 0, 0, fmt.Errorf("readByte failed: %w", err)
        }
        num++
        ret |= (b & uint32Mask2) << shift
        if b&uint32Mask == 0 {
            break
        }
    }
    return
}
  1. 我们以长安链官方合约(镜像chainmaker-go-contract:1.1.1中的合约为例)进行解析。
5.1)执行hexdump main.wasm > main.dump命令以二进制形式查看。使用sublime等编辑工具打开。
hex.png
5.2)magic & version

a) 开始00 61 73 6d四个字节表示magic,二进制使用的是小端方式编码(大小端的含义还需要自行百度学习),实际为:0x6d736100
b) 随后01 00 00 00四个字节表示version,0x01

5.3)Type Section

该组件定义了函数的签名声明信息,定义函数的入参、返回值个数及类型。解析如下:

a) 随后一个字节01表示下面的section为Type Section
b) 随后varuint32类型73一个字节,表示该section的长度,通常在处理的时候会忽略该字段,除非session的id 为0。
c)随后12表示后面有18个type要描述(12是16进制)。
d) 随后60作为每个type的分割符,随后01表示一个形参,随后7f 表示该形参的类型为i32。
e)随后00表示函数返回值为0个。
f)重复d,e流程,直到遍历18个type

5.4)Function Section

该组件包含指向Type Section的Index,Function Section是数组结构,数组下标与Code Section组件一一对应,Index表示执行Type Section的函数签名。

5.5)Code Section

该组件包含函数具体的实现逻辑以及本地变量信息,Code Section是一个数组,大小与Function Section相对应。

5.6)Export Section

该组件描述的是外部可访问的内存、变量、方法等。以方法组件为例,每个Export Section元素会关联一个Index,该Index指向Code Section。当外部调用某method,可以先在export区找到匹配的method,在通过export的index,找到要执行的字节码,然后装载执行。

5.7)Data Section

该组件描述对线性的memory进行数据初始化,组件记录数据信息以及要初始化的位置信息。

5.8)Memory Section

该组件描述程序内存块数量以及最大、最小值等。

wasm二进制执行流程可以参照:https://github.com/mathetake/gasm.git,学习字节码的解析流程。长安链基于该开源代码进行bug修复,描述在 chainmaker-go/module/vm/gasm/README.md

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容