待字闺中开发了一门区块链方面的课程:《深入浅出ETH原理与智能合约开发》,马良老师讲授。此简书文集记录我的学习笔记。
课程共8节课。其中,前四课讲ETH原理,后四课讲智能合约。
第四课分为三部分:
- Ethash算法
- EVM框架
- Bloom Filter / Recipt
这篇文章是第四课第二部分的学习笔记:EVM框架。
这节课介绍的是以太坊虚拟机的设计框架。智能合约是以太坊的灵魂,而虚拟机是执行合约的环境。
1、EVM的设计理念
以太坊虚拟机有一定的复杂性,其复杂性在于:需要考虑以太坊特殊的数据结构、区块链的特点、Gas的计价策略,特定的密码学操作,等等。
其设计理念如下:
- Stack/memory 模型。它是一个基于栈的虚拟机。
- 32 Bytes的Word。栈中的每一个元素非常大,占32个字节。因为过程中用到的很多数据都是32字节。
- 调用深度上限为1024。
- 栈的大小无限制
- 临时/永久存储的区别。
- 完全可确定。每一步都是确定的,可以回滚。
2、EVM的实现框架
虚拟机基本的执行流程:
- 取指令
指令在哪儿?在以太坊虚拟机中,有一个叫做执行环境的数据结构,它就包括了合约的指令。而这些指令(图右的 code )的 Hash 在全局状态前缀树中。在创建虚拟机实例后,这些代码就拷贝到了执行环境。这些指令是字节码,如图左上角。
- 取操作数
根据合约编写的内容取操作数入栈。这些操作数可以是很多不同的内容(图左下角部分),如输入数据的值(Input Data Value),代码的拥有者(Code Owner),区块的头部(Block Header),等。另外,执行环境除了提供需要的数据,还记录了一些数据的状态,如调用的深度(Message-Call Depth),日志(Log Series),返还Gas(Refund Balance),等。
- 检查GAS策略
有的是根据操作的次数,有的是根据输入数据的长度。
在虚拟机中,有一块数据结构是虚拟机状态,这里记录了你还有多少GAS,临时存储的内容,记录了多少Word(一个word是32字节), 最后是栈的内容。检查内容有,钱是不是够,内存是不是需要扩张,如果都满足要求就会执行合约,出错了就会回滚。
- 执行指令
执行后,一般会更新storage 的变量(如图箭头)
- 增加PC
移动指针,执行下一条。
3、EVM的常见指令
- 算术指令: ADD SUB MUL DIV MOD
- 比较指令: LT GT EQ AND OR
- SHA3: SHA3
实际是Keccek,虽然名字写的是SHA3。
- 执行环境信息: ADDRESS ORIGIN CALLER
合约地址,发起者,调用者
- 区块信息: COINBASE DIFFICULTY NUMBER
挖矿受益人,区块难度,区块号
- 栈/存储: POP PUSH DUP SWAP MLOAD/MSAVE SLOAD/SSTORE JUMP
- 系统操作: CREATE CALL CALLCODE RETURN SELFDESTRUCT INVALID
以上这些指令一般不会直接用到,平时用到的是脚本语言,再编译出来。但以下指令需要特别理解一下。
- CALLCODE/DELEGATECALL:用来使得合约以函数的形式调用其它合约的代码。且栈和存储空间利用当前合约的资源,仅仅使用被调用合约的代码。这样便于合约代码设计标准库。
CALLCODE 的msg.sender 未能和库调用逻辑一致。 A-> B(callcode) ->C(lib)
DELEGATECALL的msg.sender 则和库调用逻辑一致。 A-> B(delegatecall) ->C(lib)
所以,尽量使用 DELEGATECALL 指令。
SELFDESTRUCT:允许一个合约在必要的情境下删除自己。实际上并不是立即执行,而是在交易的最后被执行。这样的话可以大大降低回滚已删除合约这项功能在虚拟机中实现的复杂度。
SHA256,ECRECOVER和RIPEMD160不是作为操作码而是包含在伪合约中。
4、GAS 计价策略
指令计价类型分为三种:单一计价类、按照数据长度计价、返还类型。
比较昂贵的有图右边所示的几种;其总体的逻辑是,增加存储负担就贵,减轻了就便宜。
所以,我们要尽量避免昂贵的操作。
5、临时/永久存储的生命周期
以一个合约执行过程说明一下。
- A调用B
- B执行过程中,设置永久存储的S值为5,临时M值为9;
- B调用C
- C调用B,这时的B是一个新的实例,不是第2步中的B;
- 这时下面这个B中的S=5(永久),M=0(临时的,不用上面的值);
- 在执行B的过程中,S变成了17,M变成了13;
- 返回到C,返回到B,这时的S值为17,M还是之前的9。
结论,永久存储的可以跨越交易,跨越区块;而临时存储的只限于一个实例。
本节主要介绍了以太坊虚拟机的设计框架,不足之处,请批评指正。