以太坊运行原理笔记:
(参考以太坊黄皮书)
合约创建
之前的文章说到过外部账户和合约账户,那么合约的创建,理解为以创建合约账户为交易。
那么首先是来初始化一个合约账户。
合约账户中有相关下列参数:发送者、原始交易人、可用的gas、gas单价、初始费用,任意长度的字节数组、EVM的初始化代码、合约常见当前的栈深度、状态更改许可。
新的合约账户地址是一个hash值的最右侧的160位,通过发送者的地址和账户的nonce(nonce使用时候减去1,认为在这个调用之前对发送者的nonce加1,在一个可靠交易执行或者虚拟机操作开始会对这个发送者的nonce加1)进行RLP编码后,再经过Keccak HASH计算来获得。
通过状态转换,账户初始nonce设置为1,balance交易传出的值,storage为空,codehash为空的Keccak 256位的hash值,减去发送者相应转账值,状态变化。通过evm代码来执行。
代码的执行过程中会有gas的消耗,必须要有足够的gas,那么gas不足,出现out-of-gas异常,gas变为0,合约创建是当做交易来处理,那么不影响合约创建的固定费用的支付,但是gas不足后附带的金额不会转移到取消的的合约地址,剩余的gas返还给最原始的交易发起人,状态也改变。
消息调用
消息调用中有相关下列参数:发送者、交易发起人、接收者、执行代码的账户、可用的gas、转账金额、gas单价、函数调用输入的数据、消息调用合约创建当前栈深度、状态更改许可。
消息调用中有一个额外的元素-由字节数组形式表示的输出数据,在执行交易过程中输出数据是被忽略了,那么在消息调研中vm代码执行产生,在这种情况下使用这些信息。
就像合约创建一样,如果消息通信执行退出是因为gas不足或交易无效(例如栈溢出,无效跳转目的地或无效指令),那么已使用的gas是不会被退回给原始触发者的。相反,所有剩余的未使用gas也会被消耗掉,并且状态会被立刻重置为余额转移之前的那个点。没有任何方法停止或恢复交易的执行而不让系统消耗你提供的所有gas,直到最新的以太坊更新。例如,假设你编写了一个合约,当调用者没有授权来执行这些交易的时候抛出一个错误。在以太坊的前一个版本中,剩余的gas也会被消耗掉,并且没有任何gas退回给发送者。但是拜占庭更新包括了一个新的“恢复”代码,允许合约停止执行并且恢复状态改变而不消耗剩余的gas,此代码还拥有返回交易失败原因的能力。如果一个交易是由于恢复而退出,那么未使用的gas就会被返回给发送者。
在消息调用的通用执行框架中,会有8个所谓的预编译合约、地址1-8分别是椭圆曲线公钥恢复函数、SHA2 256 位哈希方案、RIPEMD 160 位哈希方案、标识函数、任
意精度的模幂运算、椭圆曲线加法、椭圆曲线纯量乘法和椭
圆曲线配对检查。
执行模型
执行模型使用一系列的字节代码指令和一个环境数据的元组去改变系统状态,使用以太坊虚拟机EVM运行,通过gas来限制。
EVM是图灵完备虚拟机器。EVM存在而典型图灵完备机器不存在的唯一限制就是EVM本质上是被gas束缚。因此,可以完成的计算总量本质上是被提供的gas总量限制的。EVM具有基于堆栈的架构。堆栈机器 就是使用后进先出来保存临时值的计算机。
EVM的存储方式有三种:
栈(Stack)
账户存储(Storage)
内存(Memory)
有一定计算机基础的应该理解。栈是常见的线性数据结构,先进后出的模式。EVM基于栈的虚拟机,那么所有的运算都在栈上,一个栈之前提到是256bit。账户存储和内存将EVM的账户存储和内存类比成我们通常看到的计算机的硬盘和内存。
EVM中每个堆栈项的大小为256bit,堆栈有一个最大的大小,为1024bit。
EVM有内存,项目按照可寻址字节数组来存储。内存是易失性的,也就是数据是不持久的。
EVM也有一个存储器。不像内存,存储器是非易失性的,并作为系统状态的一部分进行维护。EVM分开保存程序代码,在虚拟ROM 中只能通过特殊指令来访问。这样的话,EVM就与典型的冯·诺依曼架构 不同,此架构将程序的代码存储在内存或存储器中。
EVM同样有属于它自己的语言:“EVM字节码”,当一个程序员比如你或我写一个在以太坊上运行的智能合约时,我们通常都是用高级语言例如Solidity来编写代码。然后我们可以将它编译成EVM可以理解的EVM字节码。(摘自以太坊工作原理)
那么问题来了,代码在EVM中执行,以太坊网络中每个节点都有一个EVM,的确是每个节点的EVM都会去工作,必须通过在EVM中执行代码来验证区块的结果状态。这样通常理解就是大量的计算资源的浪费,那么从安全性的方面来考虑,在一个去中介化的区块链系统中,这个是保证整体的安全性的必要操作。当然每个节点在执行过程中会出现不同的情况,但是在区块链系统中必须要达到完全的一致,这就使得EVM和智能合约存在一定的局限性。出现不确定的结果无法达成共识。这种场景下必须再次同步区块达成一致性。
EVM有专门的指令集,包括了一般常见的算术运算、位运算、逻辑运算、条件判断等,针对区块链架构还要专门的合约访问区块号,区块时间戳等指令。所有的指令以256bit位单位来传递。智能合约的编译就是讲高级语言写的代码编译为指令集字节码。