我们在上一节中,介绍了区块链的基础概念和实现方式。在这一节里,我们将关注两个问题:工作量证明,和分叉。
Proof Of Work 工作量证明
区块链的维护工作,是由P2P网络上的匿名节点来完成的。因此,比特币要求每一个区块在被创建之前,都需要完成一定量的工作,并以此为基础,使得网络中不可信节点意图修改已经被计入区块链的区块时会付出巨大的工作量成本。相比于作为可信节点单纯的向区块链添加新的区块,不可信节点的行为成本过高,不符合经济人假设。
将区块,用“链”的方式串接起来,直接导致了修改区块链中任意一个区块,都必须将其后的区块全部修改。(因为每一个区块都在区块头中保存了前一个区块的哈希值)因此,随着区块链长度的增长,修改区块的成本会越发升高。换句话说,区块链放大了工作量证明的难度。
比特币中所使用的“工作量证明方法”利用了密码学哈希自带的随机性。一个设计良好的密码学哈希函数,可以将任意数据转换为一个“随机数字”。如果我们修改数据,然后再执行这个哈希函数,那么我们会获得一个完全不同的“随机数字”,哪怕我们只修改了一个比特的数据。这就确保了,我们无法通过修改数据的内容使得哈希值的结果变得可预测。
为了证明你在创建一个区块时,做了充足的工作,你必须创建一个低于目标阈值的区块头的哈希值。举个例子,如果最大的哈希值是2^256 -1,你可以证明你尝试了两个组合以获得一个低于2^255的哈希值。
在上面的例子中,平均下来,你的每次尝试都能生成新的区块。我们可以估计生成一个低于目标阈值的哈希值的概率大小。比特币假定这个概率是随着目标阈值的增减而线型变化的,也就是说,目标阈值越低,我们生成一个区块的概率越低。
只有符合难度要求(diffculty value)的哈希值才会符合一致性规则,也只有这种区块才会被成功添加到区块链中。区块链中,每增加2016个区块,会重新计算一次区块生成时间。区块生成时间,使用区块头中保存的时间戳来计算。生成2016个区块的理想时间是1209600秒(两周)。
如果生成2016个区块的时间小于两周,难度要求会相应的增长(增长300%),因此在相同的算力下,下2016个区块的生成时间,应该严格符合两周。
如果生成2016个区块的时间大于两周,难度要求会相应降低(降低75%),理由同上
(备注:因为一个计数错误,区块链每增加2016个区块重新计算一次难度要求,在计算生成时间时,只使用了2015个区块)
因为区块链中,每一个区块都保存了前一个区块的哈希值,并且,生成区块的哈希值必须符合难度要求。这意味着,如果有人想要修改已经生成的一段区块链,他必须要具备与生成这段区块时所使用的同等算力。因此,只有具备了超过整个比特币网络51%算力的时候,我们才能修改已经生成的区块链。这个情况,称为51%攻击。(当然,必须说的是,即使算力低于50%,也有可能发动51%攻击)
区块头中提供了诸如dedicated nonce field这种易于修改的字段,因此,生成新的哈希值,并不需要等待新的交易到来。(区块的工作证明哈希,主要以Merkle Root Hash 和 区块头,Merkle Root的变更必须有新的交易产生。如果没有这种字段,如果极端情况下,所有的哈希值经过计算均不符合难度要求,那么就只能等待新的交易生成,来变更Merkle Root。当然,在没有这个字段的情况下,还可以通过变更时间戳的方法实现输入的变化。但是这些方式都显然没有增加这个字段更具备灵活性。)同时,只有80字节的区块头会参与到工作量证明算法中,这意味着,即使一个区块包含大量交易,这也不会导致哈希速度因IO而变慢。
Block Height And Forking 区块高度和分叉
任何一个比特币矿工发现一个区块头的哈希值低于目标阈值时,都可以将这个区块添加到区块链中。(假设区块的其他方面都是合法的)这些区块通常以区块高度来进行标记,区块高度是该区块与第一个比特币区块(0区块,也被称为创世区块)之间的差值。举个例子,2016号区块,就是第一次发生难度要求调整的区块。
多个区块可能会拥有同一个区块高度,这种情况通常发生在多个矿工在近乎同一时间向区块链添加了区块。这种情况导致了区块链分叉,如上图所示。
当矿工同步的向区块链的末尾添加区块时(看block1的情况),其他节点各自独立的选择接受的区块。在不考虑其他情况的条件下,节点通常选择它收到的第一个区块(因为网络的原因,收到的第一个区块,不一定是先创建的区块)。
最终,矿工会在分叉中选择一条分叉,继续追加区块。这会导致分叉后的这条链持续增长,其工作量证明高于另外一条链。假定分叉中只包含合法的区块,普通节点总是选择工作量证明最大的一条龙,并且抛弃短链所包含的“陈腐区块”(Stale Block 陈腐区块,陈腐区块有时也会被称为孤立区块 orphan block。但通常孤立区块指的的是,无法找到父区块的区块)
如果矿工持有不同的目标,长时间的分叉也是有可能的。举个例子,当一部分矿工在持续挖矿,增长区块链长度,而另外一部分矿工在尝试51%攻击,这种情况下,就会出现长期的分叉。
因为在分叉时,多个区块可能拥有相同的区块高度。区块高度不应该被用作全局唯一标识符。区块的全局唯一标识符,通常使用区块头的哈希值(一般是字节序反序,以16进制表示)。
思考
在这一节里面,工作量证明是一个简单明了的设计。但是区块高度这个设计的意义是什么,这个问题是值得思考的,按照上一节所说,区块高度是V2版本才加入的。那么在V2版本中,基于什么考量才加入的呢?想要回答这个问题,我们可以得看一下 BIP-30 和 BIP-34
这一节里面,我还提到了一个概念,叫分叉。我们也定性的说了分叉后,如何终止一条工作量证明较低的链。那么在实现层面上,比特币是怎么处理的呢?这个问题,可能就需要我们去仔细阅读比特币的实现,以及相关的BIP文档了。
额外说一下,我们常常听到另外一个词,硬分叉。我们上面说的分叉实际上都算是软分叉。硬分叉的原理实际上和软分叉是差不多的。通过修改比特币的相关实现或者验证方法,我们会导致分叉的产生,想要成功分叉,必须保证选择分叉的节点总算力高于其余情况的节点。本质上,分叉的发生条件可能存在多种,但是分叉成功的条件只有算力的争夺。
到此,我们就在概念层面上了解了区块链。在下一节中,我会介绍交易相关的内容。
有什么问题,欢迎讨论。