通往比特币的漫长道路之密码学和数字货币
重大的技术创新从来不是政府规划、设计、主导的结果。技术更替、创新与演化依靠的是少数 “先行者” 的勇敢试错和市场自发的优胜劣汰机制。
<div align = right>------姚前(中国人民银行数字货币研究所所长)</div>
通往比特币的漫长道路是Jeremy Clarek(Concordia学院信息系统工程助理教授)在《区块链 技术驱动金融》一书中前言里所用的标题。一般情况下,事物的发展都需要经历起始、上升、鼎盛、衰微、消亡这五个阶段,区块链从2008年中本聪发布比特币白皮书开始到现在已经9年了,然而人类对数字货币探索的历史从上世纪八九十年代就开始了。从大卫.乔姆(David Chaum)盲签技术面世到如今区块链已经成为了众所周知的一门技术,ICO更是接近野蛮生长,其发展也是经历的漫长的伏笔与积累。我想要在本系列中探讨的是区块链技术的漫长发展史,先从密码学和加密数字货币开始。
提到数字货币,一般情况下绕不开的几个问题无非是交易本身安全吗?交易会被人篡改吗?如何证明数字货币是属于我的?个人信息会被泄露吗?假使交易出现问题我能追踪吗?等等等等,现在我们先就前面列举的问题一一解释,看区块链是如何解决这些问题的。
首先,谈谈区块链的结构,区块链的结构大致如下:
区块链是一个由哈希指针构建的链表。所谓哈希指针可以理解为一个数据向导,这个向导不仅可以告诉你上个区块在哪里,而且还以告诉你上个区块大概长什么样子。区块中记录了一段时间的交易,因此区块链则记录了所有的交易,好比一个全历史的交易账本,我们可以将新的数据附加到当前账本的末尾,但是如果有人要篡改之前的交易,我们可以检测到。要理解为什么区块链的数据结构可以防止篡改,我们先了解下哈希函数。
哈希函数
哈希函数是一个数学函数,它具有以下特性:
- 输入可以是任意大小的字符串
- 产生固定大小的输出
- 能进行有效的计算
用数学公式表示即Addr = H(key),其中key为任意字符串,Addr为等长的字符输出。在区块链中使用的哈希函数还有三个附加的特性,即1)碰撞阻力;2)隐秘性;3)谜题友好。在本文中我们先介绍碰撞阻力这一特性。
碰撞阻力
如果无法找到两个值,x和y,x不等于y,而H(x) = H(y),则称哈希函数H是有碰撞阻力的。
虽然无法找到,但并不表示碰撞不存在,只是说找到碰撞的代价太高,几率太小,例如一个256位大小的输出,选择2^256+1个不同的输入,至少存在一对x和y,其H(x)=H(y)。
哈希函数碰撞阻力这一特性可用于生成信息摘要,在区块链中的数据向导--哈希指针正是利用这点才能知道上一个区块“长什么样子”,将上一区块的哈希值作为哈希指针,通过验证上一区块哈希与该区块的哈希指针是否相等,即可判断该区块是否是上个区块之后的节点。
现在我们继续来说区块链的防篡改机制,我们可以先假设一下如果更改了之前的交易数据会发生什么。假设当前共有m个区块,有人想要篡改第n块数据,既然第n块数据发生改变,因为哈希函数具有碰撞阻力,那么我们可以断定原本第n+1块区块中记录的第n块的哈希值与篡改后的第n块的哈希值将不再匹配,我们通过检测区块的哈希值与下一区块的哈希指针变能检测到篡改。当然他可以继续改动第n+1块的哈希指针,那么第n+1块的哈希也将发生变化,如此,他需要一直改动直到第m块,我们只需要记住第m块的哈希指针并保证他人无法改动,那么变可以保证整个区块链的数据是安全未篡改的。
哈希指针在区块链中的应用除了这一点,还有另外一个地方也用到了,即构建梅克尔树(Merkel trees)。
梅克尔树
梅克尔树(Merkle trees)是区块链的基本组成部分。虽说从理论上来讲,没有梅克尔树的区块链当然也是可能的,你只需创建直接包含每一笔交易的巨大区块头(block header)就可以实现,但这样做无疑会带来可扩展性方面的挑战,从长远发展来看,可能最后将只有那些最强大的计算机,才可以运行这些无需受信的区块链。 正是因为有了梅克尔树,以太坊节点才可以建立运行在所有的计算机、笔记本、智能手机,甚至是那些由Slock.it生产的物联网设备之上。梅克尔树的结构如下:
在梅克尔树的数据结构中,所有的数据区块都被两两分组,指向这些数据区块的指针被存储在上一层的父节点中,而这些父节点再次被两两分组,指向父节点的指针被存储在上一层的父节点中,一直持续这个过程,直到最后达到树的根节点。
利用梅克尔树,区块可见简洁的实现隶属证明。假设现在某人需要证明某个数据区块隶属于梅克尔树,我们只需要记住根节点,然后他需要展示给我们数据区块的信息以及该数据区块通向梅克尔根的哪些数据区块,我们可以忽略梅克尔树的其余部分,而通过只该分支的数据到达这个目的。
区块链中,我们将交易数据构建成梅尔克数,然后在区块头中记录梅克尔树根的值。这样区块链节点只存储区块头信息,也可以实现正常交易,需要详细交易数据时再针对性下载即可。
现在,我们来更新下区块链的结构将它进一步的细化。
我们将区块分为两大部分,分为区块头和区块体,区块头中存储着前一个区块的哈希值(即哈希指针)、交易的梅克尔根以及其它的数据(后续会详细谈到),区块体中则存储着详细交易数据。