简介
比特币交易被创建后,会被一个或多个签名加密,这些签名标志着交易指向的比特币的使用许可。随后,这笔交易会被广播到比特币网络中,节点在收到这笔交易,并记录、验证这笔交易,然后再把交易广播出去,直到比特币网络中大部分节点接收。最后会有一个挖矿节点验证交易,并把交易写入比特币区块链中的一个记录着许多交易的区块中。
一笔比特币交易创建后,需要有效的签名来授权这些比特币的使用权。由于交易信息有签名保证使用权,所以交易可以在任何网络上传播,甚至非安全的网络。交易一旦被节点接收,节点会验证交易的正确性,如果正确,节点会返回一条交易有效并被接收的返回消息给交易发起者。如果交易不正确,节点会返回交易被拒绝的信息给交易发起者。
比特币网络是一个点对点网络,任何节点都会连接到其它一些节点,节点会将验证通过的交易发给自己连接到的其它节点,其它节点也会进行同样的操作,以此类推,几秒钟便会以指数级的扩散速度传播至全网。但为了避免垃圾消息泛滥,每个节点在传播交易前都会验证交易,异常交易所能到达的节点不会超过一个。
交易结构
一笔比特币交易的结构如下图所示
交易的输入输出
比特币交易的基本单位是未经使用的一个交易输出,叫做UTXO,UTXO是记录比特币交易信息的最基本方式,没有比它还基础的了,所以它是不可再分割的了。比特币系统里并没有专门存储某个用户余额的地方,也没有存储比特币地址,而是通过扫描一个个UTXO后,得到的最终结果。比特币钱包通过扫描所有与你相关的UTXO后,便可知道你有多少比特币可用。之前说过,比特币就是个复式记账系统,扫描区块里的UTXO就相当于翻遍整个账本,找到你的交易记录,自然就知道你到底有多少钱。
当一个用户接收比特币时,实际上是比特币系统添加了一条这个用户的未经使用的交易输出,这个交易输出中包含了比特币金额。当这个用户需要使用这些比特币时,实际上是把这条未经使用的交易输出拿来使用了。
举个不太恰当的栗子,一个UTXO就相当于一张钞票,这张钞票的面额就是UTXO里记录的金额,比如我的某个UTXO里记录了10个btc,我现在需要花1个btc买个披萨,我用我的这个UTXO(面值10)来支付这笔金额。刚才说过,UTXO不能再分割了,相当于用10元钱买个一元钱的商品,你不可能把钱撕成10份,给老板一份,剩下9份我揣着,而是把10元钱变成一张5元和5张1元,拿一元给老板,剩下的一张5元和四张1元我揣着。
比特币系统中对UTXO的使用方式与刚才的例子差不多,将一个UTXO作为交易的输入,输出两个UTXO即可完成交易,输出的一个UTXO包含1btc,是给老板的,另一个UTXO包含9btc,是我自己揣着的,也就是找零钱的过程。
相反的,如果我有N多个小额的UTXO,可以将多个小额的UTXO一起作为交易的输入,完成一笔金额较大的交易。比如我有五张1元,要买一辆价值5元的兰博基尼,每张1元都不足以支付价值5元的兰博基尼,但我可以把五张1元一起给老板,我就可以高高兴兴开着兰博基尼回家了。这就是比特币的交易方式。
另外有一种特殊的交易方式,叫coinbase交易,是每个区块的首个交易,这个交易是给挖出区块的矿工奖励的交易,后面再详述。
交易的输出
每一笔比特币交易都会创造一个或多个输出,这些输出被比特币账簿记录下来(除了后面会介绍的OP_RETURN操作外),几乎所有的交易输出都会创造一定数量的可用于支付的比特币,也就是我们之前提到的UTXO,这些UTXO被整个网络识别,所有者可在未来的交易中使用它们,给某个地址发送比特币实际上是创造新的UTXO,并关联到目的地址(目测应该是公钥加密,私钥解密类似的原理吧),从而新的与之相关的UTXO能被目的地址账户的所有者使用。
一个交易输出包含两个部分:
- 一定量的比特币,以最小单位“聪”表示
- 一个锁定脚本,用于锁住这笔比特币,只有满足解锁条件的账户才有资格使用这笔比特币
交易的输入
交易的输入实际上是多个指向不同UTXO(达到或大于支付金额)的指针的集合,同时,交易的输入也包含解锁脚本,以使用被锁住的UTXO。解锁脚本通常是一个签名,用来证明对于在锁定脚本中的比特币地址的所有权。
选择哪些UTXO通常由钱包程序调用比特币核心来完成,或者通过第三方的程序接口检索来完成。
交易费
交易费是大多数交易都包含的,主要是给矿工的奖励。交易费是基于当前交易的数据大小来决定的,数据越多,交易费当然越高。对于矿工来说,高的交易费意味着优先处理,低的交易费可能延迟处理或者根本不处理。
交易的数据结构中并没有交易费这个字段,交易费的计算方式是所有的输入-所有的输出,这就意味着如果你的交易不包含找零的话,所有交易输入 - 所有交易输出的差值就全是矿工的交易费了。
比特币的交易脚本
比特币交易验证引擎依赖两类交易脚本来验证比特币交易,一个锁定脚本(包含公钥),一个解锁脚本(包含通过私钥生成的数字签名),执行过程如下:
如果我花费一个指向我的比特币地址的UTXO,那么生成这个UTXO的人会在这个UTXO中加入一个只有我能解开的“障碍”(可以理解为用我的公钥签名的数据,只有我的私钥可以解开),如果我要使用这笔UTXO,我要使用解锁脚本(包含我的私钥)来解锁这个“障碍”,然后将解锁后的数据作为锁定脚本的输入执行一遍,结果为真,说明我有权力使用这笔UTXO,否则我就没有权利使用这笔UTXO。我觉得比特币消费的认证,粗略地说,就是公钥加密数据,私钥解密数据;私钥加密数据,生成数字签名,公钥验签的过程。
比特币脚本语言
比特币脚本语言是采用逆波兰表示法,基于堆栈执行的脚本语言。
比特币脚本语言是基于栈的,栈的操作只有两个,入栈和出栈。参数被推到栈内,碰到操作符,则取出栈内的操作数,执行操作后将结果入栈。
比特币脚本是非图灵完备的,不能执行无限循环或其它的逻辑炸弹,从而保证比特币的安全。
标准交易
标准交易一,P2PKH(Pay-to-Publiic-Key-Hash)
比特币网络上的大多数交易都是P2PKH交易,此类交易都含有一个锁定脚本,该脚本由公钥的哈希(即比特币地址)实现前面提到的"障碍",锁定脚本的输出可由公钥和对应私钥生成的数字签名来解除“障碍”。
标准交易二,P2PK(Pay-to-Public-Key)
在P2PK交易中,公钥直接存储在锁定脚本中,代码长度更短。目前,P2PK在Coinbase交易中最常见。
多重签名
多重签名脚本设置了这样的条件,脚本中记录了N个公钥,必须提供M个公钥(N > M)才能生成激活交易的签名,通过验证后才可以使用这笔资金。
数据输出(OP_RETURN操作符)
OP_RETURN操作允许开发者在交易输出上增加40字节的非交易信息,这些信息存储在区块链上,而不是UTXO中,从而防止UTXO容量增大,同时允许开发者在区块链上记录非交易信息。例如我存一个文本的Hash,将来验证这个文本是否被修改过,算一下这个Hash,再在区块链上找到存储的文本Hash,对比下就能知道文本是否被修改,从而扩大比特币系统的功能。因为OP_RETURN不将数据存在UTXO中,实际上没有真正的交易发生,也就没有成本。OP_RETURN通常是一个金额为0的比特币输出,如果你将一个OP_RETURN的输出作为另一笔交易的输入,则该交易是无效的,所以任何与该类输出对应的比特币都会永久丢失。
P2SH(Pay-to-Script-Hash)
如果我希望我的比特币接收地址支持多重签名,那么,支付者的钱包也必须支持多重支付签名,拥有对应的验证脚本,这就提高了使用难度。为了解决这个问题,P2SH应运而生。
P2SH顾名思义,就是将支付与脚本代码本身作为输入生成的Hash相关联。在使用P2SH交易方式生成的UTXO中,需要使用原始脚本和必要的解锁签名来使用UTXO。一个P2SH的地址以“3”开头,比如0x39RF6JqABiHdYHkfChV6USGMe6Nsr66Gzw。P2SH地址隐藏了所有的复杂性,使得对P2SH地址转账和普通转账没有任何区别,所有使用成本都转嫁到了使用方,谁使用这笔资金,就需要提供所有的验证资料。注意,P2SH不能自循环,所以不能嵌套使用P2SH,也不要使用OP_RETURN。