论文地址:http://t.cn/E9lzXyJ
区块链应用中,外部世界如何与智能合约交互往往是一个容易被忽视的问题,很多智能合约应用场景是根据一些外部事件,输出相应的结果,而传统的 IT 数据交互方式实际上并不能投入真正的工作。例如,按照农产品价格情况来支付投保人赔款的农产品价格险保单。传统 IT 人员一般认为是如下的流程:智能合约会在预定的时间,从期货交易场所获取农产品价格,然后按照获取的数据采取预设的行动。听起来很简单,但却不可能实现。为什么呢?因为这里存在两个问题:一是共识问题,二是受信任方问题。
共识问题
区块链是基于共识的系统,只有在每个交易和区块处理过后,并且每个节点达到相同状态,智能合约才能正常运行,所有事情必须是精确一致。如果节点之间对数据状态有歧义,整个系统就无法可信地稳定运行了。在上面的案例中,智能合约由链上的每个节点独立执行,因此如果智能合约从外部服务获取数据的话,这个数据获取过程是由各节点重复和独立完成的,假设这个区块链有 100 个节点,那么就会有 100 条获取数据的请求从每个节点发送到期货交易场所,但是因为这个数据来源于区块链外部,价格是实时波动的,由于网络延迟、节点处理速度等各种原因,每个节点获取的并不是同一时刻的价格,输入到智能合约的价格数据也就不同,因此对应的各节点智能合约输出也会不同,在这种情况下,整个区块链的信任基础就会崩溃,无法达成共识。解决的方法其实很简单,不通过智能合约发出外部数据获取指令,而是由第三方发送一笔区块链交易,在交易中附加需要的数据,交易会将数据嵌入区块,并同步到每个节点,从而保证数据的完全一致,因此可以用于智能合约的计算中。总结就是由第三方将数据推送进区块链,而不是由智能合约将数据拉取进去。同样的问题一样发生在智能合约调用外部世界事件的情况。还是上面的例子,很多人会想象价格到预定目标,智能合约去调用期货公司的 API 接口,实现卖出期货的功能,从而锁定保单风险,但是如果每个节点都独立执行智能合约,那么应该由哪个节点去调用这个 API 呢?如果选择某个节点去执行,怎么保证其可靠性呢?而选择全部节点去完成 API 调用的话,是否每个节点都可信,怎么保证 API 密码的安全呢?况且一个 API 同时被多节点高并发频繁调用也是不合适的。解决方法参考上面的问题,智能合约不需要获取外部API,而是第三方实时监控区块链状态,然后做出相应的反馈。例如,合作的期货交易所实时监控区块链,然后根据链上的交易情况做对应的资金转移,这样就不会对区块链共识产生威胁。
受信任方问题
前文提到的解决共识问题方法的核心就是区块链被动接收数据,与外部的交互依赖于第三方,这个时候就会引入第二个问题,第三方如何信任?第三方如果在数据传输过程中私自篡改数据怎么办?如何审计第三方是否从正确的地址获取数据?为解决可信问题,就需要引入 Oracle(不是甲骨文数据库公司),中文翻译为预言机。预言机是一种可信任的实体,它通过签名引入关于外部世界状态的信息,从而允许确定的智能合约对不确定的外部世界作出反应。预言机具有不可篡改、服务稳定、可审计等特点,并具有经济激励机制以保证运行的动力。目前,预言机有两种模型:单一模型和多重模型,有时候多重模型又称为“Oracle 网络”。单一模型只包含一个预言机,这一预言机是可信任的,它会正确地执行代码,合约的参与者能确信它不会与合约的某一参与方相勾结,单一模型类似于软件即服务提供者。对于大部分应用,单一模型已经就足够安全,并且经济实惠。目前一个单一模型的实例是 Oraclize。多重模型包含多个预言机,甚至是预言机网络。虽然单一可信任的预言机对大多数用户来说已经足够了,但是高价值的资产处理需要更高的可信任度,这就需要用到多重模型。在这一模型中,代码的执行分布在若干独立的预言机中,例如将 10 个预言机的数据设置一个可信临界,临界值数量的智能预言机必须就结果达成一致。假设用户使用 7/10 模型,只有当等于大于 7 个智能预言机一致时,合同才能够执行。这一模型留出了 3 个缓冲,也许有的智能预言机离线、出现问题或者被黑客攻击,只要不多于 3 个就不影响合同代码的执行。多重模型比单一模型更加复杂,成本更加高,但是它提供了更好的安全保障。
单一模型预言机运作方式
单一模型预言机的一个典型实例是 Oraclize。 Oraclize 是一个独立的服务提供商,目前提供免费的数据输送服务,通过在区块链和互联网之间建立一道可信的数据网关,打破智能合约获取数据的束缚,在保证可信的情况下,使其具有访问互联网数据的能力。 Oraclize 不是想让智能合约的开发者信任这个组织,因为不论任何信任,都可以从技术上篡改数据,无法真正从技术上保证安全,而是通过提供多种加密证明方法,构建可信的预言机。Oraclize 的运行状态如图 1 所示。
如图 1 所示,多种区块链可以通过 Oraclize 有效的访问互联网 API,保护其 Dapp 的安全性和健壮性,目前支持 Ehtereum、Bitcoin、Rootstock、Eris 四种区块链。用以太坊为例子,目前采用 Solidity 的智能合约只能存取访问链内的信息,而 Oraclize 作为一个数据传送者,可以在以太坊的 DApps 与 Web APIs 之间提供可靠连接,让基于智能合约的 Dapp 应用可信的地取得外部信息和数据。其运行原理如图 2 所示。
Oraclize 在以太坊上部署了一个名为 usingOraclize的智能合约,如果需要其数据访问服务,只需要在自己的智能合约中引用该智能合约,然后根据 API 文档中描述的方法进行相关的调用即可。如果某些组织利用以太坊技术搭建了自己的私有链或者联盟链,Oraclize 在 Github 上提供数据服务的开源智能合约代码,通过自己部署后,一样可以像公有链一样调用。Oraclize 提供了多种数据源服务器,包括 Url 访问、数据搜索引擎、区块链内容数据、IPFS 文件访问等,其中 Url 访问和区块链内容数据提供了基于 TLSNotary 的可信证明技术,也是常见的数据访问需求。对于基于 TLSNotary 的可信证明可以根据用户的需求开启和关闭,因为虽然目前该服务是免费的,但是随着以后 Oraclize 的正式版发布以及推广期的结束,可信证明技术是需要更多的收费,用户可以基于成本考虑选择是否使用。常见的典型服务如下。
(1)Url 访问服务
该服务可以用来访问互联网的 API 或者网页,首先用户向 Oraclize 提供想要访问的 URL 地址,并设定 GET / POST 的方法和相关的参数。Oraclize 根据用户的设定,自动获取 URL 的内容,然后发送数据到区块链上的 Oraclize 的服务智能合约上,通过该智能合约转发到用户的智能合约上。整个过程中,用户可以选择开启或关闭 TLSNotary 的可信证明。这样的应用场景很多,比如通过 Random.org 网站获取真正的随机数、获取航班运行情况用于航班延误险的自动计算和支付、链上身份认证系统、去中心化的博彩系统、去中心化的预测市场(如体育运动比赛结果或竞选活动)等。
(2)区块链内容数据
区块链内容服务可以让智能合约快速访问某一区块链的相关数据。实际上,一方面早期的区块链上的脚本并不能访问自身的内容,比如比特币的脚本本身不能访问比特币的区块链数据。另一方面,不同区块链上的脚本或智能合约有跨链访问数据的需求,以完成更复杂的功能。区块链内容数据一般来说都是从互联网上的区块链浏览器获取,区块链浏览器一般都会提供各种 API 用于获取区块哈希、区块内容,交易内容、用户余额等多种信息,从本质上来说,区块链内容数据也是 Url 访问服务的一种特殊类型。除此以外,Oraclize 还提供搜索引擎数据服务、 IPFS 分布式数据服务、加解密服务、链下计算服务等。
Oraclize 可信证明机制原理
Oraclize 之所以可以提供一个可证明的诚实从外部世界安全获取信息的能力,是依赖于 TLS 证明技术(TLSnotary),除此以外,Oraclize 还提供了其他两种证明机制:Android SafetyNet 证明、IPFS 大文件传送和存储证明。TLSnotary 证明主要基于安全传输层协议 TLS 1.1,TLS 用于在两个通信应用程序之间提供保密性和数据完整性 , 最大优势就在于独立于应用协议,更高层协议可以透明地分布在 TLS 协议上面。
TLS 包含三个基本阶段:(1)对等协商支援的密钥算法;(2)基于私钥加密交换公钥、基于 PKI 证书的身份认证;(3)基于公钥加密的保密数据传输。在整个传输中,TLS 的 master key 可以分成三个部分:服务器方、受审核方和审核方。在整个流程中,互联网数据源作为服务器方,Oraclize 作为受审核方,一个专门设计的,部署在亚马逊云上的开源实例作为审核方,每个人都可以通过这个审计方服务对 Oraclize 过去提供的数据进行审查和检验,以保证数据的完整性和安全性。
多重模型预言机运作方式
多重模型预言机有多种例子,一般来说,这种成本较高、较复杂的预言机会应用在对信息可靠性要求较高,涉及价值比较大的领域,比如金融、博彩等。一个可靠的多重模型预言机遵循博弈原理,有经济激励机制和惩罚措施,参与节点越多,其真实性越高。当数据输入时,网络需要保证参与者节点无法知晓其他参与者的数据,然后各个节点将数据输入智能合约,智能合约对于价格等连续数据将选择最接近中位数的数据,如果是二元数据则统计得票最多的结果,最后对提供正确数据的节点进行奖励。与单一模型不同,多重模型需要面对女巫攻击(Sybil attack)和共谋攻击(Collusion attack)。这两个攻击本质上都是通过控制多个节点来伪造数据干扰最终结果,主要防范的方法,一是鼓励尽量多的节点参加数据反馈;二是让每个节点的权重尽量平均,防止某些节点权重过高,易于控制结果;三是提高节点的接入成本,比如需要一定的押金;四是需要有一定的激励和惩罚措施,以促使节点考虑自身利益不会撒谎。下面以某去中心化电竞平台项目为例,说明多重模型预言机实例。某去中心化电竞平台是一个基于以太坊的去中心化应用 , 能够让电子竞技迷们可以通过一个去中心化的、自动化平台去参与他们喜欢的游戏,并能够利用手中的代币进行电子竞技。通过该平台,智能合约结合见证人系统和中心化的陪审团,使得某去中心化电竞平台可以不依赖可信的第三方来自动、可信的判定游戏胜负结果,从而根据游戏结果自动处理参与玩家的代币,如果有争议产生,需要更高级别的审查,那么内部陪审制度将被激活进行人工裁定。其用于比赛胜负自动判定的见证人系统设计如图 3 所示。
见证人在比赛验证系统中是一个非常重要的角色,要想成为见证人,必须要运行自动见证人节点软件并购买一定量的代币,他们充当比赛结束前的最终关口和奖励的处理。见证人节点网络充当一个去中心化的代理,他们能够链接游戏的 API,互相校验游戏结果确保平台不会有错误和欺诈。众多的见证人形成了一个见证人池,所有的见证人节点会察看每一场分配的比赛,检查游戏 API 并发送结果到区块链让所有人都能看到。每场游戏结束后,按照加权随机选择过程,对于每一场比赛大约。2个见证人节点将向智能合约报告比赛结果,智能合约根据结果自动处理游戏参与者的代币并向报送数据的见证人节点发送奖励。见证人节点的奖励随着网络中的比赛数的增加而不断增加,因此,见证人有动力报告正确数据,支持平台走向成功。见证人系统软件是一个完全自动化的软件,不需要人工干预。当一场比赛出现争议,见证人中的一些成员将会被随机选择作为陪审员,多个陪审员组成了一个陪审团,基于见证人提供的结果和玩家的其他证据比如截图进行人工投票。根据投票结果,见证人和与大多数投票一致的陪审员同样可以获得一部分奖励,与少数人投票一致的陪审员将会得到惩罚措施。
为了预防冒名攻击和共谋攻击,保证见证人系统的公平和公正,该平台对见证人节点提出了如下要求:
(1)玩家必须向平台提供身份证明比如姓、邮箱或者名字,确保每一个人只有唯一的账户参与见证人节点。
(2)成为见证人节点需要一定量的代币作为抵押。
(3)节点被选定履行陪审团职责的概率是与持有代币的数量成正比的,但限定概率上限为 1%。这样可以确保没有人能够主宰的陪审团的挑选过程。