在很久很久以前,有三个将军在攻打一个叫拜占庭的城市。拜占庭的守军很强,任何一个将军单独都攻打不下来,但如果他们的两个联手就可以取胜。这导致将军们需要协同进攻的时间和地点。
他们分隔足够远,需要通信,而他们的通信方法,是依靠马背上的传令兵。但在战场环境里面,这些传令兵分分钟被城上的火炮打死。将军们很悲惨的,不知道他们的消息,无论是邀请同僚发动进攻,还是确认同僚的邀请,到底送到没有。设想下,如果将军甲发出了进攻的邀请,然后没有收到确认,他自己一个人就去攻城,那是一个多么悲催的结果。
而且问题远远比想象的复杂,先简化到两个将军间的联系。甲送信给乙,乙收到确认,然后返回信件给甲。现在的风险是,乙将军的信使可能在途中被消失。那么乙的信件可能没有送到。甲没有收到回信,只好假设乙没有确认,为了安全起见,甲决定不进攻。于是悲催的乙就一个人去攻打然后被打残了。
那么我们增加一个环节,甲收到回信后,再发送一封信给乙如何呢?这不能解决问题,因为这封回信也可能丢失,这么来回确认,只要是有限的N次,这种协同还是无法保障的。按说这就没法玩儿了,但在具体的社会和工程实践中,我们只好评估传令兵被打死的概率,确认次数足够多,就认为是达成了一致,虽然这有风险。计算机系统中常见的提交是 两阶段,或者三阶段提交。也就是 建议-》准备-》提交模式。
这个方法,只能在三个将军都是好人(honest)的条件下才能使用。现在假设其中有个将军叛变了。他给甲将军的信是确认,但到点儿他却不去了,这问题就麻烦了。这个问题怎么办呢?答案是没办法!在点对点系统基础上的分布式系统,至少需要大于2/3的将军们靠谱才能协同。也就是所谓3F+1,两个人能搞定的事情,需要派四个人去才行。
现在停下来,想想为什么本来三条腿就够的凳子,却都是四条腿。因为对于四条腿的凳子来说,任何一条坏了,或者虚了,仍然不会倒。具有很好的容错能力。
这种故意 的欺诈,以及其他的消息错漏,假消息等等错误,称为拜占庭错误。如何解决这个问题,且听下回分解
附录:技术部分
熟悉技术的人知道我在谈论的是拜占庭将军问题,The Byzantine Generals Problem (leslie et. al 1982)。特别地,我谈论的是其不可能性的部分。更准确的说法是1/3的背叛就足以搞黄整个团队,三个人的话,一个人捣乱就够了。
No solution will work unless more than two-thirds of the generals are loyal. In particular, with only three generals, no solution can work in the presence of a single traitor.
在比特币这个系统里面,他们说51/100的节点honest就够了,这是很大的一个区别。