在说区块链的共识算法的时候会有个容易混淆的点,就是公式算法和一致性,而且它们会经常一起出现,其实概念上是有区别的。
一致性指的分布式系统最终呈现的一个数据状态(对应的输入是不是都能得到期望的输出),而共识算法是说的这个分布式系统的各个节点是如何达到这个统一的状态的过程。一个看的是结果,一个讲的是过程。
所以就区块链来讲,共识指的是对于确定由哪个节点记账(创建区块)达成共识,那这个前面那篇也讲了,比特币的话是通过POW(工作量证明)来确定的,目前主流的共识算法如下:
就以POW(工作量证明)为例来走一遍他的工作流程:
首先确定一下节点的逻辑角色(这个角色的定义是从Paxos算法里拿过来的,感觉可以对标到区块链节点的角色上来):
Proposer(提案者):提出一个提案,等待大家批准为结案,对应到区块链里就是提出新区块的挖掘节点
Acceptor(接受者):负责对提案进行投票,接受提案,对应到区块链里的完整节点,就是会保存整条链的完整信息的节点
Learner(学习者):获取结果,可以帮忙传播,但不参加投票过程。对应到区块链里的广播节点。
之前也提过,挖掘节点会对新的交易信息打包,然后计算随机串,这就是POW的主要过程,POW的特点就是计算的不对称性,挖掘节点需要做有一定难度的工作才能得到结果,但验证方(就是接受者们)可以很快地确认你计算的结果对不对。大家脑子里面第一时间想到的肯定是哈希,具体比特币采用的算法是什么其实就是计算区块内一些信息的哈希。举个简单的例子:
假设输入的值可以是blockchain1……依次递增,我们需要寻找对他哈希运算后结果的前三位是0的输入,然后就有了以下计算过程:
blockchain1 -> ef7797e13d3a75526946a3bcf00daec9fc9c9c4d51ddc7cc5df888f74
blockchain2 -> db0b9c1cb5e9c680dfff7482f1a8efad0e786f41b6b89a758fb26d9e2
......
blockchain515 -> 0063e58fb6e3789fcb5eb64d05d7a9b909c5e9e1b60b18cb566a332
......
blockchain2688 -> 0005f2ee930eafef21d06545c0058ddfcf2ac9dfa542b745021f51
可以看到计算到2688次的时候终于找到了满足条件的输入,也就是blockchain2688,这个计算随着条件的加难可能越发地耗时,比如现在把条件改成前四位都是0,但是无论计算多么耗时,接受者拿到结果后都能很快确认这个结果是不是满足条件,只需要哈希一下就可以了。
所以比特币就是通过这种方式,谁先算出满足条件的结果,谁就先广播出去,被接受者们所接受。比特币就是由于这样的原因,他会根据全网的算力调整工作量,使得区块生成的时间一直稳定在十分钟左右,这样的速度让同一时间有两个挖掘节点同时算出满足条件的结果的概率变得相当的低(如果发生了,这个叫做分叉),因为网络中绝大多数的节点都能够在十分钟内接收到新产生的区块。
比特币采用的工作量证明函数式SHA256,反正以一个笔记本算法大概是1GH/s的算力来说,有生之年肯定是算不出来一个区块的(其实说明了POW的性能低下,会造成大量算力的浪费)。
所以图上除了POW还有些别的共识算法,但就不一一写了,手疼。
说完了共识算法就要提到一致性的问题了,就是当一个提案(新区块)被确定后,如何在整个网络中同步的。
这里我们暂时还是忽略掉个别节点故意搞破坏这一种情况。
当分叉发生的时候,就是恰好有两个挖掘节点都同时算出满足满足条件的结果的时候怎么办呢?
前面一篇提到过一句话:所有节点默认都只承认所看到的最长链结构。
然后只要超过一半的节点都确认了这个结果,那么这个区块就算是生效的,理论上来讲没有谁能要求整个区块链网络里面每个节点都达成一致,因为本来区块都是随着时间不断增加,整个链在不停地更新的,所以区块链里不存在强一致性,这就意味着理论上来说,挖掘节点可以从任意一个区块开始往后叠加,那这样感觉是不是就很混乱了。
但这不影响它能够正常地工作,就是因为所有节点默认都只承认所看到的最长链结构这句话。
最长链原则
最长的链代表着最多最全的信息,很重要的一点是如果所有节点都默认接受最长的链的话,这就意味着如果虽然你的挖掘节点可以选择从任何区块出发,如果你从某个前面的块开始作为起点来进行计算是不容易受到认可的,因为其他节点会接受比你长的,你创建的区块不被接受,那你就拿不到奖励,所以为了得到奖励,挖掘节点必然也会更倾向于从最长的链路出发进行计算。从而解决掉分叉的问题。