注:本文如涉及到代码,均经过Python 3.7实际运行检验,保证其严谨性。
本文阅读时间约为5分钟。
区块链技术是散列函数最酷的应用。近些年比特币(BitCoin)的大红大紫使得区块链技术名声大噪。
区块链是什么
区块链是一种分布式数据库。通过网络连接的节点,每个节点都保存着整个数据库的所有数据。任何地点存入的数据都会完成同步。
区块链的最本质特征是去中心化。所谓去中心化,就是指不存在任何控制中心,协调中心的节点;所有节点都是平等的,无法被控制。
那么,区块链是如何做到不需要互相信任和权威,即可防止被篡改和破坏?
这要从区块链的数据结构说起。
区块链的数据结构
区块链由一个个区块(block)组成,区块分为头(head)和体(body)。
- 区块头记录了一些元数据和链接到前一个区块的信息——包括生成时间、前一个区块(head+body)的散列值。
- 区块体记录了实际数据。
区块链的数据结构如下图所示:
区块链的不可修改性
由于散列值具有抗修改性,任何对某个区块数据的改动必然引起散列值的变化。为了不导致这个区块脱离链条,就需要修改后续的所有区块。
而由于有“工作量证明”的机制,这种大规模修改不可能实现,除非掌握了全网51%的计算力。
工作量证明(Proof of Work, POW)
由于区块链是大规模的分布式数据库,同步较慢,新区块的添加速度需要得到控制。
目前最大规模区块链BitCoin采用的速度是平均每10分钟生成一个区块。
大家不惜付出海量的计算,去抢着算出一个区块的有效散列值。最先算出有效散列值的人(我们称之为“矿工”),才有资格把区块挂到区块链当中。
为什么计算出有效散列值很困难?
因为只有很难计算,这才能控制新区块的生成速度,便于在整个分布式网络中进行同步。
每个区块设置了一个难度系数Difficulty,用常数targetmax除以它,得到一个target,难度系数越高,target越小。
target = targetmax / difficulty
旷工的工作是,找到一个数值Nonce,把它跟整个区块数据一起计算散列。这个散列值必须小于target,才是有效的散列值。
由于散列值无法回推原值,要找到Nonce,只能靠暴力穷举,计算工作量+运气是唯一的方法。
为什么矿工们抢着生成区块?
因为利益。在加密货币BitCoin中,区块内包含的数据是“交易记录”,也就是账本。这对货币体系至关重要。
BitCoin规定,每个区块中包含了一定数量的比特币作为“记账奖励”,这样就鼓励了更多人加入到抢先记账的行列。
虽然计算出有效散列值会越来越困难,但是,由于硬件摩尔定律的存在,计算力同样会持续递增,于是,这就能维持每10分钟生成一个区块的速度。
挖矿计算力一直持续升级:CPU(20MHash/s) → GPU(400MHash/s) → FPGA(25GHash/s) → ASIC(3.5THash/s) → 大规模集群挖矿(3.5THash/s * X)。
另外,BitCoin的总数量是一定的,不会无限增加,每4年奖励的BitCoin数量减半。
To be continued.