作者:倪云华
【题外话】最近接到不少小伙伴们的反馈,一方面小蛆非常荣幸成为了许多比特币小白走进世界的一块敲门砖,但另一方面小蛆也听到了一些反对的声音。大家反对的角度主要是认为比特币作为高风险的资产,现在已经明显不适合投资了,尤其不适合没有强大风控能力的散户入场。这里小蛆必须为自己声明一下,小蛆只做知识的搬运工,而且小蛆的兴趣是链圈,并不在币圈,小蛆也不会给出任何的投资建议。
大家不要凶我了,我只是一个可爱的小虫虫。
OK!上一篇文章我们讲述了比特币区块链是如何实现把银行的记账功能、数据库更新功能分散到各个节点去实现的,又是如何从众多的节点之中选取下一个区块的来源。今天我们从区块的结构上来看一下为什么区块链可以严格控制产生区块的速度,这个区块链是怎样一点一点地向上生长的。
在介绍这些内容之前,我们必须搞明白一个函数,他就是随机散列函数——Hash(哈希)。这个函数有这么几个功能:
函数大家都知道就是Y=H(X),其中X是输入,Y是输出。
1. 任何长度的输入X都会转化为一个固定长度的Y;
2. X输入的任何一个哪怕只是一个字节的变动都会导致Y大相径庭;
3. 通过X可以计算得到Y,但是不可能通过Y反推得到X。
说得简单一点,这个函数就是——
1. 你把乌七八糟乱七八糟牛鬼蛇神都倒进一个黑箱子里,结果会出来内容不一样但是长度一模一样的字符串;
2. 前后两次输出哪怕只有一点点的出入,这个结果会差到十万八千里;
3. 同时,就算你有了输出的结果,也决计不可能知道输入是什么。
从hash函数的这些性质,我们可以推断出这个函数在区块链技术之中可以发挥怎样的作用了——通过这个函数,成千上万条交易记录可以通过字符拼接拼成一个长长长长非常长的大字符,然后通过hash函数,这些记录就变成了统一长度的hash值。(其实这个过程是通过两两交易记录拼接后经过n/2次hash计算得到一个最终的hash值)。
为什么要让交易记录规范化呢?道理很简单,因为每10分钟的交易记录条数是不确定的。就像生产饮料,如果每瓶的容量不同,那我们每生产一瓶饮料就要量身制定一个瓶子,这样的效率是很低下的。但如果我们通过hash函数都变成了统一大小的饮料,那我们在做对比检验的时候,比较这个标准化的结果就可以了。
另外,hash函数牵一发而动全身的特点让它特别适合做验证。只要交易记录里有一点点改动,哪怕只有一个字符,这个区块里的交易信息经过hash函数后的结果与原hash值相差极大。这样新区块就会发现前方区块已经被篡改,就不会委身接在这个被篡改的区块后面。
我们现在来讨论一个区块的结构。大家已经知道了,区块里封装的是10分钟之内所有的交易记录。为了让所有区块按照时间顺序排列,并且每一个区块有序地排列在另一个已经被验证过的区块后面,区块被设计成如下的结构:
所以从宏观来看,一整条区块链的直观形状就应该是这样的:
通过链状的结构,所有比特币交易记录就都被串联进了这条无限延伸的区块链之中。这里,区块头就起到了至关重要的作用,它的最主要功能就是验证。那我们来看一下它是如何实现这个功能的。区块头的结构如下:
当一个节点向网络发出请求的时候,网络会把最新的区块发给他。最新的区块里包含了前面一个区块的hash值,所以根据这个hash值,这个新进入的节点就可以找得到当前区块之前的一个区块。找到上一个区块之后,再通过上一个区块里储存的前、前区块hash值再向前追溯一个区块。由此,只要给节点一个区块,它就可以把之前所有的区块都找到。
由于hash值的唯一性,不同数据包拥有相同hash值的概率极低极低,甚至可以被当作不可能事件,所以只要hash值一致,就可以通过验证,确定区块的位置。
对于过往的历史数据,hash值判定方法使得每个区块的数据是不可更改的。因为一旦更改了其中的信息,反应在区块头中的梅克尔数根就会发生变化,继而使得这个区块的hash值发生变化。新的节点在获取交易记录的时候,就会避开这个hash改变的数据包,而去其他节点获取符合hash值的未被改变的数据包。
由此,我们解释了为什么通过hash函数使得各位节点即使在不同时间加入网络,它也能够获取全部的交易信息,并保证这份信息是唯一的、不可修改的。但是,对于新发生的交易,因为没有hash值可以用以对比,而且每份交易都是节点自行声明的,如何保证新区块是诚实的呢?
且听小蛆下回分解。