介绍
- 哈希函数,或散列函数,又称为哈希算法,是一种从任何一种数据中创建小的数字“指纹”的方法。
散列函数把消息或数据压缩成摘要,使得数据变小,将数据的格式固定下来。所有的散列函数都有一个基本特性:如果两个散列值是不相同的(根据同一函数),那么这两个散列值的原始输入也是不相同的。这个特性使散列函数具有确定性的结果,具有这种性质的散列函数称为单向散列函数。
实现
- 哈希算法将任意长度的二进制值映射为较短的、固定长度的二进制值,这个固定长度的二进制值称为哈希值。
哈希值是一段数据唯一且及其紧凑的数值表示形式。
TIPS
如果对一段数据采用哈希算法处理后,哪怕只更改该段落中的一个字母,随后的哈希计算都将产生不同的值;但是反过来,对于哈希值相同的两个数,通过穷举得方式想要找到两个不同的输入信息(称为“反向碰撞”),对于随机性能优秀的散列函数来说,这种方式在计算上是不可能的,所以数据的哈希值可以用来检验数据的完整性。
分类
基于这一特点,哈希算法一般用于快速查找和加密算法。典型的哈希算法包括MD2、MD4、MD5和SHA-1等,在比特币系统中,才用了随机性能更优秀的SHA256算法。
在区块链中的应用
在区块链技术中,哈希算法本质上是一个压缩数据的过程,即从原始的任意长度的数据(对应的可能是文档、图片、视频、音频等数据文件)开始,经过哈希计算后,压缩成固定长度的二进制值。而且由于其具有单向特性,因而可以通过哈希值对比来校验原来的数据是否发生变动。应用在区块中,既减少了区块头存储的数据量,也相当于将整个区块的交易纳入区块的计算过程中,使恶意篡改变得无比困难,保证了区块链的数据的安全性,因而成为区块链中的一项重要基础技术。
Python标准库hashlib模块实现哈希算法
import hashlib
date = 'hello world'
hash_object = hashlib.sha256(date.encode('utf-8'))
hex_dig = hash_object.hexdigest()
print(hex_dig)