哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
记录的存储位置=f(关键字)
即直接将关键值与实际存储地址绑定起来了,可以直接通过key计算出存储地址,而不需要寻址。
这里的对应关系f称为散列函数,又称为哈希(Hash函数),采用散列技术将记录存储在一块连续的存储空间中,这块连续存储空间称为散列表或哈希表(Hash table)。
哈希表hashtable(key,value) 就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里。(或者:把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。) 而当使用哈希表进行查询的时候,就是再次使用哈希函数将key转换为对应的数组下标,并定位到该空间获取value,如此一来,就可以充分利用到数组的定位性能进行数据定位。
Hash Table的查询速度非常的快,几乎是O(1)的时间复杂度。
-哈希函数的构造方法
1.直接地址法
h(k) = k+c
2.除留余数法
h(k) = k mod p
p最好取为不大于哈希表长度的最大素数,效果最好
3.数字分析法
提取关键字中取值均匀的数字作为哈希地址,适用于所有关键字值都已知的情况。
-哈希冲突解决方法
1.开放地址法
即将冲突的元素插入到哈希表重的空闲单元中。(线性探查法,平方探查法等)
2.拉链法
将所有的同义词用单链表链接起来,哈希表中每个单元中存放的不是记录本身,而是同义词单链表的头指针。
3.再哈希法