何为HashMap?
HashMap是用哈希表(直接一点可以说数组加单链表)+ 红黑树实现的map类(其实所谓Map其实就是保存了两个对象之间的映射关系的一种集合)。
版本之更迭
–》JDK 1.7 : Table数组 (也有叫做 "位桶" ) + Entry链表(头插法);
–》JDK 1.8 : Table数组 (也有叫做 "位桶" ) + Node链表(换了名) + 红黑树(尾插法);
HashMap的实现原理
当系统开始初始化 HashMap 时,系统会创建一个长度为 capacity(默认为2的16次幂) 的 Entry 数组。
这个数组被用来存储key-value对,每⼀个键值对组成了⼀个Entry实体,存储元素(也就是一个 Entry实体)的位置被称为 "桶 (bucket) ",每个 bucket 都有其指定索引,系统可以根据其索引快速访问该 bucket 里存储的元素。
无论何时,HashMap 的每个 "桶" 只存储一个元素,由于 Entry 对象可以包含一个引用变量(就是 Entry 构造器的的最后一个参数Next指针)用于指向下一个 Entry,因此可能出现的情况是:HashMap 的 bucket 中只有一个 Entry,但这个 Entry 指向另一个 Entry ——这就形成了一个 Entry 链(单向的链表结构)。
参数说明
HashMap的初始化
HashMap有4个构造器,其他构造器如果用户没有传入initialCapacity 和loadFactor这两个参数,会使用默认值
从上面这段代码我们可以看出,在常规构造器中,没有为数组table分配内存空间(有一个入参为指定Map的构造器例外),只是赋值,只有在执行put操作的时候才真正构建table数组,为什么要这样做?估计是避免初始化了HashMap之后不使用反而占用内存吧
OK,接下来我们来看看put操作的实现
HashMap的存储操作
inflateTable这个方法用于为主干数组table在内存中分配存储空间,通过roundUpToPowerOf2(toSize)可以确保capacity为大于或等于toSize的最接近toSize的二的次方数,比如toSize = 13,则capacity = 16; toSize = 16,capacity = 16; toSize =17,capacity = 32.
roundUpToPowerOf2中的这段处理使得数组长度一定为2的次幂,Integer.highestOneBit是用来获取一个小于等于i的2的幂次方数
number减1是为了所获取的结果不超过原数
返回一个小于等于i的2的幂次方数
按位从左向右移动,取i的最高位,其他位清0(右移与或运算的目的就是想让某个数字的低位都变为1,再用该结果减去该结果右移一位后的结果,则相当于清除了原数字的低位,即得到了我们想要的结果)
hash函数
以上hash函数计算出的值,通过indexFor进一步处理来获取实际的存储位置
h&(length-1)保证获取的index一定在数组范围内,举个例子,默认容量16,length-1=15,h=18,转换成二进制计算为index=2。位运算对计算机来说,性能更高一些(HashMap中有大量位运算,计算机底层就是2进制运算)。数组下标的获取无视了HashCode高位的参与,所以有了以上Hash函数代码中对HashCode进行进一步的运算和调整,避免太多低位相同的HashCode存储在同一位置上,链表过长,遍历时间太久
再来看看addEntry的实现:
通过以上代码能够得知,当size大于阈值并且即将要发生哈希冲突( jdk7中resize,只有当 size>=threshold并且 table中的那个槽中已经有Entry时,才会发生resize。)的时候,需要进行数组扩容,扩容时,需要新建一个长度为之前数组2倍的新的数组,然后将当前的Entry数组中的元素全部传输过去,扩容后的新数组长度为之前的2倍,所以扩容相对来说是个耗资源的操作。