HashMap源码解读
参考文章:https://mp.weixin.qq.com/s/YdUQTuG524SYNHwS22mg1Q
常量解析:
// 默认初始化数组长度
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认装载因子,默认值为0.75
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 树化的列表深度阈值
static final int TREEIFY_THRESHOLD = 8;
// 反树化(链表化)的深度阈值
static final int UNTREEIFY_THRESHOLD = 6;
// 最小的可树化的数组长度
static final int MIN_TREEIFY_CAPACITY = 64;</pre>
属性解析:
// 大名鼎鼎的Node数组
transient Node<K,V>[] table;
// 缓存的键值对们
transient Set<Map.Entry<K,V>> entrySet;
// 数组大小
transient int size;
// 记录当前集合被修改的次数
transient int modCount;
// 扩容的临界值
int threshold;
// 装载因子
final float loadFactor;
构造方法解析:
public HashMap(int initialCapacity, float loadFactor) {
// 健壮性判断
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
// 装载因子初始化
this.loadFactor = loadFactor;
// 将临界值初始化为数组大小,tableSizeFor: 将初始化值设置为是2的整数次幂(eg. 10 -> 16)
this.threshold = tableSizeFor(initialCapacity);
}
tableSizeFor原理:
static final int tableSizeFor(int cap) {
// 此处-1,对应了最后的 +1
// 如果不减1 ,如果cap为2的N次方的话,则计算值为2的N次方的阶乘,与预期不符
// 本质是如果cap值为2的N次方时,使得其对应的二进制数位数-1
int n = cap - 1;
/** 本质逻辑就是通过位移使得每个二进制位都为1 */
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
// n+1 ,对应之前的-1操作
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
hash方法和计算数组下标解析:
static final int hash(Object key) {
int h;
/**
* 低16位是和高16位进行异或,高16位保持不变。
* 一般的数组长度都会比较短,取模运算中只有低位参与散列;
* 高位与低位进行异或,让高位也得以参与散列运算,使得散列更加均匀
* 个人理解:也是重写hashCode方法导致不合理的hash算法问题的兜底方案
*/
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
/**
* n = 数组size
* hash = hash方法计算结果
* 因为数组下标从0开始,所以n-1即最大值,hash值与n-1做&运算,运算值肯定会在0~(n-1)之间
* 结果等同于 hash % n,但是计算效率更高
*/
(n - 1) & hash
resize方法解析:
final Node<K,V>[] resize() {
// oldTab为原数组
Node<K,V>[] oldTab = table;
// 旧数组大小
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 旧数组临界值(构造方法会赋值为数组大小)
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
// 健壮性考虑,达到最大值时,直接返回旧数组
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
// 数组扩容,新数组扩容为旧数组一倍(即左移1位),保证数组大小为2的n次方
newThr = oldThr << 1; // double threshold
}
// 数组初始化部分(之前为空)
else if (oldThr > 0) // initial capacity was placed in threshold
// 因为new HashMap时会赋值为数组大小,所以新数组大小为旧临界值
newCap = oldThr;
else {
// 健壮性考虑
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
// 初始化新临界值,临界值 = 数组长度 * 装载因子
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
// 将新临界值赋予临界值threshold
threshold = newThr;
// 将新数组赋予数组table
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
// 原数组中有值时,数据rehash
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
// 将旧节点指向空
oldTab[j] = null;
if (e.next == null)// 仅有一个节点
// 重新计算下标
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
// 树节点扩容
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // 多节点链表扩容
/**
* 数组的长度始终是2的整数次幂,每次扩展数组都是原来的2倍
* key在新的数组的hash结果只有两种:
* 1. 在原来的位置
* 2. 在原来位置+原数组长度。
*/
// lo链表 对应 在原来的位置情况
Node<K,V> loHead = null, loTail = null;
// hi链表 对应 在原来位置+原数组长度情况
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do { // 循环直到链表尾部
next = e.next;
if ((e.hash & oldCap) == 0) {// 在原来的位置
// 当前头尾节点初始化
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {// 在原来位置 + 原数组长度
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
put方法解析:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// onlyIfAbsent = true,则不覆盖存在的值
// evict = false,则处于初始化中
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
// 数组为空,初始化数组
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)// 获取对应数组下标对应的节点为空
// 初始化新节点
tab[i] = newNode(hash, key, value, null);
else {
// 链表 or 树 追加节点
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
// key相等,则新值覆盖旧值,返回值为旧值
e = p;
else if (p instanceof TreeNode)
// 树节点调用putTreeVal
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {// binCount 链表深度
if ((e = p.next) == null) {
// 尾插法
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // 深度达到阈值
//转换为红黑树存储(双向链表)
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
// 当前节点指向下一个节点,即循环链表
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
// 覆盖旧值
e.value = value;
// 回调
afterNodeAccess(e);
return oldValue;
}
}
// 将记录修改次数加1,判断是否需要扩容,如果需要就扩容
++modCount;
if (++size > threshold)// 达到临界值触发扩容
resize();
afterNodeInsertion(evict);
return null;
}