详解HashMap源码解析(上)

jdk版本:1.8

数据结构:

HashMap的底层主要基于数组+链表/红黑树实现,数组优点就是查询块HashMap通过计算hash码获取到数组的下标来查询数据。同样也可以通过hash码得到数组下标,存放数据。

哈希表为了解决冲突,HashMap采用了链表法,添加的数据存放在链表中,如果发送冲突,将数据放入链表尾部。

数据结构

上图左侧0~4部分是一个哈希表,也称为哈希数组(hash table):

// table数组
transient Node<K,V>[] table;

table数组的引用类型是Node节点,数组中的每个元素都是单链表的头结点,链表主要为了解决上面说的hash冲突,Node节点包含:

  • hash hash值
  • key
  • value
  • next next指针

Node节点结构如下:

 static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;

    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }
    // 省略 get/set等方法
}

主要属性

// 储存元素数组
Node<K,V>[] table;

// 元素个数
int size;

// 数组扩容临界值,计算为:元素容量*装载因子
int threshold

// 装载因子,默认0.75
float loadFactor;

// 链表长度为 8 的时候会转为红黑树
int TREEIFY_THRESHOLD = 8;

// 长度为 6 的时候会从红黑树转为链表
int UNTREEIFY_THRESHOLD = 6;

  • size记录元素个数
  • threshold 扩容的临界值,等于元素容量*装载因子
  • TREEIFY_THRESHOLD 8 链表个数增加到8会转成红黑树
  • UNTREEIFY_THRESHOLD 6 链表个数减少到6会退化成链表
  • loadFactor 装载因子,默认为0.75

loadFactor 装载因子等于扩容阈值/数组长度,表示元素被填满的程序,越高表示空间利用率越高,但是hash冲突的概率增加,链表越长,查询的效率降低。越低hash冲突减少了,数据查询效率更高。但是示空间利用率越低,很多空间没用又继续扩容。为了均衡查询时间使用空间,系统默认装载因子为0.75

获取哈希数组下标

添加、删除和查找方法,都需要先获取哈希数组的下标位置,首先通过hash算法算出hash值,然后再进行长度取模,就可以获取到元素的数组下标了。

首先是调用hash方法,计算出hash值

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

先获取hashCode值,然后进行高位运算,高位运算后的数据,再进行取模运算的速度更快。

算出hash值之后,再进行取模运算:

(n - 1) & hash

上面的n是长度,计算的结果就是数组的下标了。

构造方法

HashMap()

     /**
     * default initial capacity (16)
     *  the default load factor (0.75). 
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
    }

设置默认装载因子0.75,默认容量16

HashMap(int initialCapacity)

// 指定初始值大小
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

// 指定初始值和默认装载因子 0.75
public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0),,
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

HashMap(int initialCapacity) 指定初始容量,调用HashMap(int initialCapacity, float loadFactor) 其中loadFactor为默认的0.75

首先做容量的校验,小于零报错,大于最大容量赋值最大值容量。然后做装载因子的校验,小于零或者是非数字就报错。

tableSizeFor使用右移和或运算,保证容量是2的幂次方,传入2的幂次方,返回传入的数据。传入不是2的幂次方数据,返回大于传入数据并接近2的幂次方数。比如:

  • 传入10返回16
  • 传入21返回32

HashMap(Map<? extends K, ? extends V> m)

public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}

将集合m的数据添加到HashMap集合中,先设置默认装载因子,然后调用putMapEntries添加集合元素到HashMap中,putMapEntries是遍历数组,添加数据。

总结

本文基于jdk1.8解析HashMap源码,主要介绍了:

  • HashMap 是基于数组+链表/红黑树结构实现。采用链表法解决hash冲突。
  • Node 节点记录了数据的keyhashvalue以及next指针。
  • HashMap主要属性:
    • size 元素个数
    • table[] 哈希数组
    • threshold 扩容的阈值
    • loadFactor 装载因子
    • TREEIFY_THRESHOLD 8,链表个数为8转成红黑树。
    • UNTREEIFY_THRESHOLD 6 ,链表个数为6红黑树转为链表。
  • 添加、删除以及查找元素,首先要先获取数组下标,HashMap先调用hasCode方法,hashCode()的高16位异或低16位,大大的增加了运算速度。然后再对数组长度进行取模运算。本质就是取key的hashCode值、高位运算、取模运算
  • HashMap几个构造方法:
    • HashMap()设置默认装载因子0.75和默认容量16
    • HashMap(int initialCapacity)设置初始容量,默认装载因子0.75,容量是一定要是2的幂次方,如果不是2的幂次方,增加到接近2的幂次方数。
    • HashMap(Map<? extends K, ? extends V> m)主要是遍历添加的集合,添加数据。

参考

深入浅出HashMap的设计与优化

Java 8系列之重新认识HashMap

感觉不错的话,就点个赞吧!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,204评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,091评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,548评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,657评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,689评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,554评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,302评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,216评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,661评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,851评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,977评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,697评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,306评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,898评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,019评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,138评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,927评论 2 355

推荐阅读更多精彩内容

  • hashMap发生死锁的问题,在以下文章中:1.7hashmap发生死锁,线程非安全[https://blog.c...
    zhengaoly阅读 157评论 0 0
  • 说在前面HashMap提供了所有可选的map操作,key和values可以为null。HashMap和Hashta...
    JavaM阅读 292评论 0 4
  • 简介 Java为数据结构中的映射定义了一个接口java.util.Map,此接口主要有四个常用的实现类,分别是Ha...
    bbe9e62bc5ba阅读 419评论 0 4
  • 摘要 HashMap是程序猿使用频率最高的用于映射(键值对)的数据类型。JDK1.8对HashMap进行了优化,例...
    一凡呀阅读 731评论 0 2
  • 原文地址 HashMap HashMap 是 Map 的一个实现类,它代表的是一种键值对的数据存储形式。 大多数情...
    gyl_coder阅读 380评论 0 0