HashMap的数据结构网站首页 技术教程

HashMap的数据结构

猿究院GX... 2024-06-17 11:25:09

简介HashMap的数据结构

在JDK1.7及以前，HashMap采用“数组+链表”的方式来作为存储结构，在JDK1.8开始，HashMap开始采用“数组+链表+红黑树”的方式来作为存储结构。

HashMap中的每一个元素（KV键值对），都会被封装成为一个内部的Entry对象，每个Entry对象都有Key（键），value（值），next（下一个元素），hash（哈希值）。

 Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

HashMap最底层是一个默认为长度16的数组，在数组中保存Entry对象；当我们每次向HashMap中存储Entry对象时，HashMap内部都会根据key值进行hash后计算hash值，通过（长度-1）&hash得到这个元素在数组中的下标，如果该位置上已经存放有其他元素（哈希冲突），那么在这个位置上的元素将以链表的形式存放，使用next指向新添加的元素，形成链表；但当链表的长度大于8且数组长度大于64时，链表就会转换为红黑树，这种操作，大大减少了搜索时间。

static final int hash(Object key) {//hash（）方法计算出一个hash值
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }


final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            //当当前数组位置为空时，新的Entry对象可以直接放进数组中
            tab[i] = newNode(hash, key, value, null);
        else {
            //当计算出的下标位置上有元素时
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;//如果key相等，那么用新的value替换原数据
            else if (p instanceof TreeNode)
                //如果不相等，判断当前节点是不是TreeNode<K,V>树形节点，如果是，创作树形节点插入红黑树中
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                //如果不是树形节点，则创建普通的Node<K,V>加入链表尾部
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            //当链表长度大于8且数组长度大于64时，链表转换为红黑树
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();//如果当前节点数大于实际存储空间大小时，调用resize()，按照原数组的长度，扩容一倍
        afterNodeInsertion(evict);
        return null;
    }

由以上代码可知HashMap的存储过程（put()）：

判断数组是否为空，如果为空对其进行初始化；
如果不为空，使用hash方法计算key的hashCode，通过（n-1）&hash计算应当存放在数组中的下标index；
查看数组下标为index的位置是否存在数据；
如果没有数据，就构造一个Node<K,V>节点，存放到数组中；
如果存在数据，说明发生hash冲突，继续判断key是否相等；
如果相等，用新的value替换原数据；
如果不相等，判断当前节点是不是TreeNode<K,V>树型节点；
如果是树型节点，创建树型节点插入红黑树中；
如果不是树型节点，创建普通Node<K,V>加入链表尾部；
判断链表长达是否大于8且数组长度大于64，如果满足，链表转换成红黑树，如果不满足，数组扩容；
插入完成后，判断当前节点数是否大于实际存储空间大小；
如果大于，调用resize()，数组扩容一倍

另外还有两个影响HashMap的参数：初始容量和加载因子。

初始容量：用来规定哈希数组的长度，默认为16，由于需要避免哈希冲突，所以是16（2的倍数），在存储大数据量的时候，最好预先判断数据量，根据2的n次幂，提前预设初始容量。

加载因子：用来表示哈希表中元素的填满程度，默认为0.75，越大则表示允许填满的元素就越多，哈希表的空间利用率就越高，但是产生hash冲突的概率就会增加；反之，越小则冲突的机会就会越少，但是空间就会浪费更多，因此在设置初始容量时，应该考虑到初始容量及其加载因子，最大限度减少rehash重建内部数据结构的次数，减少扩容次数。

由以上可知HashMap的扩容会发生在：

1.当HashMap中的元素个数超过数组大小×加载因子时，就会进行数组扩容：加载因子默认为0.75，熟路容量默认为16，当HashMap中元素超过16×0.75=12个时，数组容量扩大一倍；

2，加入元素时，如果链表的长度大于阈值8且数组长度小于64时，数组也会扩容，如果数组长度大于64时，链表会转换成红黑树。

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。