您现在的位置是:首页 >技术教程 >HashMap的数据结构网站首页技术教程
HashMap的数据结构
在JDK1.7及以前,HashMap采用“数组+链表”的方式来作为存储结构,在JDK1.8开始,HashMap开始采用“数组+链表+红黑树”的方式来作为存储结构。
HashMap中的每一个元素(KV键值对),都会被封装成为一个内部的Entry对象,每个Entry对象都有Key(键),value(值),next(下一个元素),hash(哈希值)。
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
HashMap最底层是一个默认为长度16的数组,在数组中保存Entry对象;当我们每次向HashMap中存储Entry对象时,HashMap内部都会根据key值进行hash后计算hash值,通过(长度-1)&hash得到这个元素在数组中的下标,如果该位置上已经存放有其他元素(哈希冲突),那么在这个位置上的元素将以链表的形式存放,使用next指向新添加的元素,形成链表;但当链表的长度大于8且数组长度大于64时,链表就会转换为红黑树,这种操作,大大减少了搜索时间。
static final int hash(Object key) {//hash()方法计算出一个hash值
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
//当当前数组位置为空时,新的Entry对象可以直接放进数组中
tab[i] = newNode(hash, key, value, null);
else {
//当计算出的下标位置上有元素时
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;//如果key相等,那么用新的value替换原数据
else if (p instanceof TreeNode)
//如果不相等,判断当前节点是不是TreeNode<K,V>树形节点,如果是,创作树形节点插入红黑树中
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//如果不是树形节点,则创建普通的Node<K,V>加入链表尾部
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//当链表长度大于8且数组长度大于64时,链表转换为红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();//如果当前节点数大于实际存储空间大小时,调用resize(),按照原数组的长度,扩容一倍
afterNodeInsertion(evict);
return null;
}
由以上代码可知HashMap的存储过程(put()):
- 判断数组是否为空,如果为空对其进行初始化;
- 如果不为空,使用hash方法计算key的hashCode,通过(n-1)&hash计算应当存放在数组中的下标index;
- 查看数组下标为index的位置是否存在数据;
- 如果没有数据,就构造一个Node<K,V>节点,存放到数组中;
- 如果存在数据,说明发生hash冲突,继续判断key是否相等;
- 如果相等,用新的value替换原数据;
- 如果不相等,判断当前节点是不是TreeNode<K,V>树型节点;
- 如果是树型节点,创建树型节点插入红黑树中;
- 如果不是树型节点,创建普通Node<K,V>加入链表尾部;
- 判断链表长达是否大于8且数组长度大于64,如果满足,链表转换成红黑树,如果不满足,数组扩容;
- 插入完成后,判断当前节点数是否大于实际存储空间大小;
- 如果大于,调用resize(),数组扩容一倍
另外还有两个影响HashMap的参数:初始容量和加载因子。
初始容量:用来规定哈希数组的长度,默认为16,由于需要避免哈希冲突,所以是16(2的倍数),在存储大数据量的时候,最好预先判断数据量,根据2的n次幂,提前预设初始容量。
加载因子:用来表示哈希表中元素的填满程度,默认为0.75,越大则表示允许填满的元素就越多,哈希表的空间利用率就越高,但是产生hash冲突的概率就会增加;反之,越小则冲突的机会就会越少,但是空间就会浪费更多,因此在设置初始容量时,应该考虑到初始容量及其加载因子,最大限度减少rehash重建内部数据结构的次数,减少扩容次数。
由以上可知HashMap的扩容会发生在:
1.当HashMap中的元素个数超过数组大小×加载因子时,就会进行数组扩容:加载因子默认为0.75,熟路容量默认为16,当HashMap中元素超过16×0.75=12个时,数组容量扩大一倍;
2,加入元素时,如果链表的长度大于阈值8且数组长度小于64时,数组也会扩容,如果数组长度大于64时,链表会转换成红黑树。