天天看点

HashMap源码解读

HashMap特性

我们都知道HashMap是实现了Map接口的一个类,同时也有着存储key-value键值对的功能。

与此同时,HashMap还有着一些特性,比如:“无序”、“允许null值”等特性。在这我就不一一列出来了,马上转战源码解读。

HashMap实现原理

(源码解读)

HashMap底层主要元素是一个Entry数组,每个Entry元素中储存相应的key-value等;

HashMap源码解读

Entry是HashMap下的一个静态类;

HashMap源码解读

我们不难看出HashMap是一个数组和链表结合的一个结构,只不过数组作为HashMap的主体,链表方式用来解决哈希冲突。(可以课下研究一下哈希表为什么会存在冲突)

我们来介绍几个重要的变量:

size:实际存储的key-value的个数;

threshold:阈值,通俗点讲就是临界值;

loadFactor:负载因子,table的填充度,默认值为0.75;

modCount:用于快速失败,HashMap的线程是不安全的,所以在其他线程操作时改变了HashMap的结构,就需要抛出异常;

HashMap源码解读

我们平时用的最多也就是HashMap的get/put方法了,所以下面就直接开始get/put的源码解读;

put方法:

先看几个代码片段,然后图片最后再做解释;

HashMap源码解读
HashMap源码解读
HashMap源码解读
HashMap源码解读

首先是判断了key是否为空,如果为空,执行了putForNullKey方法;在putForNullKey中直接存储value值;

如果key不为空,则根据hash方法计算key.hashCode,确保key-value的值能够散列均匀;

再后面,则是利用indexFor方法计算出要存储到table的准确位置下标;

之后的for循环中,查询了是否有相同的key值,如果有,则覆盖掉旧的value值,并且将旧的value值返回;

如果没有相同的key值,则执行了addEntry方法;

HashMap源码解读

在addEntry方法中,首先看到的是一个if,对size和threshold进行了比较,而且判断了计算出来的table元素是否为空;

如果条件成立,则证明需要size已经超过了临界值,并且即将发生哈希冲突,在这个时候,我们在源码中能够看出来利用了resize方法对table进行扩容至两倍;

HashMap源码解读
HashMap源码解读

在resize方法中,建立了一个新的table,并且将长度扩容到了原来的两倍;

之后再一系列的操作之后,利用transfer方法进行老数据的赋值,这个在过程在源码里面写的很清楚,可以自行阅读;

最后,执行了createEntry方法,由此才真正的添加了一个key-value,并且size++;

HashMap源码解读

这样,整个put方法才算结束;

相对的get方法就没这么复杂:

HashMap源码解读
HashMap源码解读

get方法只是使用了getEntry方法来返回value值,从源码中可以看出,其中使用的方法在put过程中也使用到了,所以在这就不一一解释了。

总结

01

HashMap中利用什么来获取当前对象所要存放table的下标?

答:利用hash方法将key.hashCode重新计算并处理,由此得到当前对象所要存放table的下标。

02

当两个key值被计算出在同一下标位置时,HashMap如何操作的?

答:这就证明已经出现了哈希冲突,在HashMap中是通过链表与数组结合来处理这个问题;

03

HashMap在什么时候最消耗性能?有什么解决方法吗?

答:在储存键值对数量大于临界值(阈值)时,因为在这种情况下会导致HashMap对自身数组进行扩容,其中还要针对每个元素进行重新获取添加,其中的复杂度会大大提高。

如果我们在实际业务当中可以得知当前HashMap要存键值对的数量,我们可以通过HashMap的构造方法进行初始化时对HashMap中的数组table进行长度赋值,而不是使用默认的16。