hashmap原理

admin 2023年11月26日 19:03 38 0

HashMap是一种基于哈希表（Hash Table）实现的键值对（Key-Value）存储数据结构，它能够快速地根据键（Key）查询对应的值（Value），并且支持高效的插入、删除和更新操作，HashMap的实现原理主要包括哈希函数、桶（Bucket）和碰撞解决策略。

1. 哈希函数

哈希函数（Hash Function）的作用是将键（Key）映射到哈希表中一个唯一的索引位置，在HashMap中，哈希函数通过将键的二进制值进行一系列的位操作（如异或、移位和模运算等），计算出一个哈希码，作为该键在哈希表中的索引，哈希码是一个整数，通过它可以定位到哈希表中的具体位置。

2. 桶

桶（Bucket）是HashMap中的基本存储单元，在HashMap中，每个键都映射到一个桶上，而这个桶上可以存储一个或多个键值对，当两个或多个键经过哈希函数的计算得到的哈希码相同，即它们被映射到同一个桶上时，这种现象称为碰撞。

3. 碰撞解决策略

在HashMap中，当发生碰撞时，需要有一种策略来解决如何存储这些键值对，常见的碰撞解决策略有链地址法（Separate Chaining）和开放地址法（Open Addressing）。

a. 链地址法

链地址法是指在每个桶上维护一个链表，当发生碰撞时，将碰撞的键值对都存储在该桶对应的链表中，当查询一个键对应的值时，首先通过哈希函数计算出该键对应的桶，然后在该桶对应的链表中查找该键对应的值，链地址法具有较好的查询性能，但插入和删除操作可能会涉及到链表中的多个节点，因此性能相对较差。

b. 开放地址法

开放地址法是指在发生碰撞时，将碰撞的键值对存储在其它位置，根据处理碰撞的方式不同，开放地址法又可以分为以下几种：

i. 线性探测（Linear Probing）

线性探测是一种处理碰撞的策略，当发生碰撞时，按照一定的步长（如步长为1）依次探测下一个位置，直到找到一个空位为止，在插入和删除操作时，需要按照探测路径找到对应的节点，线性探测的优点是实现简单，但当哈希表的负载因子（已存储的键值对数量与桶的数量之比）较大时，性能较差。

ii. 二次探测（Quadratic Probing）

二次探测是线性探测的一种改进，它将步长设置为一个平方数（如1, 4, 9, 16, ...），使得探测路径更加均匀，二次探测的优点是在负载因子较高时，性能相对较好，但实现相对复杂。

iii. 双重哈希（Double Hashing）

双重哈希结合了链地址法和开放地址法的思想，它首先使用一个哈希函数将键映射到一个桶的索引，然后使用另一个哈希函数将索引映射到具体的位置，双重哈希可以减少碰撞的发生，但实现相对复杂。

4. 扩容和性能优化

随着键值对数量的增加，HashMap的性能会逐渐降低，这是因为在高负载情况下，碰撞的概率会增加，导致查询、插入和删除操作的性能下降，为了解决这个问题，HashMap会在必要时进行扩容，扩容会导致HashMap中的所有键值对重新计算哈希码并重新分布到新的桶中，扩容操作会带来一定的性能开销，但可以通过增加桶的数量来提高HashMap的性能。

5. HashMap的实现细节

在实际实现中，HashMap需要考虑许多细节来提高性能和减少冲突，为了提高查询性能，通常会使用一个数组来存储桶，而不是使用链表或其它数据结构，在处理碰撞时，不同的实现可能会选择不同的碰撞解决策略，Java中的HashMap通常使用链地址法来处理碰撞。

HashMap是一种基于哈希表实现的键值对存储数据结构，它通过哈希函数将键映射到桶上，并采用碰撞解决策略来处理碰撞，了解HashMap的原理可以帮助我们更好地理解和使用这个数据结构。