线性探测解决哈希冲突

  |  

摘要: 线性探测法

【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:算法题刷刷
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


哈希表在发生冲突时,有开散列法和闭散列法两种主流的处理方法。线性探测法是闭散列法中比较简单的一种。本文我们通过力扣 945,来看一下线性探测法的原理,此外本题还可以用计数排序解决。之后我们用线性探测法实现哈希表,也就是力扣 705 和 706。


$1 线性探测解决哈希冲突

给你一个整数数组 nums 。每次 move 操作将会选择任意一个满足 0 <= i < nums.length 的下标 i,并将 nums[i] 递增 1。

返回使 nums 中的每个值都变成唯一的所需要的最少操作次数。

提示:

1
2
1 <= nums.length <= 1e5
0 <= nums[i] <= 1e5

示例 1:
输入:nums = [1,2,2]
输出:1
解释:经过一次 move 操作,数组将变为 [1, 2, 3]。

示例 2:
输入:nums = [3,2,1,2,1,7]
输出:6
解释:经过 6 次 move 操作,数组将变为 [3, 4, 1, 2, 5, 7]。
可以看出 5 次或 5 次以下的 move 操作是不能让数组的每个值唯一的。

算法1:线性探测

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
class Solution {
public:
int minIncrementForUnique(vector<int>& A) {
if (A.empty()) return 0;
int res = 0;
// -1 表示空位
vector<int> pos(2e5, -1);
// 遍历每个数字 a 对其寻地址得到位置 b, b 比 a 的增量就是操作数。
for (int a: A)
{
int b = _findPos(a, pos);
res += b - a;
}
return res;
}

// 线性探测寻址(状态压缩)
int _findPos(int a, vector<int>& pos)
{
int b = pos[a];
if (b == -1)
{
// a 对应的位置 pos[a] 是空位,直接放入
pos[a] = a;
return a;
}
// 向后寻址,也就是线性探测的过程
b = _findPos(b + 1, pos);
pos[a] = b;
return b;
}
};

算法2:计数排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
class Solution {
public:
int minIncrementForUnique(vector<int>& A) {
int n = A.size();
if(n < 2) return 0;
int M = 1e5 + 5;
_countingsort(A, M);
int cur = A[0];
int res = 0;
for(int i = 1; i < n; ++i)
{
if(A[i] > cur)
cur = A[i];
else
{
res += cur - A[i] + 1;
++cur;
}
}
return res;
}

private:
void _countingsort(vector<int>& A, int M)
{
vector<int> cnt(M, 0);
for(int num: A) ++cnt[num];
int n = A.size();
int j = 0;
for(int i = 0; i < (int)cnt.size(); ++i)
{
int k = cnt[i];
while(k > 0)
{
A[j] = i;
++j;
--k;
}
if(j == n) break;
}
}
};

$2 闭散列表设计

这里我们用前一题中用到的线性探测法实现哈希表,主要看一下线性探测法在哈希表中时怎么用的。更好的闭散列表模板参考文章:【模板】哈希集合

705. 设计哈希集合

不使用任何内建的哈希表库设计一个哈希集合(HashSet)。

实现 MyHashSet 类:

  • void add(key) 向哈希集合中插入值 key 。
  • bool contains(key) 返回哈希集合中是否存在这个值 key 。
  • void remove(key) 将给定值 key 从哈希集合中删除。如果哈希集合中没有这个值,什么也不做。

提示:

1
2
0 <= key <= 1e6
最多调用 104 次 add、remove 和 contains

示例:
输入:
[“MyHashSet”, “add”, “add”, “contains”, “contains”, “add”, “contains”, “remove”, “contains”]
[[], [1], [2], [1], [3], [2], [2], [2], [2]]
输出:
[null, null, null, true, false, null, true, null, false]
解释:
MyHashSet myHashSet = new MyHashSet();
myHashSet.add(1); // set = [1]
myHashSet.add(2); // set = [1, 2]
myHashSet.contains(1); // 返回 True
myHashSet.contains(3); // 返回 False ,(未找到)
myHashSet.add(2); // set = [1, 2]
myHashSet.contains(2); // 返回 True
myHashSet.remove(2); // set = [1]
myHashSet.contains(2); // 返回 False ,(已移除)

代码 (C++)

注意:

1
const int N = 20011; // 10000 次操作

为什么定 20011 而不是 20001,原因是:

  1. 需要是质数。
  2. 距离 2^N 够远。
  3. 开成总数据量的 2 ~ 3 倍。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
class MyHashSet {
public:
/** Initialize your data structure here. */
MyHashSet() {
vec = vector<int>(N, -1);
}

void add(int key) {
int pos = hash(key);
while(pos < N && vec[pos] >= 0 && vec[pos] != key)
pos = (pos + 1) % N;
if(vec[pos] < 0)
vec[pos] = key;
}

void remove(int key) {
int pos = hash(key);
while(pos < N && vec[pos] != key && vec[pos] != -1)
pos = (pos + 1) % N;
if(vec[pos] == key)
vec[pos] = -2;
}

/** Returns true if this set contains the specified element */
bool contains(int key) {
int pos = hash(key);
while(pos < N && vec[pos] != key && vec[pos] != -1)
pos = (pos + 1) % N;
return vec[pos] == key;
}

private:
// 20011
// 为什么定 20011 而不是 20001,原因是
// 1. 需要是质数
// 2. 距离 2^N 够远
// 3. 开成总数据量的 2 ~ 3 倍
const int N = 20011; // 10000 次操作
vector<int> vec;

int hash(int x)
{
return x % N;
}
};

706. 设计哈希映射

不使用任何内建的哈希表库设计一个哈希映射(HashMap)。

实现 MyHashMap 类:

  • MyHashMap() 用空映射初始化对象
  • void put(int key, int value) 向 HashMap 插入一个键值对 (key, value) 。如果 key 已经存在于映射中,则更新其对应的值 value 。
  • int get(int key) 返回特定的 key 所映射的 value ;如果映射中不包含 key 的映射,返回 -1 。
  • void remove(key) 如果映射中存在 key 的映射,则移除 key 和它所对应的 value 。

提示:

1
2
0 <= key, value <= 1e6
最多调用 104 次 put、get 和 remove 方法

示例:
输入:
[“MyHashMap”, “put”, “put”, “get”, “get”, “put”, “get”, “remove”, “get”]
[[], [1, 1], [2, 2], [1], [3], [2, 1], [2], [2], [2]]
输出:
[null, null, null, 1, -1, null, 1, null, -1]
解释:
MyHashMap myHashMap = new MyHashMap();
myHashMap.put(1, 1); // myHashMap 现在为 [[1,1]]
myHashMap.put(2, 2); // myHashMap 现在为 [[1,1], [2,2]]
myHashMap.get(1); // 返回 1 ,myHashMap 现在为 [[1,1], [2,2]]
myHashMap.get(3); // 返回 -1(未找到),myHashMap 现在为 [[1,1], [2,2]]
myHashMap.put(2, 1); // myHashMap 现在为 [[1,1], [2,1]](更新已有的值)
myHashMap.get(2); // 返回 1 ,myHashMap 现在为 [[1,1], [2,1]]
myHashMap.remove(2); // 删除键为 2 的数据,myHashMap 现在为 [[1,1]]
myHashMap.get(2); // 返回 -1(未找到),myHashMap 现在为 [[1,1]]

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
class MyHashMap {
public:
/** Initialize your data structure here. */
MyHashMap() {
vec = vector<PII>(N, PII(-1, -1));
}

/** value will always be non-negative. */
void put(int key, int value) {
int pos = hash(key);
while(pos < N && vec[pos].first >= 0 && vec[pos].first != key)
pos = (pos + 1) % N;
vec[pos] = PII(key, value);
}

/** Returns the value to which the specified key is mapped, or -1 if this map contains no mapping for the key */
int get(int key) {
int pos = hash(key);
while(pos < N && vec[pos].first != -1 && vec[pos].first != key)
pos = (pos + 1) % N;
return vec[pos].second;
}

/** Removes the mapping of the specified value key if this map contains a mapping for the key */
void remove(int key) {
int pos = hash(key);
while(pos < N && vec[pos].first != -1 && vec[pos].first != key)
pos = (pos + 1) % N;
if(vec[pos].first == key)
vec[pos] = PII(-2, -1);
}

private:
const int N = 20011;
using PII = pair<int, int>;
vector<PII> vec;

int hash(int x)
{
return x % N;
}
};

Share