2.5 哈希表

哈希表的定义

::: info 定义 哈希表（Hash Table） ：也叫做散列表。是根据关键码值（Key Value）直接进行访问的数据结构。 :::

哈希表通过 键 key 和 映射函数 Hash(key) 计算出对应的 值 value ，把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做 哈希函数（散列函数） ，存放记录的数组叫做 哈希表（散列表） 。

哈希表的两个核心问题是：哈希函数设计 和 哈希冲突解决 。

哈希函数

::: info 定义哈希函数是将哈希表中元素的关键键值映射为元素存储位置的函数。 :::

哈希函数是哈希表中最重要的部分一般来说，哈希函数会满足以下几个条件：

哈希函数应该易于计算，并且尽量使计算出来的索引值均匀分布；
哈希函数计算得到的哈希值是一个固定长度的非负整数；
如果 key1 = key2，那 hash(key1) == hash(key2)；
如果 key1 ≠ key2，那 hash(key1) ≠ hash(key2)；

常用的哈希函数方法有：直接定址法、除留余数法、平方取中法、基数转换法。

哈希冲突

::: info 定义 哈希冲突（Hash Collision） ：不同的关键字通过同一个哈希函数可能得到同一哈希地址，即 key1 ≠ key2，而 Hash(key1) = Hash(key2)，这种现象称为哈希冲突。 :::

在真实的情况下，要想找到一个不同的key对应的哈希值都不一样的哈希函数，几乎是不可能的。即便像业界著名的 MD5、SHA、CRC 等哈希算法，也无法完全避免这种 哈希冲突。

解决哈希冲突问题常用的方法有两类，开放寻址法（open addressing）和链表法（chaining）。

开放寻址法

开放寻址法的核心思想是，如果出现了哈希冲突，就重新探测一个空闲位置，将其插入。

以线性探测为例，往哈希表中插入数据时，如果某个数据经过哈希函数哈希之后，存储位置已经被占用了，就从当前位置开始，依次往后查找，看是否有空闲位置，直到找到为止。

当发现哈希值 h 处产生冲突时，从 h 出发，不断地检查 h+1,h+2,h+3,… 这些整数对应的位置。

链表法

链表法的核心思想是，为每个哈希值维护一个链表，并将具有相同哈希值的元素都放入这一链表当中。

链表法是一种更加常用的哈希冲突解决方法。相比于开放地址法，链地址法更加简单。

哈希表的实现

哈希集合

:::: md-demo 相关题目

📌 705. 设计哈希集合 - LeetCode

💻 题目大意

不使用任何内建的哈希表库设计一个哈希集合（HashSet）。

实现 MyHashSet 类：

void add(key) 向哈希集合中插入值 key 。
bool contains(key) 返回哈希集合中是否存在这个值 key 。
void remove(key) 将给定值 key 从哈希集合中删除。如果哈希集合中没有这个值，什么也不做。

示例：

MyHashSet myHashSet = new MyHashSet();
myHashSet.add(1);      // set = [1]
myHashSet.add(2);      // set = [1, 2]
myHashSet.contains(1); // return True
myHashSet.contains(3); // return False, (not found)
myHashSet.add(2);      // set = [1, 2]
myHashSet.contains(2); // return True
myHashSet.remove(2);   // set = [1]
myHashSet.contains(2); // return False, (already removed)

说明：

0 <= key <= 10^6;
最多调用 10^4 次 add、remove 和 contains;

💡 解题思路

链地址法：

设哈希表的大小为 base，则可以设计一个简单的哈希函数：hash(x) = x mod base；
开辟一个大小为 base 的数组，数组的每个位置是一个链表。当计算出哈希值之后，就插入到对应位置的链表当中；
由于使用整数除法作为哈希函数，为了尽可能避免冲突，应当将 base 取为一个质数，如 base = 769；

时间复杂度：O(n / b)。其中 n 为哈希表中的元素数量，b 为链表的数量，假设哈希值是均匀分布的，则每个链表大概长度为 n / b；
空间复杂度：O(n+b)。

💎 代码

class MyHashSet {
	constructor() {
		this.base = 769;
		this.data = new Array(this.base).fill(0).map(() => new Array());
	}

	// @param {number} key
	// @return {number}
	hash(key) {
		return key % this.base;
	}

	// @param {number} key
	// @return {void}
	add(key) {
		const h = this.hash(key);
		for (let item of this.data[h]) {
			if (item === key) return;
		}
		this.data[h].push(key);
	}

	// @param {number} key
	// @return {void}
	remove(key) {
		const h = this.hash(key);
		const hList = this.data[h];
		for (let i = 0; i < hList.length; i++) {
			if (hList[i] === key) {
				hList.splice(i, 1);
				return;
			}
		}
	}

	// @param {number} key
	// @return {boolean}
	contains(key) {
		const h = this.hash(key);
		for (let item of this.data[h]) {
			if (item === key) return true;
		}
		return false;
	}
}

/**
 * Your MyHashSet object will be instantiated and called as such:
 * var obj = new MyHashSet()
 * obj.add(key)
 * obj.remove(key)
 * var param_3 = obj.contains(key)
 */

::::

哈希映射

:::: md-demo 相关题目

📌 706. 设计哈希映射 - LeetCode

💻 题目大意

不使用任何内建的哈希表库设计一个哈希映射（HashMap）。

实现 MyHashMap 类：

MyHashMap() 用空映射初始化对象
void put(int key, int value) 向 HashMap 插入一个键值对 (key, value) 。如果 key 已经存在于映射中，则更新其对应的值 value 。
int get(int key) 返回特定的 key 所映射的 value ；如果映射中不包含 key 的映射，返回 -1 。
void remove(key) 如果映射中存在 key 的映射，则移除 key 和它所对应的 value 。

示例：

MyHashMap myHashMap = new MyHashMap();
myHashMap.put(1, 1); // The map is now [[1,1]]
myHashMap.put(2, 2); // The map is now [[1,1], [2,2]]
myHashMap.get(1);    // return 1, The map is now [[1,1], [2,2]]
myHashMap.get(3);    // return -1 (i.e., not found), The map is now [[1,1], [2,2]]
myHashMap.put(2, 1); // The map is now [[1,1], [2,1]] (i.e., update the existing value)
myHashMap.get(2);    // return 1, The map is now [[1,1], [2,1]]
myHashMap.remove(2); // remove the mapping for 2, The map is now [[1,1]]
myHashMap.get(2);    // return -1 (i.e., not found), The map is now [[1,1]]

说明：

0 <= key, value <= 10^6
最多调用 10^4 次 put、get 和 remove;

💡 解题思路

链地址法，「设计哈希映射」与「设计哈希集合」解法接近，唯一的区别在于存储的不是 key 本身，而是 (key,value) 对，其他代码都一样。

💎 代码

class MyHashMap {
	constructor() {
		this.base = 769;
		this.data = new Array(this.base).fill(0).map(() => new Array());
	}

	// @param {number} key
	// @return {number}
	hash(key) {
		return key % this.base;
	}

	// @param {number} key
	// @param {number} value
	// @return {void}
	put(key, value) {
		const h = this.hash(key);
		for (let item of this.data[h]) {
			if (item[0] === key) {
				item[1] = value;
				return;
			}
		}
		this.data[h].push([key, value]);
	}

	// @param {number} key
	// @return {number}
	get(key) {
		const h = this.hash(key);
		for (let item of this.data[h]) {
			if (item[0] === key) return item[1];
		}
		return -1;
	}

	// @param {number} key
	// @return {void}
	remove(key) {
		const h = this.hash(key);
		const hList = this.data[h];
		for (let i = 0; i < hList.length; i++) {
			if (hList[i][0] === key) {
				hList.splice(i, 1);
				return;
			}
		}
	}
}
/**
 * Your MyHashMap object will be instantiated and called as such:
 * var obj = new MyHashMap()
 * obj.put(key,value)
 * var param_2 = obj.get(key)
 * obj.remove(key)
 */

::::

JavaScript Set

::: info 定义 Set 是 ES6 新提供的数据结构，它类似于数组，但是成员的值都是唯一的，没有重复的值。 :::

Set本身是一个构造函数，用来生成 Set 数据结构。Set函数可以接受一个数组（或者具有 iterable 接口的其他数据结构）作为参数，用来初始化。

向 Set 加入值的时候，不会发生类型转换，所以5和"5"是两个不同的值。但两个对象总是不相等的，如例三，由于两个空对象不相等，所以它们被视为两个值。

// eg1：数组
const set = new Set([1, 2, 3, 4, 4]);
[...set] // [1, 2, 3, 4]
set.size // 4

// eg2：字符串
[...new Set('ababbc')].join('') // "abc"

// eg3：对象
let set3 = new Set();
set3.add({});
set3.size // 1
set3.add({});
set3.size // 2

判断是否包括一个键，Object 结构和 Set 结构写法的不同。

// 对象的写法
const properties = {
	width: 1,
	height: 1
};

if (properties[someName]) {
	// do something
}

// Set的写法
const properties = new Set();

properties.add('width');
properties.add('height');

if (properties.has(someName)) {
	// do something
}

属性和方法

Set 结构的实例有以下属性：

constructor：构造函数，默认就是Set函数。
size：返回Set实例的成员总数。

Set 实例的方法分为两大类：操作方法（用于操作数据）和遍历方法（用于遍历成员）。

操作方法：
- add(value)：添加某个值，返回 Set 结构本身；
- delete(value)：删除某个值，返回一个布尔值，表示删除是否成功；
- has(value)：返回一个布尔值，表示该值是否为Set的成员；
- clear()：清除所有成员，没有返回值；
遍历方法：
- keys()：返回键名的遍历器；
- values()：返回键值的遍历器；
- entries()：返回键值对的遍历器；
- forEach()：使用回调函数遍历每个成员；

需要特别指出的是，Set的遍历顺序就是插入顺序。这个特性有时非常有用，比如使用 Set 保存一个回调函数列表，调用时就能保证按照添加顺序调用。

由于 Set 结构没有键名，只有键值（或者说键名和键值是同一个值），所以keys方法和values方法的行为完全一致。

Set 的应用

1. 数组去重

利用 Set 成员唯一的特点，可以去除数组重复成员。

将数组作为参数初始化 Set ，再利用Array.from()方法将 Set 结构转为数组。扩展运算符（...）内部使用for...of循环，所以也可以用于 Set 结构。

// 去除数组的重复成员
let set = new Set(['red', 'green', 'blue', 'green']);
let arr = [...set];
// ['red', 'green', 'blue']

let arr2 = Array.from(set);
// ['red', 'green', 'blue']

上面的方法也可以用于，去除字符串里面的重复字符。

[...new Set('ababbc')].join('');
// "abc"

2. 求并集、交集和差集

将数组的map和filter方法间接用于 Set ，可以很容易地实现并集（Union）、交集（Intersect）和差集（Difference）。

let set = new Set([1, 2, 3]);
set = new Set([...set].map((x) => x * 2));
// 返回Set结构：{2, 4, 6}

let set = new Set([1, 2, 3, 4, 5]);
set = new Set([...set].filter((x) => x % 2 == 0));
// 返回Set结构：{2, 4}

let a = new Set([1, 2, 3]);
let b = new Set([4, 3, 2]);

// 并集
let union = new Set([...a, ...b]);
// Set {1, 2, 3, 4}

// 交集
let intersect = new Set([...a].filter((x) => b.has(x)));
// set {2, 3}

// （a 相对于 b 的）差集
let difference = new Set([...a].filter((x) => !b.has(x)));
// Set {1}

3. 改变原 Set 结构

如果想在遍历操作中，同步改变原来的 Set 结构，目前没有直接的方法，但有两种变通方法。一种是利用原 Set 结构映射出一个新的结构，然后赋值给原来的 Set 结构；另一种是利用Array.from方法。

// 方法一
let set = new Set([1, 2, 3]);
set = new Set([...set].map((val) => val * 2));
// set的值是2, 4, 6

// 方法二
let set = new Set([1, 2, 3]);
set = new Set(Array.from(set, (val) => val * 2));
// set的值是2, 4, 6

JavaScript Map

::: info 定义 Map 是 ES6 新提供的数据结构，它类似于对象，也是键值对的集合，但是“ 键 ”的范围不限于字符串，各种类型的值 （包括对象）都可以当作键。 :::

JavaScript 的对象（Object），本质上是键值对的集合（Hash 结构），但是传统上只能用字符串当作键，这给它的使用带来了很大的限制。

为了解决这个问题，ES6 提供了 Map 数据结构。Map也是键值对的集合，但是各种类型的值都可以当作键。Object 结构提供了“字符串—值”的对应，Map 结构提供了“值—值”的对应，是一种更完善的 Hash 结构实现。

作为构造函数，Map 可以接受一个数组作为参数。该数组的成员是一个个表示键值对的数组。除了数组，任何具有 Iterator 接口、且每个成员都是一个双元素的数组的数据结构都可以当作Map构造函数的参数。这就是说，Set和Map都可以用来生成新的 Map。

如果 Map 的键是一个简单类型的值（数字、字符串、布尔值），则只要两个值严格相等，Map 将其视为一个键，比如0和-0就是一个键，布尔值true和字符串true则是两个不同的键。另外，undefined和null也是两个不同的键。虽然NaN不严格相等于自身，但 Map 将其视为同一个键。

如果 Map 的键是对象，只有对同一个对象的引用，Map 结构才将其视为同一个键。Map 的键实际上是跟内存地址绑定的，只要内存地址不一样，就视为两个键。

// 用数组初始化
const map = new Map([
	['name', '张三'],
	['title', 'Author']
]);

// 用 Set 初始化
const set = new Set([
	['foo', 1],
	['bar', 2]
]);
const m1 = new Map(set);
m1.get('foo'); // 1

// 用 Map 初始化
const m2 = new Map([['baz', 3]]);
const m3 = new Map(m2);
m3.get('baz'); // 3

// 键值为数字
map.set(-0, 123);
map.get(+0); // 123

// 键值为布尔值
map.set(true, 1);
map.set('true', 2);
map.get(true); // 1

// 键值为undefined null
map.set(undefined, 3);
map.set(null, 4);
map.get(undefined); // 3

// 键值为NaN
map.set(NaN, 123);
map.get(NaN); // 123

// 键值为对象
// 非同一个数组实例，内存地址不一样
map.set(['a'], 555);
map.get(['a']); // undefined

属性和方法

Map 结构的实例有以下属性：

constructor：构造函数，默认就是Map函数。
size：返回Map实例的成员总数。

Map 实例的方法分为两大类：操作方法（用于操作数据）和遍历方法（用于遍历成员）。

操作方法：
- set(key, value)：设置键名key对应的键值为value，返回 Map 结构本身，如果key已经有值，则键值会被更新，否则就新生成该键；
- get(key)：读取key对应的键值，如果找不到key，返回undefined；
- delete(value)：删除某个键，返回true，如果删除失败，返回false；
- has(value)：返回一个布尔值，表示某个键是否在当前 Map 对象之中；
- clear()：清除所有成员，没有返回值；
遍历方法：
- keys()：返回键名的遍历器；
- values()：返回键值的遍历器；
- entries()：返回键值对的遍历器；
- forEach()：使用回调函数遍历每个成员；

需要特别注意的是，Map 的遍历顺序就是插入顺序。

数据结构的互相转换

1. Map 转为数组

Map 转为数组最方便的方法，就是使用扩展运算符（...）。

const myMap = new Map().set(true, 7).set({ foo: 3 }, ["abc"]);
[...myMap];
// [ [ true, 7 ], [ { foo: 3 }, [ 'abc' ] ] ]

[...myMap.keys()]
// [true, { foo: 3 }]

[...map.values()]
// [7, [ 'abc' ]]

结合数组的map方法、filter方法，可以实现 Map 的遍历和过滤（Map 本身没有map和filter方法）。Map 有一个forEach方法，与数组的forEach方法类似，也可以实现遍历

const map0 = new Map().set(1, 'a').set(2, 'b').set(3, 'c');

const map1 = new Map([...map0].filter(([k, v]) => k < 3));
// 产生 Map 结构 {1 => 'a', 2 => 'b'}

const map2 = new Map([...map0].map(([k, v]) => [k * 2, '_' + v]));
// 产生 Map 结构 {2 => '_a', 4 => '_b', 6 => '_c'}

map.forEach(function (value, key, map) {
	console.log('Key: %s, Value: %s', key, value);
});

2. 数组转为 Map

将数组传入 Map 构造函数，就可以转为 Map。

new Map([
	[true, 7],
	[{ foo: 3 }, ['abc']]
]);
// Map {
//   true => 7,
//   Object {foo: 3} => ['abc']
// }

3. Map 转为对象

如果所有 Map 的键都是字符串，它可以无损地转为对象。

function strMapToObj(strMap) {
	let obj = Object.create(null);
	for (let [k, v] of strMap) {
		obj[k] = v;
	}
	return obj;
}

const myMap = new Map().set('yes', true).set('no', false);
strMapToObj(myMap);
// { yes: true, no: false }

如果有非字符串的键名，那么这个键名会被转成字符串，再作为对象的键名。

4. 对象转为 Map

对象转为 Map 可以通过Object.entries()。

let obj = { a: 1, b: 2 };
let map = new Map(Object.entries(obj));

此外，也可以自己实现一个转换函数。

function objToStrMap(obj) {
	let strMap = new Map();
	for (let k of Object.keys(obj)) {
		strMap.set(k, obj[k]);
	}
	return strMap;
}

objToStrMap({ yes: true, no: false });
// Map {"yes" => true, "no" => false}

5. Map 转为 JSON

Map 转为 JSON 要区分两种情况。一种情况是，Map 的键名都是字符串，这时可以选择转为对象 JSON。

function strMapToJson(strMap) {
	return JSON.stringify(strMapToObj(strMap));
}

let myMap = new Map().set('yes', true).set('no', false);
strMapToJson(myMap);
// '{"yes":true,"no":false}'

另一种情况是，Map 的键名有非字符串，这时可以选择转为数组 JSON。

function mapToArrayJson(map) {
	return JSON.stringify([...map]);
}

let myMap = new Map().set(true, 7).set({ foo: 3 }, ['abc']);
mapToArrayJson(myMap);
// '[[true,7],[{"foo":3},["abc"]]]'

6. JSON 转为 Map

JSON 转为 Map，正常情况下，所有键名都是字符串。

function jsonToStrMap(jsonStr) {
	return objToStrMap(JSON.parse(jsonStr));
}

jsonToStrMap('{"yes": true, "no": false}');
// Map {'yes' => true, 'no' => false}

但是，有一种特殊情况，整个 JSON 就是一个数组，且每个数组成员本身，又是一个有两个成员的数组。这时，它可以一一对应地转为 Map。这往往是 Map 转为数组 JSON 的逆操作。

function jsonToMap(jsonStr) {
	return new Map(JSON.parse(jsonStr));
}

jsonToMap('[[true,7],[{"foo":3},["abc"]]]');
// Map {true => 7, Object {foo: 3} => ['abc']}

题号	标题	题解	标签	难度
705	设计哈希集合	[✓]	`设计` `数组` `哈希表` `2+`	Easy
706	设计哈希映射	[✓]	`设计` `数组` `哈希表` `2+`	Easy
217	存在重复元素	[✓]	`数组` `哈希表` `排序`	Easy
219	存在重复元素 II	[✓]	`数组` `哈希表` `滑动窗口`	Easy
220	存在重复元素 III		`数组` `桶排序` `有序集合` `2+`	Hard
1941	检查是否所有字符出现次数相同		`哈希表` `字符串` `计数`	Easy
136	只出现一次的数字	[✓]	`位运算` `数组`	Easy
383	赎金信	[✓]	`哈希表` `字符串` `计数`	Easy
349	两个数组的交集		`数组` `哈希表` `双指针` `2+`	Easy
350	两个数组的交集 II		`数组` `哈希表` `双指针` `2+`	Easy
36	有效的数独	[✓]	`数组` `哈希表` `矩阵`	Medium
1	两数之和	[✓]	`数组` `哈希表`	Easy
15	三数之和	[✓]	`数组` `双指针` `排序`	Medium
18	四数之和	[✓]	`数组` `双指针` `排序`	Medium
454	四数相加 II		`数组` `哈希表`	Medium
41	缺失的第一个正数	[✓]	`数组` `哈希表`	Hard
128	最长连续序列	[✓]	`并查集` `数组` `哈希表`	Medium
202	快乐数	[✓]	`哈希表` `数学` `双指针`	Easy
242	有效的字母异位词	[✓]	`哈希表` `字符串` `排序`	Easy
205	同构字符串	[✓]	`哈希表` `字符串`	Easy
442	数组中重复的数据	[✓]	`数组` `哈希表`	Medium
剑指 Offer 61	扑克牌中的顺子	[✓]	`数组` `排序`	Easy
268	丢失的数字	[✓]	`位运算` `数组` `哈希表` `3+`	Easy
剑指 Offer 3	数组中重复的数字	[✓]	`数组` `哈希表` `排序`	Easy
451	根据字符出现频率排序	[✓]	`哈希表` `字符串` `桶排序` `3+`	Medium
49	字母异位词分组	[✓]	`数组` `哈希表` `字符串` `1+`	Medium
599	两个列表的最小索引总和		`数组` `哈希表` `字符串`	Easy
387	字符串中的第一个唯一字符		`队列` `哈希表` `字符串` `1+`	Easy
447	回旋镖的数量		`数组` `哈希表` `数学`	Medium
149	直线上最多的点数	[✓]	`几何` `数组` `哈希表` `1+`	Hard
359	日志速率限制器 🔒		`设计` `哈希表` `数据流`	Easy
811	子域名访问计数		`数组` `哈希表` `字符串` `1+`	Medium

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

hash.md

hash.md

2.5 哈希表

哈希表的定义

哈希函数

哈希冲突

开放寻址法

链表法

哈希表的实现

哈希集合

📌 705. 设计哈希集合 - LeetCode

💻 题目大意

💡 解题思路

💎 代码

哈希映射

📌 706. 设计哈希映射 - LeetCode

💻 题目大意

💡 解题思路

💎 代码

JavaScript Set

属性和方法

Set 的应用

1. 数组去重

2. 求并集、交集和差集

3. 改变原 Set 结构

JavaScript Map

属性和方法

数据结构的互相转换

1. Map 转为数组

2. 数组转为 Map

3. Map 转为对象

4. 对象转为 Map

5. Map 转为 JSON

6. JSON 转为 Map

相关题目

Files

hash.md

Latest commit

History

hash.md

File metadata and controls

2.5 哈希表

哈希表的定义

哈希函数

哈希冲突

开放寻址法

链表法

哈希表的实现

哈希集合

📌 705. 设计哈希集合 - LeetCode

💻 题目大意

💡 解题思路

💎 代码

哈希映射

📌 706. 设计哈希映射 - LeetCode

💻 题目大意

💡 解题思路

💎 代码

JavaScript Set

属性和方法

Set 的应用

1. 数组去重

2. 求并集、交集和差集

3. 改变原 Set 结构

JavaScript Map

属性和方法

数据结构的互相转换

1. Map 转为数组

2. 数组 转为 Map

3. Map 转为对象

4. 对象转为 Map

5. Map 转为 JSON

6. JSON 转为 Map

相关题目

2. 数组转为 Map