C++ 中的 set 和 map 容器详细总结
1. 概述
C++ 标准模板库(STL)提供了多种关联容器,用于管理键值对和集合的数据。其中,set 和 map 是最常用的两种关联容器。set 用于存储唯一的元素集合,而 map 则用于存储键值对,其中每个键都是唯一的。它们都使用红黑树(自平衡二叉搜索树)作为底层实现,因此可以提供高效的插入、查找和删除操作。本文将详细介绍 set 和 map 容器的特点、使用方法、底层机制及其应用场景。
2. set 容器
2.1 什么是 set?
set 是一种关联容器,用于存储唯一的、有序的元素集合。与 vector 等序列容器不同,set 中的元素按一定顺序(通常为升序)存储,并且不允许重复元素。由于 set 使用红黑树实现,因此它的插入、查找和删除操作的时间复杂度为 O(log n)。
2.2 set 的特点
元素唯一性:set 中的元素必须是唯一的,不能有重复元素。有序性:set 中的元素默认按升序存储,用户可以自定义排序规则。高效的查找:set 提供高效的查找、插入和删除操作,时间复杂度为 O(log n)。自动排序:元素在插入时会自动按顺序排列。 2.3 set 的常用操作
插入元素:可以使用 insert() 函数将元素插入到 set 中。 #include <set>#include <iostream>int main() { std::set<int> s; s.insert(10); s.insert(5); s.insert(20); s.insert(10); // 重复元素不会插入 for (int val : s) { std::cout << val << " "; // 输出:5 10 20 } return 0;} 删除元素:可以使用 erase() 函数删除指定的元素。 s.erase(10); // 删除元素 10 查找元素:可以使用 find() 函数查找指定元素是否存在。 if (s.find(5) != s.end()) { std::cout << "元素 5 存在" << std::endl;} 获取大小:可以使用 size() 函数获取 set 中的元素个数。 std::cout << "Set 的大小: " << s.size() << std::endl; 2.4 set 的底层实现
set 的底层使用红黑树(自平衡二叉搜索树)实现。红黑树是一种平衡二叉树,保证在最坏情况下,插入、删除和查找的时间复杂度都是 O(log n)。在红黑树中,元素按照键值自动排序,因此 set 的插入操作不仅将元素添加到集合中,还会自动维护元素的顺序。
2.5 set 的应用场景
元素去重:set 常用于需要存储唯一元素的场景,例如从一个包含重复元素的集合中提取唯一值。有序数据存储:由于 set 中的元素是有序的,可以用于需要对数据进行排序并快速查找的场景。集合操作:set 可以用于实现集合的基本操作,如交集、并集和差集。 2.6 set 的优缺点
优点: 自动维护元素的唯一性。元素自动排序,查找效率高。 缺点: 插入和删除的效率比 unordered_set 稍低,因为需要维护平衡树结构。无法通过下标访问元素。 3. map 容器
3.1 什么是 map?
map 是一种关联容器,用于存储键值对(key-value)。每个键(key)都是唯一的,不能重复;而值(value)可以是相同的。map 的实现方式和 set 类似,也是基于红黑树。键值对中的键会自动按顺序排列,以便于快速查找、插入和删除。
3.2 map 的特点
键唯一性:map 中的键必须是唯一的,不能有重复键。有序性:map 中的键按一定顺序(默认升序)存储,用户可以自定义排序规则。键值对存储:map 存储的是键值对,每个键映射到一个值。高效的查找:map 提供高效的查找、插入和删除操作,时间复杂度为 O(log n)。 3.3 map 的常用操作
插入键值对:可以使用 insert() 或 operator[] 插入键值对。 #include <map>#include <iostream>int main() { std::map<int, std::string> m; m.insert({1, "one"}); m[2] = "two"; m[3] = "three"; for (const auto &pair : m) { std::cout << pair.first << ": " << pair.second << std::endl; } return 0;} 查找元素:可以使用 find() 函数查找指定键是否存在。 if (m.find(2) != m.end()) { std::cout << "键 2 存在,值为: " << m[2] << std::endl;} 删除元素:可以使用 erase() 函数删除指定的键值对。 m.erase(1); // 删除键为 1 的键值对 获取大小:可以使用 size() 函数获取 map 中的键值对数量。 std::cout << "Map 的大小: " << m.size() << std::endl; 3.4 map 的底层实现
map 的底层实现同样基于红黑树,这保证了键值对在插入时可以自动排序,同时支持高效的查找和删除操作。红黑树是一种平衡树,其高度大致保持在 log(n) 级别,因此能够确保操作的时间复杂度为 O(log n)。
3.5 map 的应用场景
键值对存储:map 非常适合用于需要以键值对方式存储数据的场景,如词频统计、数据表映射等。快速查找:map 提供高效的查找机制,适合用于需要根据键快速查找对应值的场景。排序数据存储:由于 map 中的键是有序的,它适合用于需要对数据按键进行排序的场景。 3.6 map 的优缺点
优点: 键唯一且有序,能够自动排序。提供高效的查找、插入和删除操作。 缺点: 插入和删除操作的效率比 unordered_map 略低,因为需要维护平衡树结构。无法通过下标直接访问键。 4. multiset 和 multimap
4.1 multiset
multiset 是 set 的变种,允许存储重复的元素。其底层实现也是基于红黑树,操作的时间复杂度同样为 O(log n)。
multiset 的常用操作
插入元素:与 set 类似,可以使用 insert() 函数插入元素。 std::multiset<int> ms;ms.insert(10);ms.insert(5);ms.insert(10); // 允许插入重复元素 删除元素:可以使用 erase() 函数删除元素,但它会删除所有等于该值的元素。 ms.erase(10); // 删除所有值为 10 的元素 4.2 multimap
multimap 是 map 的变种,允许多个相同的键映射到不同的值。其底层实现同样是基于红黑树。
multimap 的常用操作
插入键值对:可以使用 insert() 函数插入键值对。 std::multimap<int, std::string> mm;mm.insert({1, "one"});mm.insert({1, "uno"}); // 允许插入重复的键 查找元素:可以使用 equal_range() 函数获取具有相同键的元素范围。 auto range = mm.equal_range(1);for (auto it = range.first; it != range.second; ++it) { std::cout << it->first << ": " << it->second << std::endl;} 5. 无序容器:unordered_set 和 unordered_map
5.1 unordered_set
unordered_set 是一种哈希表实现的集合容器,与 set 不同,它不维护元素的顺序。unordered_set 提供常数时间复杂度的插入、删除和查找操作,但在最坏情况下,时间复杂度可能退化为 O(n)。
unordered_set 的特点
无序性:元素的存储顺序不固定。哈希表实现:底层使用哈希表,因此插入、删除和查找的平均时间复杂度为 O(1)。 5.2 unordered_map
unordered_map 是一种基于哈希表实现的关联容器,存储键值对,键是唯一的。它与 map 的区别在于,不维护键的顺序,查找、插入和删除操作的平均时间复杂度为 O(1)。
unordered_map 的特点
无序性:键的存储顺序不固定。哈希表实现:底层使用哈希表,因此查找、插入和删除的平均时间复杂度为 O(1)。 6. set、map 与无序容器的对比
6.1 有序与无序
set 和 map:存储的数据是有序的,适合需要保持元素排序的场景。unordered_set 和 unordered_map:存储的数据是无序的,适合只关心快速查找和插入的场景。 6.2 时间复杂度
set 和 map:插入、删除和查找操作的时间复杂度为 O(log n)。unordered_set 和 unordered_map:插入、删除和查找操作的平均时间复杂度为 O(1),但最坏情况下为 O(n)。 6.3 内存使用
set 和 map:由于使用红黑树实现,内存使用相对较高,但能保证数据有序。unordered_set 和 unordered_map:使用哈希表实现,内存使用较为紧凑,但在发生哈希冲突时性能会下降。 7. 示例代码总结
以下是一个完整的示例代码,展示了 set、map、multiset、multimap、unordered_set 和 unordered_map 的基本使用方法:
#include <iostream>#include <set>#include <map>#include <unordered_set>#include <unordered_map>#include <string>int main() { // set 示例 std::set<int> s = {1, 2, 3, 4, 5}; s.insert(6); s.erase(3); for (int val : s) { std::cout << "Set element: " << val << std::endl; } // map 示例 std::map<int, std::string> m; m[1] = "one"; m[2] = "two"; m[3] = "three"; m.erase(2); for (const auto &pair : m) { std::cout << "Map element: " << pair.first << ": " << pair.second << std::endl; } // unordered_set 示例 std::unordered_set<int> us = {10, 20, 30, 40}; us.insert(50); us.erase(20); for (int val : us) { std::cout << "Unordered_set element: " << val << std::endl; } // unordered_map 示例 std::unordered_map<int, std::string> um; um[1] = "apple"; um[2] = "banana"; um[3] = "cherry"; um.erase(1); for (const auto &pair : um) { std::cout << "Unordered_map element: " << pair.first << ": " << pair.second << std::endl; } return 0;} 8. 总结
C++ 中的 set 和 map 容器在数据管理和组织方面非常有用,它们基于红黑树实现,保证了数据的有序性和高效的查找、插入、删除操作。对于需要存储唯一且有序数据的场景,可以选择使用 set,而对于需要以键值对方式存储数据的场景,可以选择使用 map。在需要允许重复元素的情况下,可以使用 multiset 或 multimap。如果对元素的顺序没有要求且更关心操作效率,可以选择无序容器 unordered_set 和 unordered_map。根据具体的需求选择合适的容器,可以显著提升程序的性能和开发效率。