一文带你深入探究Python Collections模块
前言
这几天刷leetcode题时,看到题解中有这样一行代码collections.defaultdict(list)
,不明白是啥意思,平时开发的脚本中未遇到,借着这个机会,学习一下collections
模块的用法。
collections
这个模块实现了一些专门化的容器,提供了对 Python 的通用内建容器 dict
、list
、set
和 tuple
的补充。
defaultdict
defaultdict
是dict
(字典)的一个子类,它为字典操作中的缺失键提供了默认值。这在处理计数、分组等操作时非常有用。
案例:给定一个列表,将每个单词按首字母分组
import collections mp = collections.defaultdict(list) words = ['apple', 'banana', 'orange', 'pear', 'peach'] for word in words: mp[word[0]].append(word) print(mp) # defaultdict(<class 'list'>, {'a': ['apple'], 'b': ['banana'], 'o': ['orange'], 'p': ['pear', 'peach']})
mp = collections.defaultdict(list)
这行代码创建了一个defaultdict
对象,其中list
是指定的默认值类型。
这意味着当我们通过mp
访问一个不存在的键时,defaultdict
会自动创建这个键,并将其对应的值初始化为一个空列表。比如上面这段代码,我们在print(mp)
前面增加mp['aa']
,此时会输出defaultdict(<class 'list'>, {'a': ['apple'], 'b': ['banana'], 'o': ['orange'], 'p': ['pear', 'peach'], 'aa': []})
Counter
Counter
是一个简单而强大的计数器工具,用于统计可迭代对象中各元素出现的次数。
案例:统计一个字符串中字符出现的次数
import collections s = "abracadabra" counter = collections.Counter(s) print(counter) # 输出结果:Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})
namedtuple
namedtuple
创建了一个带字段名的元组类型,它可以对元组进行命名,使得代码更易读。
案例:创建一个表示坐标的数据结构
import collections Point = collections.namedtuple('Point', ['x', 'y']) p = Point(11, y=22) print(p.x, p.y) # 输出结果:11 22
deque
deque
是一个双向队列,可以在两端快速插入和删除元素,适用于需要高效地进行队列和栈操作的场景。
案例:使用deque实现一个简单的循环队列
import collections q = collections.deque(maxlen=3) q.append(1) q.append(2) q.append(3) print(q) # 输出结果:deque([1, 2, 3], maxlen=3) q.append(4) print(q) # 输出结果:deque([2, 3, 4], maxlen=3)
OrderedDict
有序字典,保持元素被插入的顺序。
案例:实现LRU缓存:LRU(Least Recently Used)缓存是一种常见的缓存策略,当缓存满时,会淘汰最近最少使用的元素。OrderedDict可以很方便地实现LRU缓存,每次访问一个元素时,将其移到字典的末尾,这样最近访问的元素就会被保留,最早访问的元素就会被淘汰。
from collections import OrderedDict class LRUCache: def __init__(self, capacity): self.capacity = capacity self.cache = OrderedDict() def get(self, key): if key in self.cache: value = self.cache[key] # 将访问的元素移到字典的末尾 self.cache.move_to_end(key) return value else: return -1 def put(self, key, value): if key in self.cache: # 如果key已经存在,将其移到字典的末尾 self.cache.move_to_end(key) self.cache[key] = value if len(self.cache) > self.capacity: # 如果缓存已满,淘汰最早访问的元素 self.cache.popitem(last=False)
ChainMap
在多个字典中查找某个键的值,可以使用ChainMap将这些字典组合成一个逻辑上的字典,从而方便地进行查找操作。
案例:使用ChainMap查找键的值:
from collections import ChainMap dict1 = {'a': 1, 'b': 2} dict2 = {'c': 3, 'd': 4} dict3 = {'e': 5, 'f': 6} chain_map = ChainMap(dict1, dict2, dict3) value = chain_map['a'] print(value) # 输出: 1 value = chain_map['c'] print(value) # 输出: 3
UserDict
当需要创建一个自定义的字典类时,可以继承UserDict类,从而方便地实现自定义的字典功能。
案例:使用UserDict创建自定义字典类
from collections import UserDict class MyDict(UserDict): def __setitem__(self, key, value): super().__setitem__(key, value * 2) my_dict = MyDict() my_dict['a'] = 1 my_dict['b'] = 2 print(my_dict) # 输出: {'a': 2, 'b': 4}
UserList
当需要创建一个自定义的列表类时,可以继承UserList类,从而方便地实现自定义的列表功能。
案例:使用UserList创建自定义列表类
from collections import UserList class MyList(UserList): def remove_duplicates(self): self.data = list(set(self.data)) my_list = MyList([1, 2, 2, 3, 4, 4, 5]) my_list.remove_duplicates() print(my_list) # 输出: [1, 2, 3, 4, 5]
UserString
当需要创建一个自定义的字符串类时,可以继承UserString类,从而方便地实现自定义的字符串功能。
案例:使用UserString创建自定义字符串类
from collections import UserString class MyString(UserString): def remove_whitespace(self): self.data = self.data.replace(' ', '') my_string = MyString('Hello World') my_string.remove_whitespace() print(my_string) # 输出: HelloWorld
最后
这篇文章主要介绍了collections
模块中几个常用数据结构的简单介绍和示例。使用这些数据结构能够让我们更加高效地处理各种实际问题,提高代码的可读性和可维护性。
以上就是一文带你深入探究Python Collections模块的详细内容,更多关于Python Collections的资料请关注脚本之家其它相关文章!
相关文章
浅谈多卡服务器下隐藏部分 GPU 和 TensorFlow 的显存使用设置
这篇文章主要介绍了浅谈多卡服务器下隐藏部分 GPU 和 TensorFlow 的显存使用设置,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2020-06-06
最新评论