一文带你深入探究Python Collections模块

更新时间：2023年11月10日 10:38:43 作者：郝同学的测开笔记

Python中Collections模块实现了一些专门化的容器,提供了对 Python 的通用内建容器 dict、list、set 和 tuple 的补充,下面我们就来了解一下它的具体用法吧

前言

这几天刷leetcode题时，看到题解中有这样一行代码collections.defaultdict(list)，不明白是啥意思，平时开发的脚本中未遇到，借着这个机会，学习一下collections模块的用法。

collections

这个模块实现了一些专门化的容器，提供了对 Python 的通用内建容器 dict、list、set 和 tuple 的补充。

defaultdict

defaultdict是dict（字典）的一个子类，它为字典操作中的缺失键提供了默认值。这在处理计数、分组等操作时非常有用。

案例：给定一个列表，将每个单词按首字母分组

import collections

mp = collections.defaultdict(list)

words = ['apple', 'banana', 'orange', 'pear', 'peach']
for word in words:
    mp[word[0]].append(word)

print(mp) # defaultdict(<class 'list'>, {'a': ['apple'], 'b': ['banana'], 'o': ['orange'], 'p': ['pear', 'peach']})

mp = collections.defaultdict(list)这行代码创建了一个defaultdict对象，其中list是指定的默认值类型。

这意味着当我们通过mp访问一个不存在的键时，defaultdict会自动创建这个键，并将其对应的值初始化为一个空列表。比如上面这段代码，我们在print(mp)前面增加mp['aa']，此时会输出defaultdict(<class 'list'>, {'a': ['apple'], 'b': ['banana'], 'o': ['orange'], 'p': ['pear', 'peach'], 'aa': []})

Counter

Counter是一个简单而强大的计数器工具，用于统计可迭代对象中各元素出现的次数。

案例：统计一个字符串中字符出现的次数

import collections

s = "abracadabra"
counter = collections.Counter(s)
print(counter) # 输出结果：Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

namedtuple

namedtuple创建了一个带字段名的元组类型，它可以对元组进行命名，使得代码更易读。

案例：创建一个表示坐标的数据结构

import collections

Point = collections.namedtuple('Point', ['x', 'y'])
p = Point(11, y=22)
print(p.x, p.y) # 输出结果：11 22

deque

deque是一个双向队列，可以在两端快速插入和删除元素，适用于需要高效地进行队列和栈操作的场景。

案例：使用deque实现一个简单的循环队列

import collections

q = collections.deque(maxlen=3)
q.append(1)
q.append(2)
q.append(3)
print(q)  # 输出结果：deque([1, 2, 3], maxlen=3)
q.append(4)
print(q)  # 输出结果：deque([2, 3, 4], maxlen=3)

OrderedDict

有序字典，保持元素被插入的顺序。

案例：实现LRU缓存：LRU（Least Recently Used）缓存是一种常见的缓存策略，当缓存满时，会淘汰最近最少使用的元素。OrderedDict可以很方便地实现LRU缓存，每次访问一个元素时，将其移到字典的末尾，这样最近访问的元素就会被保留，最早访问的元素就会被淘汰。

from collections import OrderedDict

class LRUCache:
    def __init__(self, capacity):
        self.capacity = capacity
        self.cache = OrderedDict()

    def get(self, key):
        if key in self.cache:
            value = self.cache[key]
            # 将访问的元素移到字典的末尾
            self.cache.move_to_end(key)
            return value
        else:
            return -1

    def put(self, key, value):
        if key in self.cache:
            # 如果key已经存在，将其移到字典的末尾
            self.cache.move_to_end(key)
        self.cache[key] = value
        if len(self.cache) > self.capacity:
            # 如果缓存已满，淘汰最早访问的元素
            self.cache.popitem(last=False)

ChainMap

在多个字典中查找某个键的值，可以使用ChainMap将这些字典组合成一个逻辑上的字典，从而方便地进行查找操作。

案例：使用ChainMap查找键的值：

from collections import ChainMap

dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}
dict3 = {'e': 5, 'f': 6}

chain_map = ChainMap(dict1, dict2, dict3)

value = chain_map['a']
print(value)  # 输出: 1

value = chain_map['c']
print(value)  # 输出: 3

UserDict

当需要创建一个自定义的字典类时，可以继承UserDict类，从而方便地实现自定义的字典功能。

案例：使用UserDict创建自定义字典类

from collections import UserDict

class MyDict(UserDict):
    def __setitem__(self, key, value):
        super().__setitem__(key, value * 2)

my_dict = MyDict()
my_dict['a'] = 1
my_dict['b'] = 2

print(my_dict)  # 输出: {'a': 2, 'b': 4}

UserList

当需要创建一个自定义的列表类时，可以继承UserList类，从而方便地实现自定义的列表功能。

案例：使用UserList创建自定义列表类

from collections import UserList

class MyList(UserList):
    def remove_duplicates(self):
        self.data = list(set(self.data))

my_list = MyList([1, 2, 2, 3, 4, 4, 5])
my_list.remove_duplicates()

print(my_list)  # 输出: [1, 2, 3, 4, 5]

UserString

当需要创建一个自定义的字符串类时，可以继承UserString类，从而方便地实现自定义的字符串功能。

案例：使用UserString创建自定义字符串类

from collections import UserString

class MyString(UserString):
    def remove_whitespace(self):
        self.data = self.data.replace(' ', '')

my_string = MyString('Hello World')
my_string.remove_whitespace()

print(my_string)  # 输出: HelloWorld

最后

这篇文章主要介绍了collections模块中几个常用数据结构的简单介绍和示例。使用这些数据结构能够让我们更加高效地处理各种实际问题，提高代码的可读性和可维护性。

以上就是一文带你深入探究Python Collections模块的详细内容，更多关于Python Collections的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python实现连接postgresql数据库的方法分析
这篇文章主要介绍了Python实现连接postgresql数据库的方法,结合实例形式分析了Python基于psycopg2和python3-postgresql链接postgresql数据库的相关操作技巧,需要的朋友可以参考下
2017-12-12
Python Celery异步任务队列使用方法解析
这篇文章主要介绍了Python Celery异步任务队列使用方法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-08-08
opencv+python实现均值滤波
这篇文章主要为大家详细介绍了opencv+python实现均值滤波，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-02-02
python暴力解压rar加密文件过程详解
这篇文章主要介绍了python解压rar加密文件过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-07-07
你所不知道的Python技巧13招【实用】
有时候你会看到很Cool的Python代码,你惊讶于它的简洁,你不由自主地赞叹：竟然还能这样写,其实,这些优雅的代码都要归功于Python的特性,只要你能掌握这些Pythonic的技巧,你一样可以写出像诗一样的Python代码,本文主要介绍Python应用的一些小技巧,一起来看下吧
2016-12-12
浅谈多卡服务器下隐藏部分 GPU 和 TensorFlow 的显存使用设置
这篇文章主要介绍了浅谈多卡服务器下隐藏部分 GPU 和 TensorFlow 的显存使用设置，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
Python学习之名字,作用域,名字空间(下)
这篇文章主要介绍了Python学习之名字,作用域,名字空间，紧接上一篇文章内容展开全文，需要的小伙伴可以参考一下，希望对你的学习有所帮助
2022-05-05
Opencv实现抠图背景图替换功能
这篇文章主要为大家详细介绍了Opencv实现抠图替换背景图，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-05-05
Python减少循环层次和缩进的技巧分析
这篇文章主要介绍了Python减少循环层次和缩进的技巧,结合实例形式较为详细的分析了Python优化代码跳出循环以减少循环层次的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2016-03-03
Python调用C语言的方法【基于ctypes模块】
这篇文章主要介绍了Python调用C语言的方法,涉及Python基于ctypes模块调用C语言编译后的动态链接库文件相关操作技巧,需要的朋友可以参考下
2018-01-01