Python压缩包处理模块zipfile和py7zr操作代码

 更新时间:2022年06月26日 14:52:26   作者:ftzchina  
目前对文件的压缩和解压缩比较常用的格式就是zip格式和7z格式,这篇文章主要介绍了Python压缩包处理模块zipfile和py7zr,需要的朋友可以参考下

目前对文件的压缩和解压缩比较常用的格式就是zip格式和7z格式,今天就以一篇文章来融会贯通会该两个压缩文件格式的操作。

一:zipfile的常用操作

1,压缩文件

 zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])

         参数file表示文件的路径;参数mode指示打开zip文件的模式,有三种mode

  • 解压:r
  • 压缩:w
  • 追加压缩:a 

默认值为'r',表示读已经存在的zip文件,也可以为'w'或'a','w'表示新建一个zip文档或覆盖一个已经存在的zip文档,‘a’表示追加压缩

下面我们创建一个压缩文件result.zip,并压缩test文件夹下的所有文件

import zipfile
import os
 
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
z = zipfile.ZipFile(filename, 'w')  
for d in os.listdir(testdir):
	z.write(d)
	z.close

当然上面还可以用with的方法打开

import zipfile
import os
 
testdir = "D:\\DPI\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'w')  as z:
	for d in os.listdir(testdir):
		z.write(d)
		z.close

2,解压缩文件

import zipfile
import os
 
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r')  as z:
	z.extractall(testdir)

需要注意的是有些压缩包解压是有密码,这时候调用extractall的时候也支持输入密码,在python3中,解压文件的密码参数 pwd 接收的是二进制的值,所以要在前面加一个 b

z.extractall(testdir,pwd=b"ftz")

3,列出压缩包里的所有文件

import zipfile
import os
testdir = "D:\\DPI\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r')  as z:
	files = z.namelist()
	print(files)

运行结果如下,返回的是一个列表:

 4,其他常用的方法

import zipfile
import os
 
testdir = "D:\\ftz\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r')  as z:
	z.setpassword(b'ftz1')  #设置zip文档的密码。
	z.printdir()     #将zip文档内的信息打印到控制台上。
	data = z.read('file.yaml')  #获取zip文档内指定文件的二进制数据
	print(data) 
	info = z.getinfo('file.yaml')  #方法返回的是一个ZipInfo对象,表示zip文档中相应文件的信息。它支持如下属性
	print("获取文件名称:",info.filename)
	print("获取文件最后修改时间:",info.date_time)
	print("获取压缩类型:",info.compress_type)
	print("获取压缩后的大小:",info.compress_size)
	print("获取未压缩的文件大小:",info.file_size)
 
print("判断是否是压缩文件:",zipfile.is_zipfile(filename))

运行结果如下:

File Name                                             Modified             Size
data_yaml.yaml                                 2022-06-25 10:50:42          198
file.yaml                                      2022-06-25 10:13:46          123
vnfname.txt                                    2022-01-14 11:27:56         9320
b'\xe4\xb8\x80\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x98:\n    \xe4\xba\x8c\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x981:\n        b:1\n        c:2\n        a:3\n    \xe4\xba\x8c\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x982:\n        f:7\n        t:8\n        z:9'
获取文件名称: file.yaml
获取文件最后修改时间: (2022, 6, 25, 10, 13, 46)
获取压缩类型: 0
获取压缩后的大小: 123
获取未压缩的文件大小: 123
判断是否是压缩文件: True
[Finished in 0.2s]

当然getinfo也支持其他的属性,下面给出比较全的属性和方法

ZipInfo.filename: 获取文件名称。

ZipInfo.date_time: 获取文件最后修改时间。返回一个包含6个元素的元组:(年, 月, 日, 时, 分, 秒)

ZipInfo.compress_type: 压缩类型。

ZipInfo.comment: 文档说明。

ZipInfo.extr: 扩展项数据。

ZipInfo.create_system: 获取创建该zip文档的系统。

ZipInfo.create_version: 获取 创建zip文档的PKZIP版本。

ZipInfo.extract_version: 获取 解压zip文档所需的PKZIP版本。

ZipInfo.reserved: 预留字段,当前实现总是返回0。

ZipInfo.flag_bits: zip标志位。

ZipInfo.volume: 文件头的卷标。

ZipInfo.internal_attr: 内部属性。

ZipInfo.external_attr: 外部属性。

ZipInfo.header_offset: 文件头偏移位。

ZipInfo.CRC: 未压缩文件的CRC-32。

ZipInfo.compress_size: 获取压缩后的大小。

ZipInfo.file_size: 获取未压缩的文件大小。

 二:py7zr的常用操作

 1,压缩文件

import py7zr
 
with py7zr.SevenZipFile('target.7z', 'w') as archive:
    archive.writeall('/path/to/base_dir', 'base')

如果想设置密码压缩

import py7zr
 
with py7zr.SevenZipFile('target.7z', 'w', password='secret') as archive:
    archive.writeall('/path/to/base_dir', 'base')

2,解压缩文件

import py7zr
 
archive = py7zr.SevenZipFile('sample.7z', mode='r')
archive.extractall(path="/tmp")
archive.close()

也支持with模式

import py7zr
 
with py7zr.SevenZipFile('sample.7z', mode='r') as z:
    z.extractall()
 
with py7zr.SevenZipFile('target.7z', 'w') as z:
    z.writeall('./base_dir')

py7z也支持提取某个文件或者符合正则匹配的文件

import py7zr
import re
 
filter_pattern = re.compile(r'<your/target/file_and_directories/regex/expression>')
with SevenZipFile('archive.7z', 'r') as archive:
    allfiles = archive.getnames()
    selective_files = [f for f in allfiles if filter_pattern.match(f)]
    archive.extract(targets=selective_files)

支持解压缩加密的7z文件

import py7zr
 
with py7zr.SevenZipFile('encrypted.7z', mode='r', password='secret') as z:
    z.extractall()

到此这篇关于Python压缩包处理模块zipfile和py7zr的文章就介绍到这了,更多相关Python zipfile和py7zr压缩包模块内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python3实现全角和半角字符转换的方法示例

    python3实现全角和半角字符转换的方法示例

    在自然语言处理过程中,全角、半角的的不一致会导致信息抽取不一致,因此需要统一,下面这篇文章主要给大家介绍了关于python3中全角和半角字符转换的方法,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-09-09
  • Python装饰器重载内置的使用

    Python装饰器重载内置的使用

    本文主要介绍了Python装饰器重载内置的使用,详细介绍如何创建装饰器,如何使用装饰器来重载内置函数,具有一定的参考价值,感兴趣的可以了解一下
    2024-01-01
  • 关于fastapi异步框架操作的理解

    关于fastapi异步框架操作的理解

    这篇文章主要介绍了关于fastapi异步框架的操作,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • 详解Pytorch中的tensor数据结构

    详解Pytorch中的tensor数据结构

    torch.Tensor 是一种包含单一数据类型元素的多维矩阵,类似于 numpy 的 array,这篇文章主要介绍了Pytorch中的tensor数据结构,需要的朋友可以参考下
    2022-09-09
  • pycharm编写spark程序,导入pyspark包的3中实现方法

    pycharm编写spark程序,导入pyspark包的3中实现方法

    这篇文章主要介绍了pycharm编写spark程序,导入pyspark包的3中实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python将图片转换为字符画的方法

    Python将图片转换为字符画的方法

    这篇文章主要为大家详细介绍了Python将图片转换为字符画的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • Python实现归一化算法详情

    Python实现归一化算法详情

    这篇文章主要介绍了Python实现归一化算法,归一化算法Normalization将数据处理成量纲一直的数据,一般在进行建模的时候需要进行数据归一化处理,下文详细内容,需要的小伙伴可以参考一下
    2022-03-03
  • python3实现无权最短路径的方法

    python3实现无权最短路径的方法

    这篇文章主要介绍了python3实现无权最短路径的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05
  • python实现梯度下降算法

    python实现梯度下降算法

    这篇文章主要为大家详细介绍了python实现梯度下降算法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-08-08
  • Python中实现常量(Const)功能

    Python中实现常量(Const)功能

    这篇文章主要介绍了Python中实现常量(Const)功能,python语言本身没有提供const,本文使用一个类来实现常量定义功能,并介绍了使用方法,需要的朋友可以参考下
    2015-01-01

最新评论