在Python中使用zlib模块进行数据压缩的教程

更新时间：2015年06月26日 12:15:20 作者：DarkBull

这篇文章主要介绍了在Python中使用zlib模块进行数据压缩的教程,是Python入门学习中的基础知识,需要的朋友可以参考下

Python标准模块中，有多个模块用于数据的压缩与解压缩，如zipfile，gzip, bz2等等。上次介绍了zipfile模块，今天就来讲讲zlib模块。
zlib.compress(string[, level])
zlib.decompress(string[, wbits[, bufsize]])

zlib.compress用于压缩流数据。参数string指定了要压缩的数据流，参数level指定了压缩的级别，它的取值范围是1到9。压缩速度与压缩率成反比，1表示压缩速度最快，而压缩率最低，而9则表示压缩速度最慢但压缩率最高。zlib.decompress用于解压数据。参数string指定了需要解压的数据，wbits和bufsize分别用于设置系统缓冲区大小(window buffer )与输出缓冲区大小(output buffer)。下面用一个例子来演示如何使用这两个方法：

#coding=gbk
 
import zlib, urllib
 
fp = urllib.urlopen('http://localhost/default.html')
str = fp.read()
fp.close()
 
#---- 压缩数据流。
str1 = zlib.compress(str, zlib.Z_BEST_COMPRESSION)
str2 = zlib.decompress(str1)
print len(str)
print len(str1)
print len(str2)
 
# ---- 结果
#5783
#1531
#5783

我们也可以使用Compress/Decompress对象来对数据进行压缩/解压缩。zlib.compressobj([level]) 与zlib.decompress(string[, wbits[, bufsize]]) 分别创建Compress/Decompress缩对象。通过对象对数据进行压缩和解压缩的使用方式与上面介绍的zlib.compress,zlib.decompress非常类似。但两者对数据的压缩还是有区别的，这主要体现在对大量数据进行操作的情况下。假如现在要压缩一个非常大的数据文件（上百M），如果使用zlib.compress来压缩的话，必须先一次性将文件里的数据读到内存里，然后将数据进行压缩。这样势必会战用太多的内存。如果使用对象来进行压缩，那么没有必要一次性读取文件的所有数据，可以先读一部分数据到内存里进行压缩，压缩完后写入文件，然后再读其他部分的数据压缩，如此循环重复，只到压缩完整个文件。下面一个例子来演示这之间的区别：

#coding=gbk
 
import zlib, urllib
 
fp = urllib.urlopen('http://localhost/default.html')  
# 访问的到的网址。
data = fp.read()
fp.close()
 
#---- 压缩数据流
str1 = zlib.compress(data, zlib.Z_BEST_COMPRESSION)
str2 = zlib.decompress(str1)
print '原始数据长度：', len(data)
print '-' * 30
print 'zlib.compress压缩后：', len(str1)
print 'zlib.decompress解压后：', len(str2)
print '-' * 30
 
#---- 使用Compress, Decompress对象对数据流进行压缩/解压缩
com_obj = zlib.compressobj(zlib.Z_BEST_COMPRESSION)
decom_obj = zlib.decompressobj()
 
str_obj = com_obj.compress(data)
str_obj += com_obj.flush()
print 'Compress.compress压缩后：', len(str_obj)
 
str_obj1 = decom_obj.decompress(str_obj)
str_obj1 += decom_obj.flush()
print 'Decompress.decompress解压后：', len(str_obj1)
print '-' * 30
 
#---- 使用Compress, Decompress对象，对数据进行分块压缩/解压缩。
com_obj1 = zlib.compressobj(zlib.Z_BEST_COMPRESSION)
decom_obj1 = zlib.decompressobj()
chunk_size = 30;
 
#原始数据分块
str_chunks = [data[i * chunk_size:(i + 1) * chunk_size] /
  for i in range((len(data) + chunk_size) / chunk_size)]
 
str_obj2 = ''
for chunk in str_chunks:
  str_obj2 += com_obj1.compress(chunk)
str_obj2 += com_obj1.flush()
print '分块压缩后：', len(str_obj2)
 
#压缩数据分块解压
str_chunks = [str_obj2[i * chunk_size:(i + 1) * chunk_size] /
  for i in range((len(str_obj2) + chunk_size) / chunk_size)]
str_obj2 = ''
for chunk in str_chunks:
  str_obj2 += decom_obj1.decompress(chunk)
str_obj2 += decom_obj1.flush()
print '分块解压后：', len(str_obj2)
 
# ---- 结果 ------------------------
原始数据长度： 5783
------------------------------
zlib.compress压缩后： 1531
zlib.decompress解压后： 5783
------------------------------
Compress.compress压缩后： 1531
Decompress.decompress解压后： 5783
------------------------------
分块压缩后： 1531
分块解压后： 5783

Python手册对zlib模块的介绍比较详细，更具体的应用，可以参考Python手册。

您可能感兴趣的文章:

Python
zlib

python2.7实现复制大量文件及文件夹资料
这篇文章主要为大家详细介绍了python2.7实现复制大量文件及文件夹资料，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-08-08
django2.0扩展用户字段示例
今天小编就为大家分享一篇关于django2.0扩展用户字段示例，小编觉得内容挺不错的，现在分享给大家，具有很好的参考价值，需要的朋友一起跟随小编来看看吧
2019-02-02
python基于隐马尔可夫模型实现中文拼音输入
这篇文章主要介绍了python基于隐马尔可夫模型实现中文拼音输入的相关资料,需要的朋友可以参考下
2016-04-04
python函数也可以是一个对象,可以存放在列表中并调用方式
这篇文章主要介绍了python函数也可以是一个对象,可以存放在列表中并调用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-02-02
Python使用reportlab将目录下所有的文本文件打印成pdf的方法
这篇文章主要介绍了Python使用reportlab将目录下所有的文本文件打印成pdf的方法,涉及reportlab模块操作pdf文件的相关技巧,需要的朋友可以参考下
2015-05-05
python opencv 图像边框(填充)添加及图像混合的实现方法（末尾实现类似幻灯片渐变的效果）
这篇文章主要介绍了python opencv 图像边框(填充)添加及图像混合（末尾实现类似幻灯片渐变的效果），本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2020-03-03
用python实现词云效果实例介绍
大家好，本篇文章主要讲的是用python实现词云效果实例介绍，感兴趣的同学赶快来看一看吧，对你有帮助的话记得收藏一下
2022-01-01
Python绘制七彩花朵(用Turtle)
这篇文章主要给大家介绍了关于Python使用Turtle绘制七彩花朵的相关资料,通过本文介绍的方法就算刚入门的朋友也可以很快的入手绘制出漂亮的七彩花朵,需要的朋友可以参考下
2023-07-07
Python编程实现二叉树及七种遍历方法详解
这篇文章主要介绍了Python编程实现二叉树及七种遍历方法,结合实例形式详细分析了Python二叉树的定义及常用遍历操作技巧,需要的朋友可以参考下
2017-06-06
pytorch模型的保存和加载、checkpoint操作
这篇文章主要介绍了pytorch模型的保存和加载、checkpoint操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-06-06

在Python中使用zlib模块进行数据压缩的教程

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具