Python使用fliecmp实现比较文件的操作

 更新时间:2021年06月07日 10:45:35   作者:一天一篇Python库  
对于文件的比较一般有几种,比如比较文件的内容,比较文件的大小,或者直接对比整个项目文件,本文就详细的介绍这些方法的实现,感兴趣的可以了解一下

前言

对于文件的比较一般有几种,比如比较文件的内容,比较文件的大小,或者直接对比整个项目文件。特别是在项目的更新迭代中,可以通过该库来比较当前版本与之前版本有哪些文件不同。

所以,本篇将详细讲解Python的文件比较库:filecmp。

生成示例文件

在比较文件之前,我们首先需要有用于比较的文件。所以,为了后面的测试,我们先来创建一些文件。示例如下:

def mkfile(filename,content):
    with open(filename,'w') as f:
        f.write(content or filename)
    return

mkfile('filecmps/one.txt','1212121212')
mkfile('filecmps/two.txt','1212121212')
mkfile('filecmps/three.txt','333333333')

这里,我们先创建3个文件,其中2个文件的内容相等。

cmp()(比较文件)

fliecmp库提供了cmp()函数用于比较文件系统上的两个文件。示例如下:

import filecmp

print(filecmp.cmp('filecmps/one.txt', 'filecmps/two.txt', shallow=False))
print(filecmp.cmp('filecmps/one.txt', 'filecmps/three.txt', shallow=False))
print(filecmp.cmp('filecmps/one.txt', 'filecmps/two.txt'))
print(filecmp.cmp('filecmps/one.txt', 'filecmps/one.txt'))

运行之后,效果如下:

cmp

如果参数shallow为True,只判断os.stat()函数返回内容是否相同,如果相同就返回True,否则再比较文件内容是否相同,如果相同也返回True。使用shallow参数可以快速地比较文件是否有修改过。(shallow参数默认为True)

cmpfiles()(比较一组文件)

cmp()函数用于单个文件的比较,而要对比两个目录中的一组文件,我们需要使用cmpfiles()函数,示例如下:

import filecmp

print(filecmp.cmpfiles('filecmps', 'text', common=['13.png', '14.png', 'one.txt']))

运行之后,效果如下:

cmpfiles

这里返回了3个列表,分别是相同列表,不同列表以及错误列表。相同列表放的是两个目录中相同的文件,不同列表是两个目录中不同的文件,但需要注意common指定了需要对比的文件,也就是说这3个列表的每个文件必须在common指定中才会用于对比,不指定不会对比也不会存在于列表中,哪怕文件夹下面有其他文件。错误列表指的是某个目录根本没有该文件。

dircmp()(比较目录)

前面2个函数都是针对文件进行的比较,但是项目文件的迭代对比往往直接对比的是整个目录结构,所以我们还需要掌握目录的比较。fliecmp库提供的目录比较函数为:dircmp()。示例如下:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
dc.report()

运行之后,效果如下:

比较目录

第1行为对比的两个文件夹,第2第3行为对比的两个目录中的所有文件。第4行是对比后的结果,这里只有3个文件完全相同。但是需要注意的是,report()函数只是用于比较当前目录下的文件,不包括里面文件夹以及文件夹下面的文件。如果需要递归比较所有目录文件,需要用到report_full_closure()。

示例如下:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
dc.report_full_closure()

运行之后,效果如下:

report_full_closure

left_list与right_list

在对比文件之前,我们可以列出所比较目录中的文件以及子目录。示例如下:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
print(dc.left_list)
print(dc.right_list)

运行之后,效果如下:

right与left

left_list为第1个参数的目录,right_list为第2个参数的目录,把2个参数看成左右,自然很好区分。

忽略部分文件进行对比

在对比两个目录的所有文件之时,我们还可以手动的过滤掉不需要对比的文件及文件夹,比如我们不对比文件中的123文件夹中的所有文件,可以直接这样操作:

import filecmp

dc = filecmp.dircmp('filecmps', 'text',ignore=['123'])
dc.report_full_closure()

运行之后,效果如下:

忽略对比文件

report_full_closure()函数本来需要一层一层目录去对比的。这里,博主过滤掉了其唯一的子目录123,所以只存在一层文件的对比。目录结构如下:

目录结构

其他属性

除了这些方法与属性之外,还有其他的属性供开发者调用,比如只查找相同的文件,或者只判断某个目录的独有文件,可以这样操作:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
print(dc.common)
print(dc.right_only)
print(dc.left_only)

运行之后,效果如下:

输出

common:为2目录同时存在的文件名

right_only:为右目录独有的文件

left_only:为左目录独有的文件。

这里的common公共目录还可以进一步的操作,示例如下:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
print(dc.common_dirs)
print(dc.common_files)
print(dc.common_funny)

运行之后,效果如下:

9

common_dirs:公共的文件夹

common_files:公共的文件

common_funny: 2个目录中类型不同的内容,或os.stat()指出的有错误的地方(可以简单的理解有一个文件夹是123,一个文件也是123,那么就会出现在common_files中)

以上是相同的划分,我们还有不同的划分,示例如下:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
print(dc.same_files)
print(dc.diff_files)
print(dc.funny_files)

这里一一对应上面的公共,只是是不同的不是公共的。运行之后,效果如下:

不同的

最后还有一个属性:subdirs,用于将目录名映射到新的dircmp对象。示例如下:

import filecmp

dc = filecmp.dircmp('filecmps', 'text')
print(dc.subdirs)

运行之后,效果如下:

subdirs

到此这篇关于Python使用fliecmp实现比较文件的操作的文章就介绍到这了,更多相关Python 比较文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python 字典生成树状图的实例

    python 字典生成树状图的实例

    这篇文章主要介绍了python 字典生成树状图的实例,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • pytorch绘制曲线的方法

    pytorch绘制曲线的方法

    这篇文章主要为大家详细介绍了pytorch绘制曲线的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-03-03
  • Pandas常用的数据结构和常用的数据分析技术

    Pandas常用的数据结构和常用的数据分析技术

    Pandas是Python中用于数据处理和分析的强大库,其最常用的数据结构是Series和DataFrame。Series类似于一维数组,可以表示一列数据;DataFrame类似于二维表格,可以表示多列数据
    2023-04-04
  • 举例讲解Python中的死锁、可重入锁和互斥锁

    举例讲解Python中的死锁、可重入锁和互斥锁

    这篇文章主要介绍了举例讲解Python中的死锁、可重入锁和互斥锁,尽管线程编程方面Python的GIL问题老生常谈...需要的朋友可以参考下
    2015-11-11
  • Django框架创建mysql连接与使用示例

    Django框架创建mysql连接与使用示例

    这篇文章主要介绍了Django框架创建mysql连接与使用,简单介绍了Linux环境下mysql的安装,并结合实例形式分析了Django框架基于第三方库pymysql连接mysql数据库相关操作技巧,需要的朋友可以参考下
    2019-07-07
  • Python中操作MySQL入门实例

    Python中操作MySQL入门实例

    这篇文章主要介绍了Python中操作MySQL入门实例,本文讲解了安装、打开数据库连接、插入数据、查询数据、删除数据等操作,需要的朋友可以参考下
    2015-02-02
  • Python pyecharts实现绘制中国地图的实例详解

    Python pyecharts实现绘制中国地图的实例详解

    pyecharts是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库。用 Echarts 生成的图可视化效果非常棒。本文将通过pyecharts绘制中国地图,需要的可以学习一下
    2022-01-01
  • Python实现Excel做表自动化的最全方法合集

    Python实现Excel做表自动化的最全方法合集

    Microsoft Excel 是一款强大的办公工具,广泛用于数据分析、报告制作、预算管理等各种任务,本文将深入探讨如何使用 Python 进行 Excel 表格的自动化,需要的可以参考下
    2024-02-02
  • jupyter notebook插入本地图片的实现

    jupyter notebook插入本地图片的实现

    这篇文章主要介绍了jupyter notebook插入本地图片的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python趣味挑战之pygame实现无敌好看的百叶窗动态效果

    Python趣味挑战之pygame实现无敌好看的百叶窗动态效果

    最近写了很多期关于pygame的案例和知识点,自己也收获了很多知识,也在这个过程中成长了不少, 这次还是围绕surface对象进行详细介绍,并形成完整的案例过程,文中有非常详细实现百叶窗动态效果的代码示例,需要的朋友可以参考下
    2021-05-05

最新评论