python进行文件对比的方法

 更新时间:2018年12月24日 08:34:47   作者:wang_yubin92  
在本篇内容里小编给分享了关于python进行文件对比的方法和步骤,需要的朋友们可以学习下。

文件对比是否一致,我们一般采用md5值对比,假如一样,代表文件一致,不一样说明不一致

假如想要详细的对比信息内容,difflib库提供了文件对比的详细信息和结果

1、首先我们查看下md5值的使用方法

我们先建立几个示例文件方便我们参考,文件file1,file1_copy,file2

2、file1的内容和file1_copy的内容一致,都为

我是文件hello

为了测试我们的文件一致性

3、file2的内容和file1的文件有所区别,内容为:

我是文件world

4、接下来就是获取md5的方法,我可以了个公共方法,大家直接调用就好

需要导入包

import os

import hashlib

def get_file_md5(filename):

  if not os.path.isfile(filename):

    return

  md5 = hashlib.md5()

  f = file(filename,'rb')

  while True:

    b = f.read(8096)

    if not b:

      break

    md5.update(b)

  f.close()

  return md5.hexdigest()

然后我们打印下这几个文件的md5值

print 'file1   的md5:%s' % get_file_md5('file1.txt')

print 'file1_copy的md5:%s' % get_file_md5('file1_copy.txt')

print 'file2   的md5:%s' % get_file_md5('file2.txt')

5、运行python结果可以看到,file1和file1_copy文件的md5值是一样的,说明这两个文件是一样的,file2和他们不一样

6、接下来就是使用difflib详细的对比了,写法如下:

import difflib

import sys

file1 = open('file1.txt', 'U').readlines()

file2 = open('file2.txt', 'U').readlines()

diff = difflib.ndiff(file1, file2)

sys.stdout.writelines(diff)

7、运行python结果可以看到,具体两个文件的区别

  我是文件

- hello+ world

总结:以上就是本次关于python怎样进行文件对比的操作方法,感谢大家的阅读和对脚本之家的支持。

相关文章

  • 使用Tensorflow实现可视化中间层和卷积层

    使用Tensorflow实现可视化中间层和卷积层

    今天小编就为大家分享一篇使用Tensorflow实现可视化中间层和卷积层,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • 分析Python编程时利用wxPython来支持多线程的方法

    分析Python编程时利用wxPython来支持多线程的方法

    这篇文章主要介绍了Python编程时利用wxPython来支持多线程的方法,本文主要以开发GUI程序时做线程通讯作为一个示例来讲解,需要的朋友可以参考下
    2015-04-04
  • PyCharm活动模板设置步骤实现

    PyCharm活动模板设置步骤实现

    很多情况,我们在写代码都会存在经常要写一些简单且又重复的代码,Pycharm中的活动模板可以把这些使用频率很高的一些代码打包起来设置一个快捷键,本文就来介绍一下如何实现
    2023-12-12
  • pytest解读fixtures中yield与addfinalizer区别

    pytest解读fixtures中yield与addfinalizer区别

    这篇文章主要为大家介绍了pytest官方解读fixtures中yield与addfinalizer区别,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • 使用matplotlib画图自定义marker

    使用matplotlib画图自定义marker

    这篇文章主要介绍了使用matplotlib画图自定义marker问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • python中路径的三种写法+路径前符号含义解读

    python中路径的三种写法+路径前符号含义解读

    这篇文章主要介绍了python中路径的三种写法+路径前符号含义解读,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • Pycharm 操作Django Model的简单运用方法

    Pycharm 操作Django Model的简单运用方法

    今天小编就为大家分享一篇Pycharm 操作Django Model的简单运用方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • 深入浅析python3 依赖倒置原则(示例代码)

    深入浅析python3 依赖倒置原则(示例代码)

    今天通过园区停车信息这样一个场景分析python3 依赖倒置原则,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2021-07-07
  • 基于pandas数据清洗的实现示例

    基于pandas数据清洗的实现示例

    数据清洗是数据科学和数据分析中非常重要的一个步骤,本文主要介绍了基于pandas的数据清洗,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2024-07-07
  • Pycharm连接远程服务器并远程调试的全过程

    Pycharm连接远程服务器并远程调试的全过程

    PyCharm 是 JetBrains 开发的一款 Python 跨平台编辑器,下面这篇文章主要介绍了Pycharm连接远程服务器并远程调试的全过程,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2021-06-06

最新评论