Python如何查找文件夹中含有指定关键字的文件

 更新时间:2023年08月22日 10:27:39   作者:进阶的小幺  
这篇文章主要介绍了Python如何查找文件夹中含有指定关键字的文件问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Python查找文件夹中含有指定关键字的文件

查找文件夹中含有指定关键字的文件,并将该文件复制到另一个文件夹中

'''
查找文件夹中含有指定关键字的文件,并将该文件复制到另一个文件夹中
'''
import os
import shutil
def copyfile_base_keyword_in_file(file_pathname):
    # 遍历该目录下的所有图片文件
    for filename in os.listdir(file_pathname):
        #path = os.path.join(r'D:/copykeywordw/notations', filename)    
        path = os.path.join(file_pathname, filename)
        f = open(path, 'r')
        lines = f.readlines()
        for lines in lines:
            if 'face_with_mask' in lines:  # 此处关键词为'face_with_mask',根据自己需求更改
                shutil.copy(src_dir_path + '/' + filename, to_dir_path + '/' + filename)
copyfile_base_keyword_in_file(r'D:/copykeywordw/notations')     # 文件夹目录

Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等

应用场景

我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!

环境:jupyter

要求:事先安装 pip install python-docx

代码修改处:文件存放根目录和要搜索的关键词

#coding=utf-8
from docx import Document
import os,sys
def search_word(filename,word):
    #打开文档
    document = Document(filename)
    #读取每段资料
    pa=document.paragraphs
    #拼接每一段的内容
    para_list = []
    for para in pa:
        para_list.append(para.text)
    #合并字符串
    file_text = ''.join(para_list)
    if word in file_text:
        print("find file for {}:".format(word))
        print(filename)
process_list=[]
def get_process_files(root_dir):
    """process all files in directory"""
    cur_dir=os.path.abspath(root_dir)
    file_list=os.listdir(cur_dir)
    for file in file_list:
        fullfile=cur_dir+"\\"+file
        if os.path.isfile(fullfile):
            process_list.append(fullfile)
        elif os.path.isdir(fullfile):
            dir_extra_list=get_process_files(fullfile)
    return process_list
def find_files(root_dir,word):
    get_process_files(root_dir)
    print("总计文件数:{}".format(len(process_list)))
    for files in process_list:
        search_word(files, word)
    return
if __name__=='__main__':
    #此处修改自己存放文件位置和名字
    #文件根目录
    root_dir=r'D:\beizhai\study\大四\综测\【2021】XX学院综测公示文件'
    #要搜索的关键字
    word="beizhai"
    count=0
    try:
        find_files(root_dir,word)
    except:
        pass

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python框架Django实战商城项目之工程搭建过程图文详解

    python框架Django实战商城项目之工程搭建过程图文详解

    这篇文章主要介绍了python框架Django实战商城项目之工程搭建过程,这个项目很像京东商城,项目开发采用前后端不分离的模式,本文通过图文并茂的形式给大家介绍的非常详细,需要的朋友可以参考下
    2020-03-03
  • 结束运行python的方法

    结束运行python的方法

    在本篇文章里小编给大家分享的是关于结束运行python的方法以及相关代码,有需要的朋友们跟着学习下。
    2020-06-06
  • Python编程scoketServer实现多线程同步实例代码

    Python编程scoketServer实现多线程同步实例代码

    这篇文章主要介绍了Python编程scoketServer实现多线程同步实例代码,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • python中isdigit() isalpha()用于判断字符串的类型问题

    python中isdigit() isalpha()用于判断字符串的类型问题

    这篇文章主要介绍了python中isdigit() isalpha()用于判断字符串的类型问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • python 自定义包的实现示例

    python 自定义包的实现示例

    如果Python的模块过多,可能造成一定的混乱,这时可以通过Python包来管理模块,本文主要介绍了python 自定义包的实现示例,感兴趣的可以了解一下
    2024-05-05
  • Python实现RSA加密解密

    Python实现RSA加密解密

    这篇文章主要介绍了Python实现RSA加密解密,加密技术在数据安全存储,数据传输中发挥着重要作用,能够保护用户隐私数据安全,防止信息窃取。RSA是一种非对称加密技术,在软件、网页中已得到广泛应用,下面文章更多相关内容需要的小伙伴可以参考一下
    2022-04-04
  • Python时间序列数据的预处理方法总结

    Python时间序列数据的预处理方法总结

    这篇文章主要介绍了Python时间序列数据的预处理方法总结,时间序列数据随处可见,要进行时间序列分析,我们必须先对数据进行预处理。时间序列预处理技术对数据建模的准确性有重大影响
    2022-07-07
  • Pytorch高阶OP操作where,gather原理

    Pytorch高阶OP操作where,gather原理

    这篇文章主要介绍了Pytorch高阶OP操作where,gather原理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • opencv-python的RGB与BGR互转方式

    opencv-python的RGB与BGR互转方式

    这篇文章主要介绍了opencv-python的RGB与BGR互转方式,具有很好的参考价值,希望对大家有所 帮助。一起跟随小编过来看看吧
    2020-06-06
  • flask上使用websocket的方法示例

    flask上使用websocket的方法示例

    本文主要介绍了flask上使用websocket的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06

最新评论