Python对130w+张图片检索的实现方法

 更新时间:2021年03月12日 10:16:01   作者:aquariusmao  
这篇文章主要给大家介绍了关于Python对130w+张图片检索的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

任务说明:

130w+张图片,8张excel表里记录了需要检索图片的文件名,现在需要找出对应的图片,将找出的图片按不同的excel分别保存,并且在excel里能够直接打开图片。

任务分析:

如果数据量不大的话,可以直接读取excel表里的文件名进行搜索保存,但这次的任务显然不合适,因为图片实在太多,所以考虑后按照以下步骤:

1、遍历图片文件夹,读取文件名和文件路径,写入到csv文件中;

2、使用pandas的merge函数,实现8张原始excel表与csv文件根据图片文件名的对碰;

3、使用shutil的copy函数,读取文件路径进行保存。

代码分析:

1、文件遍历

import os
import pandas as pd
 
file_list = []
path_list = []
path = r"此处添加图片路径"
print("任务开始")
for root,dirs,files in os.walk(path):
 for file in files:
  file_list.append(file.split('.')[0])
  path_list.append(os.path.join(root,file))
print("文件遍历结束")
file_dic = dict(zip(file_list,path_list))
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['图片1路径']).reset_index().rename(columns={'index':'图片1'})
df.to_csv("图片1.csv")
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['图片2路径']).reset_index().rename(columns={'index':'图片2'})
df.to_csv("图片2.csv")
df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['图片3路径']).reset_index().rename(columns={'index':'图片3'})
df.to_csv("图片3.csv")
print("文件目录导出成功")

2、表格对碰

import pandas as pd
frame1 = pd.read_excel(r'excel表1.xlsx', 'sheet名')
frame2 = pd.read_csv(r'图片1.csv', sep=',')
frame3 = pd.read_csv(r'图片2.csv', sep=',')
frame4 = pd.read_csv(r'图片3.csv', sep=',')
frame5 = pd.merge(frame1, frame2, on = ['图片1'], how = 'left')
frame6 = pd.merge(frame5, frame3, on = ['图片2'], how = 'left')
frame7 = pd.merge(frame6, frame4, on = ['图片3'], how = 'left')
col = ['图片1','图片2','图片3']
frame7[col] = frame7[col].fillna('未找到')
frame7.to_excel('excel表1合并后.xlsx')

3、图片复制

import shutil
target = '此处为excel表1导出图片路径'
copylist1 = frame7['图片1']
for src in copylist1:
  if src != '未找到':
    shutil.copy(src, target)
copylist2 = frame7['图片2']
for src in copylist2:
  if src != '未找到':
    shutil.copy(src, target)
copylist3 = frame7['图片3']
for src in copylist3:
  if src != '未找到':
    shutil.copy(src, target)
print('复制完毕')

4、excel里打开图片,可以使用excel自带的hyperlink函数。

总结

到此这篇关于Python对130w+张图片检索实现的文章就介绍到这了,更多相关Python图片检索内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 关于python3中setup.py小概念解析

    关于python3中setup.py小概念解析

    这篇文章主要介绍了关于python3中setup.py小概念解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python实现提取音乐频谱的方法详解

    Python实现提取音乐频谱的方法详解

    你有没有经常好奇一些音乐软件的频谱特效是怎么做的,为什么做的这么好看?有没有想试试自己提取音乐频谱并可视化展现出来?本文就来教你如何利用Python提取音乐频谱,快来学习一下吧
    2022-06-06
  • python获取全国城市pm2.5、臭氧等空气质量过程解析

    python获取全国城市pm2.5、臭氧等空气质量过程解析

    这篇文章主要介绍了python获取全国城市pm2.5、臭氧等空气质量过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-10-10
  • python验证码识别教程之利用投影法、连通域法分割图片

    python验证码识别教程之利用投影法、连通域法分割图片

    这篇文章主要给大家介绍了关于python验证码识别教程之利用投影法、连通域法分割图片的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起看看吧
    2018-06-06
  • 500行代码使用python写个微信小游戏飞机大战游戏

    500行代码使用python写个微信小游戏飞机大战游戏

    这篇文章主要介绍了500行代码使用python写个微信小游戏飞机大战游戏,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-10-10
  • python数据分析:关键字提取方式

    python数据分析:关键字提取方式

    今天小编就为大家分享一篇python数据分析:关键字提取方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python实现PDF到Word文档的高效转换

    Python实现PDF到Word文档的高效转换

    这篇文章主要为大家详细介绍了如何使用Python编程语言,结合库和工具,将PDF文件转换为可编辑的Word文档,使文档的编辑变得方便高效,需要的可以参考下
    2024-01-01
  • python json jsonl 的用法详解

    python json jsonl 的用法详解

    这篇文章主要介绍了python json jsonl 的用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2024-08-08
  • python实现企业微信定时发送文本消息的示例代码

    python实现企业微信定时发送文本消息的示例代码

    这篇文章主要介绍了python实现企业微信定时发送文本消息的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • python如何去除字符串中不想要的字符

    python如何去除字符串中不想要的字符

    这篇文章主要为大家详细介绍了python如何去除字符串中不想要的字符,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03

最新评论