基于PyQt5制作Excel文件数据去重小工具
需求说明:将单个或者多个Excel文件数据进行去重操作,去重的列可以通过自定义制定。
开始源码说明之前,先说明一下工具的使用过程。
1、准备需要去重的数据文件。
2、使用工具执行去重操作。
3、处理完成后的结果文件。
PyQt5 界面UI相关的模块引用
from PyQt5.QtWidgets import * from PyQt5.QtGui import *
核心组件
from PyQt5.QtCore import *
主题样式模块引用
from QCandyUi import CandyWindow
在这个应用中使用一个默认的杨氏模块QCandyUi,可以改变整个应用的主题颜色设计不用一个控件一个控件的去修改样式。有一个不好的地方就是应用本身设置的标题和应用图标不能生效,必须利用这个样式控件CandyWindow来修改,就像下面这样需要将我们自己写的UI空间放到里面。
# w = CandyWindow.createWindow(EDataDel(), theme='blueGreen', title='Excel批数据去重器 公众号:[Python 集中营]', # ico_path='数据去重.ico') # w.show()
应用操作相关模块
import sys import os
Excel数据处理模块
import pandas as pd import openpyxl as pxl
UI界面布局设计、信号量槽函数绑定实现
class EDataDel(QWidget): def __init__(self): super(EDataDel, self).__init__() self.init_ui() def init_ui(self): self.brower = QTextBrowser() self.brower.setReadOnly(True) self.brower.setFont(QFont('微软雅黑', 8)) self.brower.setPlaceholderText('处理进程展示区域...') self.brower.ensureCursorVisible() form = QFormLayout() self.file_paths = QLineEdit() self.file_paths.setReadOnly(True) self.file_paths_btn = QPushButton() self.file_paths_btn.setText('加载批文件') self.file_paths_btn.clicked.connect(self.file_paths_btn_click) self.colums_label = QLabel() self.colums_label.setText('自定义去重复列') self.colums_text = QLineEdit() self.colums_text.setPlaceholderText('列名1,列名2,列名3,...') form.addRow(self.file_paths, self.file_paths_btn) form.addRow(self.colums_label, self.colums_text) self.work = DataWork(self) self.work.trigger.connect(self.update_log) self.work.finished.connect(self.finished) vbox = QVBoxLayout() self.start_btn = QPushButton() self.start_btn.setText('开始执行') self.start_btn.clicked.connect(self.start_btn_click) vbox.addLayout(form) vbox.addWidget(self.start_btn) hbox = QHBoxLayout() hbox.addWidget(self.brower) hbox.addLayout(vbox) self.setLayout(hbox) def file_paths_btn_click(self): paths = QFileDialog.getOpenFileNames(self, '选择文件', os.getcwd(), 'Excel Files(*.xlsx)') files = paths[0] path_strs = '' for file in files: path_strs = path_strs + file + ';' self.file_paths.setText(path_strs) if self.file_paths.text().strip() != '': self.update_log('已经完成批文件路径加载!') else: self.update_log('没有选择任何文件!') def save_dir_btn_click(self): directory = QFileDialog.getExistingDirectory(self, '选择文件夹', os.getcwd()) self.save_dir.setText(directory) def update_log(self, text): cursor = self.brower.textCursor() cursor.movePosition(QTextCursor.End) self.brower.append(text) self.brower.setTextCursor(cursor) self.brower.ensureCursorVisible() def start_btn_click(self): self.start_btn.setEnabled(False) self.work.start() def finished(self, finished): if finished is True: self.start_btn.setEnabled(True)
创建子线程,处理业务逻辑(清理Excel重复文件)
class DataWork(QThread): trigger = pyqtSignal(str) finished = pyqtSignal(bool) def __init__(self, parent=None): super(DataWork, self).__init__(parent) self.parent = parent self.working = True def __del__(self): self.working = False self.wait() def run(self): self.trigger.emit('启动批量处理子线程...') file_paths = self.parent.file_paths.text().strip() colums_text = self.parent.colums_text.text().strip() colums = [] if ',' in colums_text: colums = colums_text.split(',') else: colums.append(colums_text) self.trigger.emit('获取配置项完成!') for file in file_paths.split(';'): if file.strip() != '': web_sheet = pxl.load_workbook(file) sheets = web_sheet.sheetnames print(file) new_file = file.split('.')[0] + '_已去重.' + file.split('.')[1] print(new_file) writer = pd.ExcelWriter(new_file) for sheet in sheets: sheet_name = sheet.title() print(sheet_name) self.trigger.emit('准备处理工作表名称:' + str(sheet.title())) data_frame = pd.read_excel(file, sheet_name=sheet_name) print(data_frame) repe = data_frame.duplicated(subset=colums) repe = repe[repe] print(data_frame.iloc[repe.index]) res = data_frame.drop_duplicates(subset=colums) print(res) self.trigger.emit(str(sheet.title()) + ':已清除') res.to_excel(writer, sheet_name, index=False) writer.save() else: self.trigger.emit('当前文件路径为空,继续...') self.trigger.emit('数据处理完成...') self.finished.emit(True)
使用主函数启动整个应用
if __name__ == '__main__': app = QApplication(sys.argv) w = CandyWindow.createWindow(EDataDel(), theme='blueGreen', title='Excel批数据去重器 公众号:[Python 集中营]', ico_path='数据去重.ico') w.show() sys.exit(app.exec_())
以上就是基于PyQt5制作Excel文件数据去重小工具的详细内容,更多关于PyQt5数据去重的资料请关注脚本之家其它相关文章!
相关文章
解决Django migrate No changes detected 不能创建表的问题
今天小编就为大家分享一篇解决Django migrate No changes detected 不能创建表的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2018-05-05python为tornado添加recaptcha验证码功能
tornado作为微框架,并没有自带验证码组件,recaptcha是著名的验证码解决方案,简单易用,被很多公司运用来防止恶意注册和评论。tornado添加recaptchaHA非常容易2014-02-02Python matplotlib设置多子图、子图间距及外边距的几种方式
子图是Matplotlib中强大的功能之一,使用函数您可以方便地创建多个子图,并使用Axes对象绘制各种图形,下面这篇文章主要给大家介绍了关于Python matplotlib设置多子图、子图间距及外边距的几种方式,需要的朋友可以参考下2024-02-02
最新评论