Python实现pdf转word详细代码
一、实验目标
通过利用python中的pyinstaller库和PySimpleGUI库,实现将pdf转为word的实际功能。
二、实验准备
1、安装pdf2docx库
pip install pdf2docx
2、安装PySimpleGUI库
pip install PySimpleGUI
三、实验代码
from pdf2docx import Converter import PySimpleGUI as sg def pdf2word(file_path): file_name = file_path.split('.')[0] doc_file = f'{file_name}.docx' p2w = Converter(file_path) p2w.convert(doc_file, start=0, end=None) p2w.close() return doc_file def main(): # 选择主题 sg.theme('DarkAmber') layout = [ [sg.Text('pdfToword', font=('微软雅黑', 12)), sg.Text('', key='filename', size=(50, 1), font=('微软雅黑', 10))], [sg.Output(size=(80, 10), font=('微软雅黑', 10))], [sg.FilesBrowse('选择文件', key='file', target='filename'), sg.Button('开始转换'), sg.Button('退出')]] # 创建窗口 window = sg.Window("张卧虎", layout, font=("微软雅黑", 15), default_element_size=(50, 1)) # 事件循环 while True: # 窗口的读取,有两个返回值(1.事件;2.值) event, values = window.read() print(event, values) if event == "开始转换": if values['file'] and values['file'].split('.')[1] == 'pdf': filename = pdf2word(values['file']) print('文件个数 :1') print('\n' + '转换成功!' + '\n') print('文件保存位置:', filename) elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf': print('文件个数 :{}'.format(len(values['file'].split(';')))) for f in values['file'].split(';'): filename = pdf2word(f) print('\n' + '转换成功!' + '\n') print('文件保存位置:', filename) else: print('请选择pdf格式的文件哦!') if event in (None, '退出'): break window.close() main()
四、部分代码解析
1、pdf转word代码主体部分
def pdf2word(file_path): file_name = file_path.split('.')[0] doc_file = f'{file_name}.docx' p2w = Converter(file_path) p2w.convert(doc_file, start=0, end=None) p2w.close() return doc_file
convert(doc_file,start,end)函数中
- doc_file:转化完成后文件名
- start:转化开始页面
- end:转化结束页面
注意点:
①若不给start,end参数则默认转化全篇
②对于不连续的页面,也可写作convert(doc_file , pages = [2,4,6])
2、图形化界面部分
sg.theme('default1') layout = [[sg.Text('pdfToword', font=('微软雅黑', 12)), sg.Text('', key='filename', size=(50, 1), font=('微软雅黑', 10))], [sg.Output(size=(80, 10), font=('微软雅黑', 10))], [sg.FilesBrowse('选择文件', key='file', target='filename'), sg.Button('开始转换'),sg.Button('退出')]] window = sg.Window("id", layout, font=("微软雅黑", 15), default_element_size=(50, 1))
theme表示主题,即图形化界面的主题颜色(sg.theme_list()可以查看所有可用主题)
3、实现多个文件转化
if event == "开始转换": if values['file'] and values['file'].split('.')[1] == 'pdf': filename = pdf2word(values['file']) print('文件个数 :1') print('\n' + '转换成功!' + '\n') print('文件保存位置:', filename) elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf': print('文件个数 :{}'.format(len(values['file'].split(';')))) for f in values['file'].split(';'): filename = pdf2word(f) print('\n' + '转换成功!' + '\n') print('文件保存位置:', filename) else: print('请选择pdf格式的文件')
①第一个if处,通过“.”进行划分,判断是否为单个且pdf格式文件
②else if处,通过“;”划分,将所有文件的存储路径储存在一个数组中,利用循环来遍历数组,从而达到依次转化的目的
③else处,若传入非pdf文件则输出提示文字
五、结果
完结撒花!
总结
到此这篇关于Python实现pdf转word的文章就介绍到这了,更多相关Python pdf转word内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
python numpy库linspace相同间隔采样的实现
这篇文章主要介绍了python numpy库linspace相同间隔采样的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2020-02-02Python之tkinter组合框Combobox用法及说明
这篇文章主要介绍了Python之tkinter组合框Combobox用法及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2023-05-05
最新评论