浅谈Python处理PDF的方法
更新时间:2017年11月10日 11:36:20 作者:威行天下
这篇文章主要介绍了Python处理PDF的两种方法代码示例,具有一定参考价值,需要的朋友可以了解下。
处理pdf文档
第一、
从文本中提取文本
第二、
创建PDF
两种方法
#使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os.listdir('.'): if filename.endswith('.pdf'): pdfFiles.append(filename) print(pdfFiles) pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0],'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象 first,end =map(int,input('从多少页到多少页(用空格隔开):').split()) for pageNum in range(first-1,end): pageObj = pdfReader.getPage(pageNum) pdfWriter.addPage(pageObj) pdfOutput = open ('split_pdf.pdf','wb') pdfWriter.write(pdfOutput) pdfOutput.close()
#使用PdfFileMerger() import PyPDF2 merger = PyPDF2.PdfFileMerger() a = [str(i)+'webbook.pdf'for i in range(0,124)] for i in a: print(i) merger.append(open(i,'rb')) print("合并完成第"+str(i)) with open('combintion.pdf','wb') as f: merger.write(f)
总结
以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!
相关文章
Tornado协程在python2.7如何返回值(实现方法)
下面小编就为大家带来一篇Tornado协程在python2.7如何返回值(实现方法)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧2017-06-06解决jupyter notebook 前面书写后面内容消失的问题
这篇文章主要介绍了解决jupyter notebook 前面书写后面内容消失的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2020-04-04pytest解读fixture有效性及跨文件共享fixtures
这篇文章主要为大家介绍了pytest官方文档fixture有效性及跨文件共享fixtures的解读,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2022-06-06使用Python自动化Microsoft Excel和Word的操作方法
这篇文章主要介绍了使用Python自动化Microsoft Excel和Word,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2021-04-04
最新评论