Ubuntu下使用python读取doc和docx文档的内容方法

 更新时间:2018年05月08日 09:05:31   作者:Nicholas_Wong  
今天小编就为大家分享一篇Ubuntu下使用python读取doc和docx文档的内容方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

读取docx文档

使用的包是python-docx

1. 安装python-docx包

sudo pip install python-docx 

2. 使用python-docx包读取数据

#encoding:utf8 
import docx 
doc = docx.Document('test.docx') 
docText = '\n'.join([paragraph.text for paragraph in doc.paragraphs]) 
#print(docText) 

python-docx这个包是不能处理doc文档的,要读取doc文档内容的话需要使用antiword这个工具。

读取doc文档

1. 到网站下载antiword。

2. 下载完毕之后解压,在解压得到的文件夹中依次运行make和make install命令。

3. 使用antiword读取doc文档内容

#encoding:utf8 
import subprocess 
word = 'test.doc' 
output = subprocess.check_output(['antiword',word]) 
print(output) 

以上这篇Ubuntu下使用python读取doc和docx文档的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python2中的中文乱码

    python2中的中文乱码

    这篇文章主要介绍了python2中的中文乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • 使用pandas read_table读取csv文件的方法

    使用pandas read_table读取csv文件的方法

    今天小编就为大家分享一篇使用pandas read_table读取csv文件的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • python“静态”变量、实例变量与本地变量的声明示例

    python“静态”变量、实例变量与本地变量的声明示例

    这篇文章主要给大家介绍了关于python“静态”变量、实例变量与本地变量的声明的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • Python requests timeout的设置

    Python requests timeout的设置

    这篇文章主要介绍了Python requests timeout的设置,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • Python函数调用追踪实现代码

    Python函数调用追踪实现代码

    这篇文章主要介绍了Python函数调用追踪实现代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • 基于python实现新春烟花盛宴效果

    基于python实现新春烟花盛宴效果

    这篇文章给大家用Python绽放了一场新春烟花盛宴,这里提前祝大家新春快乐呀,文中通过代码示例给大家介绍的非常详细,感兴趣的小伙伴可以自己动手尝试一下
    2024-02-02
  • python中字典增加和删除使用方法

    python中字典增加和删除使用方法

    这篇文章主要介绍了python中字典增加和删除使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • 解决Python安装时报缺少DLL问题【两种解决方法】

    解决Python安装时报缺少DLL问题【两种解决方法】

    这篇文章主要介绍了解决Python安装时报缺少DLL问题,本文通过两种方法给大家介绍的非常详细,具有一定的参考借鉴价值 ,需要的朋友可以参考下
    2019-07-07
  • Python垃圾回收是怎么实现的

    Python垃圾回收是怎么实现的

    垃圾回收大家应该多多少少都了解过,本文详细的介绍了Python垃圾回收是怎么实现的,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-07
  • python画图把时间作为横坐标的方法

    python画图把时间作为横坐标的方法

    今天小编就为大家分享一篇python画图把时间作为横坐标的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07

最新评论