java poi解析word的方法
更新时间:2017年05月08日 09:14:43 作者:chanjuan
这篇文章主要为大家详细介绍了java poi解析word的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
之前做过用java读取word文档,获取word文本内容。
但发现docx的支持,doc就异常了。
后来找了很多资料发现是解析方法不一样。
首先要导入poi相关的jar包
我用的是maven,pom.xml引入如下:
<dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.8</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-scratchpad</artifactId> <version>3.8</version> </dependency>
java获取word文本内容如下:
public BaseResp getParsedTxt(MultipartFile file) throws Exception { BaseResp br=new BaseResp("200","") ; String textType = file.getContentType(); String txt = ""; if(textType.equals(TXT_TYPE)){ String code = getCharset(file); txt = new String(file.getBytes(),code); }else if(textType.equals(DOC_TYPE)){ HWPFDocument doc = new HWPFDocument(file.getInputStream()); Range rang = doc.getRange(); txt = rang.text(); System.out.println(txt); }else if(textType.equals(DOCX_TYPE)){ File uFile = new File("tempFile.docx"); if(!uFile.exists()){ uFile.createNewFile(); } FileCopyUtils.copy(file.getBytes(), uFile); OPCPackage opcPackage = POIXMLDocument.openPackage("tempFile.docx"); POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage); txt= extractor.getText(); uFile.delete(); }else{ br = new BaseResp("300","上传文件格式错误,请上传.txt或者.docx"); return br; } br.setDatas(txt); return br; }
功能实现了。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。
相关文章
如何修改覆盖spring boot默认日志策略logback详解
这篇文章主要给大家介绍了关于如何修改覆盖spring boot默认日志策略logback的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2018-10-10Spring Boot结合IDEA自带Maven插件如何快速切换profile
IDEA是目前 Java 开发者中使用最多的开发工具,它有着简约的设计风格,强大的集成工具,便利的快捷键,这篇文章主要介绍了Spring Boot结合IDEA自带Maven插件快速切换profile,需要的朋友可以参考下2023-03-03Java并发之原子性 有序性 可见性及Happen Before原则
一提到happens-before原则,就让人有点“丈二和尚摸不着头脑”。这个涵盖了整个JMM中可见性原则的规则,究竟如何理解,把我个人一些理解记录下来。下面可以和小编一起学习Java 并发四个原则2021-09-09
最新评论