如何使用Java读取PPT文本和图片

 更新时间:2019年07月12日 14:14:23   作者:Miaonly  
这篇文章主要介绍了如何使用Java读取PPT文本和图片,本篇文章将介绍通过Java程序来读取PPT幻灯片中的文本及图片的方法。读取图片时,可读取文档中的所有图片,也可以读取指定幻灯片当中的图片,需要的朋友可以参考下

前言

本篇文章将介绍通过Java程序来读取PPT幻灯片中的文本及图片的方法。读取图片时,可读取文档中的所有图片,也可以读取指定幻灯片当中的图片。

工具:

  • Free Spire.Presentation for Java(免费版)
  • IntelliJ IDEA

Jar文件获取及导入

方法1:官网下载jar文件包。下载后,解压文件,并在java程序中导入lib文件夹下的Spire.Presentation.jar文件。

方法2:可通过maven仓库导入到maven项目

Java代码示例

测试文档:

【示例1】读取PPT中的文本

import com.spire.presentation.IAutoShape;
import com.spire.presentation.ISlide;
import com.spire.presentation.ParagraphEx;
import com.spire.presentation.Presentation;
import java.io.FileWriter;

public class ExtractText {
 public static void main(String[]args) throws Exception{
  //加载测试文档
  Presentation ppt = new Presentation();
  ppt.loadFromFile("test.pptx");

  StringBuilder buffer = new StringBuilder();

  //遍历文档中的幻灯片,提取文本
  for (Object slide : ppt.getSlides()) {
   for (Object shape : ((ISlide) slide).getShapes()) {
    if (shape instanceof IAutoShape) {
     for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) {
      buffer.append(((ParagraphEx) tp).getText());
     }
    }
   }
  }
  //保存到文本文件
  FileWriter writer = new FileWriter("ExtractText.txt");
  writer.write(buffer.toString());
  writer.flush();
  writer.close();
 }
}

文本读取结果:

【示例2】读取PPT中的所有图片

import com.spire.presentation.Presentation;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractAllImgs {
 public static void main(String[] args) throws Exception {
  //加载文档
  Presentation ppt = new Presentation();
  ppt.loadFromFile("test.pptx");

  //提取文档中的所有图片
  for (int i = 0; i < ppt.getImages().getCount(); i++) {
   BufferedImage image = ppt.getImages().get(i).getImage();
   ImageIO.write(image, "PNG", new File(String.format("AllImage-%1$s.png", i)));
  }
 }
}

【示例3】读取指定幻灯片中的图片

import com.spire.presentation.*;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractImgsInSpecifiedSlide {
 public static void main(String[]args) throws Exception{
  //加载文档
  Presentation ppt = new Presentation();
  ppt.loadFromFile("test.pptx");

  //获取第2张幻灯片
  ISlide slide = ppt.getSlides().get(1);

  //提取图片
  for(int i = 0; i< slide.getShapes().getCount(); i++)
  {
   IShape shape = slide.getShapes().get(i);
   if(shape instanceof SlidePicture)
   {
    SlidePicture pic = (SlidePicture) shape;
    BufferedImage image = pic.getPictureFill().getPicture().getEmbedImage().getImage();
    ImageIO.write(image, "PNG", new File(String.format("extractImageinslide-%1$s.png", i)));
   }
   if(shape instanceof PictureShape)
   {
    PictureShape ps = (PictureShape) shape;
    BufferedImage image = ps.getEmbedImage().getImage();
    ImageIO.write(image, "PNG", new File(String.format("extractImageinslide-%1$s.png", i)));
   }
  }

 }
}

图片读取结果:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Java 微信公众号开发相关总结

    Java 微信公众号开发相关总结

    公众号作为主流的自媒体平台,有着不少人使用。这次以文本回复作为案例来讲解Java相关的微信公众号开发
    2021-05-05
  • spring boot开发遇到坑之spring-boot-starter-web配置文件使用教程

    spring boot开发遇到坑之spring-boot-starter-web配置文件使用教程

    Spring Boot支持容器的自动配置,默认是Tomcat,当然我们也是可以进行修改的。这篇文章给大家介绍了spring boot开发遇到坑之spring-boot-starter-web配置文件使用教程,需要的朋友参考下吧
    2018-01-01
  • java处理字节的常用工具类

    java处理字节的常用工具类

    这篇文章主要为大家详细介绍了java处理字节的常用工具类,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • intellij idea的快速配置使用详细教程

    intellij idea的快速配置使用详细教程

    这篇文章主要介绍了intellij idea的快速配置使用详细教程,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • mybatis项目实现动态表名的三种方法

    mybatis项目实现动态表名的三种方法

    有时在开发过程中java代码中的表名和数据库的表名并不是一致的,此时我们就需要动态的设置表名,本文主要介绍了mybatis项目实现动态表名的三种方法,具有一定的参考价值,感兴趣的可以了解一下
    2024-01-01
  • SpringCloud开发课程查询功能

    SpringCloud开发课程查询功能

    这篇文章主要介绍了SpringCloud开发课程查询功能,本文通过图文实例相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • 详解springboot项目启动时如何排除用不到的bean

    详解springboot项目启动时如何排除用不到的bean

    使用springboot开发项目,我们有时候会排除一些项目里面用不到的bean,不然的话项目启动会报错,这种情况通常是发生在什么场景里呢,以及如何解决呢,今天咱们就聊一聊
    2024-01-01
  • 通过dom4j解析xml字符串(示例代码)

    通过dom4j解析xml字符串(示例代码)

    本篇文章主要是对通过dom4j解析xml字符串的示例代码进行了介绍,需要的朋友可以过来参考下,希望对大家有所帮助
    2013-12-12
  • 在eclipse中中文汉字乱码的解决方案

    在eclipse中中文汉字乱码的解决方案

    在本篇文章里小编给大家分享的是关于在eclipse中中文汉字乱码的解决方案,有需要的朋友们可以学习下。
    2019-12-12
  • 新手初学Java基础

    新手初学Java基础

    这篇文章主要介绍了java基础之方法详解,文中有非常详细的代码示例,对正在学习java基础的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2021-07-07

最新评论