Java如何获取文件夹下所有压缩包下指定文件

 更新时间:2024年09月26日 08:52:23   作者:java李杨勇  
在Java中,通过遍历文件夹并对压缩包进行解析,可以实现提取指定文件的功能,如文档、PDF等,该过程中可增加过滤条件来适应不同需求,例如文件类型或文件名过滤,该方法适用于处理大量数据时的文件管理和数据提取

Java获取文件夹下所有压缩包下指定文件

 
import java.io.*;
import java.nio.charset.Charset;
import java.util.Enumeration;
import java.util.zip.*;
 
/**
 * Created by LiYangYong on 2023/6/8
 */
public class WordDocExtractor {
    public static void main(String[] args) {
        String sourceDir = "D:\\李阳勇个人java相关\\安卓"; // 压缩包所在目录
        String targetDir = "D:\\李阳勇个人java相关\\directory"; // 目标目录
 
        File dir = new File(sourceDir);
        if (!dir.isDirectory()) {
            System.out.println("Invalid source directory.");
            return;
        }
 
        File[] files = dir.listFiles(new FilenameFilter() {
            @Override
            public boolean accept(File dir, String name) {
                return name.toLowerCase().endsWith(".zip") || name.toLowerCase().endsWith(".rar");
            }
        });
 
        for (File file : files) {
            String archiveName = file.getName();
            String archivePath = file.getAbsolutePath();
            System.out.println("Processing archive: " + archiveName);
 
            // 使用指定的字符集打开压缩文件
            try (ZipFile zipFile = new ZipFile(file, Charset.forName("GBK"))) {
                // 获取压缩文件中的所有条目
                Enumeration<? extends ZipEntry> entries = zipFile.entries();
                // 遍历所有条目
                while (entries.hasMoreElements()) {
                    ZipEntry entry = entries.nextElement();
                    String entryName = entry.getName();
                    // 如果条目是以 .doc 或 .docx 结尾的文档文件
                    if ((entryName.toLowerCase().endsWith(".doc") || entryName.toLowerCase().endsWith(".docx"))) {
                        // 如果文件名不包含 "数据库文档"、"开发文档"、"开放文档",且包含 "论文"
                        if (!entryName.contains("数据库文档") && !entryName.contains("开发文档") && !entryName.contains("开放文档") && entryName.contains("论文")) {
                            // 获取文档文件名
                            String docName = entryName.substring(entryName.lastIndexOf('/') + 1);
                            // 拼接目标路径
                            String targetPath = targetDir + "/" + archiveName + "_" + docName;
                            // 去掉文件名中的 .zip 后缀
                            targetPath = targetPath.replace(".zip", "");
                            // 输出拷贝信息
                            System.out.println("Copying " + entryName + " to " + targetPath);
                            // 从压缩文件中读取文档文件内容,并写入目标文件
                            try (InputStream inputStream = zipFile.getInputStream(entry);
                                 OutputStream outputStream = new FileOutputStream(targetPath)) {
                                byte[] buffer = new byte[1024];
                                int length;
                                while ((length = inputStream.read(buffer)) > 0) {
                                    outputStream.write(buffer, 0, length);
                                }
                            }
                        }
                    }
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

实现效果

中间可以自己加一些过滤条件来满足各种需求。

不管是文档或其他pdf等

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Java实现解压zip和rar包的示例代码

    Java实现解压zip和rar包的示例代码

    这篇文章主要为大家详细介绍了如何使用Java实现解压zip和rar包,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2024-01-01
  • Java实现简单抽奖功能界面

    Java实现简单抽奖功能界面

    这篇文章主要为大家详细介绍了Java实现简单抽奖功能界面,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-11-11
  • Spring Boot中捕获异常错误信息并将其保存到数据库中的操作方法

    Spring Boot中捕获异常错误信息并将其保存到数据库中的操作方法

    这篇文章主要介绍了Spring Boot中捕获异常错误信息并将其保存到数据库中的操作方法,通过实例代码介绍了使用Spring Data JPA创建一个异常信息的存储库接口,以便将异常信息保存到数据库,需要的朋友可以参考下
    2023-10-10
  • Ubuntu安装jdk8常用方法流程解析

    Ubuntu安装jdk8常用方法流程解析

    这篇文章主要介绍了Ubuntu安装jdk8常用方法流程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • springboot如何连接两个数据库(多个)

    springboot如何连接两个数据库(多个)

    这篇文章主要介绍了springboot如何连接两个数据库(多个),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-01-01
  • nacos配置注册中心时指定命名空间不起作用的问题

    nacos配置注册中心时指定命名空间不起作用的问题

    这篇文章主要介绍了nacos配置注册中心时指定命名空间不起作用的问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教。
    2022-01-01
  • Java如何获取Json中的数据实例代码

    Java如何获取Json中的数据实例代码

    这篇文章主要给大家介绍了关于Java如何获取Json中数据的相关资料,我们在日常开发中少不了和JSON数据打交道,那么我们来看看JAVA中常用的JSON获取方式,需要的朋友可以参考下
    2023-09-09
  • springboot如何重定向携带数据 RedirectAttributes

    springboot如何重定向携带数据 RedirectAttributes

    这篇文章主要介绍了springboot如何重定向携带数据 RedirectAttributes,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-09-09
  • 最简单的spring boot打包docker镜像的实现

    最简单的spring boot打包docker镜像的实现

    这篇文章主要介绍了最简单的spring boot打包docker镜像的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • Spring 加载多份配置文件的问题及解决方案

    Spring 加载多份配置文件的问题及解决方案

    在Spring项目中,有时候需要加载多份配置文件以简化复杂的配置管理,解决这一问题的方法是使用spring.config.import属性,通过这种方式,可以在主配置文件中指定额外的配置文件路径,支持文件、classpath或URL形式的路径,感兴趣的朋友跟随小编一起看看吧
    2024-10-10

最新评论