java集合List快速实现重复判断的方法小结

 更新时间:2024年12月31日 08:21:37   作者:荧光石  
在java编写代码中经常会遇到某些重复判定或者去重的操作,本文主要为大家介绍了几个常用方法,感兴趣的小伙伴可以跟随不想一起学习一下

在java编写代码中经常会遇到某些重复判定或者去重的操作,包括:

  • 数据清洗:从数据库或其他来源获取的数据可能包含重复项,需要去重。
  • 用户输入:前段传入的数据可能存在重复,需要校验去除重来避免处理时出现错误或不一致。
  • 列表合并:将多个列表合并后,可能会产生重复元素,去重也是合并后常见的操作。

以下是用来记录会用到的去重操作,以防忘记:

1、使用流式 API

使用流式 API,通过流式 API 优雅地检查重复数据(推荐)

import java.util.Arrays;
import java.util.List;
import java.util.Set;
import java.util.stream.Collectors;

public class CheckDuplicate {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("A", "B", "C", "A");

        // 找到重复元素
        Set<String> duplicates = list.stream()
                .filter(item -> list.stream().filter(item::equals).count() > 1)
                .collect(Collectors.toSet());

        System.out.println("重复元素: " + duplicates);
        System.out.println("是否存在重复数据: " + !duplicates.isEmpty());
    }
}

stream 是一种功能非常强大的方式,可以很便利的使用声明式方法对集合进行处理,不需要显式地操作集合中的元素。它提供了一个更加函数式的编程模型,允许你进行过滤、转换、收集等操作,同时链式调用,提高了代码的可读性和简洁性。

相比下forEach 是集合类的一个方法,用于对集合中的每个元素执行一个操作,通常是遍历操作。并不提供流式的转换或过滤功能,更多是为了逐个访问元素并执行某些操作。forEach 的典型用法是遍历集合,但不适合用于流式的处理,在这里 forEach 需要显式地在内部写逻辑来计算元素的出现情况。

2、使用原生 Set 快速检查

使用原生 Set 快速检查,可以直接使用 HashSet 或 LinkedHashSet 来判断

import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

public class CheckDuplicate {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("A", "B", "C", "A");

        Set<String> seen = new HashSet<>();
        boolean hasDuplicate = list.stream().anyMatch(item -> !seen.add(item));

        System.out.println("是否存在重复数据: " + hasDuplicate);
    }
}

!seen.add(item) 会返回:

  • true--重复元素,
  • false--非重复元素,第一次添加

anyMatch会匹配所有的流元素,一旦出现符合条件的重复元素就会自动结束流,仅适合判断是否会有重复元素。

3、使用new HashSet<>(list)

使用new HashSet<>(list),最后判断两个list间size大小判断是否重复

import cn.hutool.core.collection.CollUtil;

import java.util.Arrays;
import java.util.List;
import java.util.Set;

public class CheckDuplicate {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("A", "B", "C", "A");

        // 使用 Hutool 的工具方法创建 HashSet
        Set<String> set = new HashSet<>(list);
        boolean hasDuplicate = set.size() != list.size();

        System.out.println("是否存在重复数据: " + hasDuplicate);
    }
}

比较两个集合size大小就可判断是否存在重复元素,因为Set下的集合是自动去重的,如果存在重复则集合大小会缩减

4、使用CollUtil.countMap()方法

如果有hutool工具,可以使用CollUtil.countMap()方法

import cn.hutool.core.collection.CollUtil;

import java.util.Arrays;
import java.util.List;
import java.util.Map;

public class CheckDuplicate {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("A", "B", "C", "A", "B");

        // 统计每个元素出现的次数
        Map<String, Integer> countMap = CollUtil.countMap(list);
        
        // 打印重复元素
        countMap.forEach((key, value) -> {
            if (value > 1) {
                System.out.println("重复元素: " + key + ",出现次数: " + value);
            }
        });
    }
}

Collutil.countMap()方法不仅可以统计出现的重复的元素,还可以统计出现的频次,返回结果如下:

重复元素: A,出现次数: 2  
重复元素: B,出现次数: 2

相应的还有CollUtil.newHashSet() 去重,CollUtil.getSet()转换Set<>集合去重,以及CollUtil.getCommon()集合交差去重,方法很多有兴趣的伙伴们可以去研究研究。

结语

总得来说java下stream流是非常不错的方式,而且其下有很多filteriteratorfilter(), map(), collect()等操作,便于处理复杂逻辑链路问题

当然,如果仅有一些简单内部处理,直接foreach是最简单高效的方式,避免了流的转换。

到此这篇关于java集合List快速实现重复判断的方法小结的文章就介绍到这了,更多相关java重复判断内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Java如何实现URL带请求参数(get/post)及得到get和post请求url和参数列表的方法

    Java如何实现URL带请求参数(get/post)及得到get和post请求url和参数列表的方法

    本文给大家介绍Java如何实现URL带请求参数(get/post)及得到get和post请求url和参数列表的方法,涉及到 java获取post请求参数的方法,感兴趣的朋友一起看看吧
    2015-10-10
  • Spring解读@Component和@Configuration的区别以及源码分析

    Spring解读@Component和@Configuration的区别以及源码分析

    通过实例分析@Component和@Configuration注解的区别,核心在于@Configuration会通过CGLIB代理确保Bean的单例,而@Component不会,在Spring容器中,使用@Configuration注解的类会被CGLIB增强,保证了即使在同一个类中多次调用@Bean方法
    2024-10-10
  • Java数据结构之图(动力节点Java学院整理)

    Java数据结构之图(动力节点Java学院整理)

    本文章主要讲解学习如何使用JAVA语言以邻接表的方式实现了数据结构---图(Graph)。对java数据结构之图相关知识感兴趣的朋友一起学习吧
    2017-04-04
  • Java Apache common-pool对象池介绍

    Java Apache common-pool对象池介绍

    这篇文章主要介绍了Java Apache common-pool对象池介绍,文章通过围绕主题展开详细的内容介绍,具有一定的参考价值,感兴趣的小伙伴可以参考一下
    2022-09-09
  • 熟悉maven:使java开发变得更高效

    熟悉maven:使java开发变得更高效

    在日常的开发过程中,maven是很常见的项目构建工具。maven可以极大的提高我们的开发效率,帮助我们简化开发过程中一些解决依赖和项目部署的相关问题,所以学习掌握maven的相关知识是非常有必要的
    2021-06-06
  • Java函数式编程(七):MapReduce

    Java函数式编程(七):MapReduce

    这篇文章主要介绍了Java函数式编程(七):MapReduce,本文是系列文章的第7篇,其它文章请参阅本文底部的相关文章,需要的朋友可以参考下
    2014-09-09
  • SpringBoot中到底该如何解决跨域问题

    SpringBoot中到底该如何解决跨域问题

    跨域问题更是老生常谈,随便用标题去google或百度一下,能搜出一大片解决方案,这篇文章主要给大家介绍了关于SpringBoot中到底该如何解决跨域问题的相关资料,需要的朋友可以参考下
    2022-02-02
  • 深入浅析Spring 的aop实现原理

    深入浅析Spring 的aop实现原理

    AOP(Aspect-OrientedProgramming,面向方面编程),可以说是OOP(Object-Oriented Programing,面向对象编程)的补充和完善。本文给大家介绍Spring 的aop实现原理,感兴趣的朋友一起学习吧
    2016-03-03
  • 详解Spring MVC/Boot 统一异常处理最佳实践

    详解Spring MVC/Boot 统一异常处理最佳实践

    在 Web 开发中, 我们经常会需要处理各种异常,这篇文章主要介绍了详解Spring MVC/Boot 统一异常处理最佳实践,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • Spring Boot/Angular整合Keycloak实现单点登录功能

    Spring Boot/Angular整合Keycloak实现单点登录功能

    Keycloak新的发行版命名为Quarkus,专为GraalVM和OpenJDK HotSpot量身定制的一个Kurbernetes Native Java框架,计划2019年底正式发布。这篇文章主要介绍了Spring Boot/Angular整合Keycloak实现单点登录,需要的朋友可以参考下
    2019-10-10

最新评论