使用Java获取List交集数据的实现方案小结

 更新时间:2024年03月18日 09:15:30   作者:洛小豆  
今天遇到一个小需求,当用户上传了一个关于用户数据的列表,我们需要将其与数据库中已有的用户数据进行比较,所以本文给大家介绍了使用Java获取List交集数据的实现方案小结,文中有详细的代码示例供大家参考,需要的朋友可以参考下

需求背景

今天遇到一个小需求,当用户上传了一个关于用户数据的列表,我们需要将其与数据库中已有的用户数据进行比较。假设数据库中的用户数据存储在集合A中,而用户上传的数据存储在集合B中。我们需要确定集合B中有多少数据在集合A中,以及有多少数据不在集合A中,并记录这些信息到日志中。那么,我们应该如何处理这个需求呢?

解决方案

一、如何查找两个集合的重复数据?

如果两个集合中存放的都是String类型数据,那这个操作就会简单很多,这里先初始化一下两个集合的数据作为参考,接着给大家一些参考的方法

List<String> listA = Arrays.asList("Apple", "Banana", "Cherry", "Date"); 
List<String> listB = Arrays.asList("Banana", "Date", "Fig", "Grape");

1、使用retainAll()

retainAll()方法会修改原始的集合A,使其只包含同时存在于集合A和集合B中的元素。

// 直接在集合A上使用retainAll()方法,它会保留只存在于集合A和集合B中的元素 
listA.retainAll(listB); 
System.out.println("Elements in both lists: " + listA);

2、使用stream()和filter()

// 使用stream()方法和filter()方法找到两个集合的交集
List<String> intersection = listA.stream()
    .filter(listB::contains)
    .collect(Collectors.toList());

System.out.println("Elements in both lists: " + intersection);

3、使用stream()和anyMatch()

// 使用anyMatch()检查集合A中的每个元素是否在集合B中
List<String> intersection = listA.stream()
    .filter(element -> listB.anyMatch(b -> b.equals(element)))
    .collect(Collectors.toList());

System.out.println("Elements in both lists: " + intersection);

上面的代码使用 listB.anyMatch(b -> b.equals(element))。对于 listA 中的每个元素,它创建一个新的流来遍历 listB 的所有元素,直到找到相等的元素或遍历完所有元素。每次调用 anyMatch 都会遍历 listB,这同样是一个 O(n) 操作;但它在内部使用了流,这会增加额外的开销。

4、使用Collection的intersection()

如果你想要获取两个集合的交集,可以使用Collection接口提供的intersection()方法:

Set<String> intersectionSet = new HashSet<>(listA);
intersectionSet.retainAll(listB);

List<String> intersection = new ArrayList<>(intersectionSet);
System.out.println("Elements in both lists: " + intersection);

5、查询集合B中不与集合A重合的数据

这时候如果要查询包含集合B中不与集合A重合的数据,我们只要简单修改一下上面的方法即可,我们还是使用Java 8的Stream API来创建一个新的集合,这个集合包含集合B中独有的元素。

// 使用Stream API找出集合B中不包含在集合A中的元素
List<String> uniqueInB = listB.stream()
    .filter(element -> !listA.contains(element))
    .collect(Collectors.toList());

// 打印集合B中不和集合A重合的数据
System.out.println("Elements in list B only: " + uniqueInB);

在数据量不大的情况下,使用Stream API的方法通常是足够高效的,并且代码简洁易读。如果数据量非常大,您可能需要考虑其他方法,例如将集合转换为HashSet以提高查找效率,或者使用并行流(parallel streams)来利用多核处理器。

二、假设集合A的数据更多,该如何优化?

如果集合A的数据比集合B中的数据更多,为了提高效率,我们可以做一些调整。这里有两个优化点:

  • 我们使用了listB::contains来检查一个元素是否在集合B中。如果集合A更大,那么使用listA::contains可能会更高效,因为遍历较小的集合将减少必要的contains检查次数。
  • .contains 方法的性能取决于被搜索的集合的类型。对于ArrayListcontains 方法的时间复杂度是 O(n),它会遍历整个列表来查找元素,而对于HashSet,时间复杂度是 O(1),因为它使用哈希表进行查找。我们这时候就可以将集合A转换为一个HashSet

完整的示例代码:

import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import java.util.stream.Collectors;

// 假设集合A和集合B已经初始化
List<String> listA = Arrays.asList("Apple", "Banana", "Cherry", "Date", "Fig", "Grape");
List<String> listB = Arrays.asList("Banana", "Date", "Fig");

// 将集合A转换为HashSet,以提高查找效率
Set<String> setA = new HashSet<>(listA);

// 生成集合C,保存集合A和集合B的重合数据
List<String> listC = listB.stream()
    .filter(setA::contains) // 使用HashSet来检查交集,提高效率
    .collect(Collectors.toList()); // 收集结果到一个新的列表

// 生成集合D,保存集合B中没有和集合A重合的数据
List<String> listD = listB.stream()
    .filter(element -> !setA.contains(element)) // 使用HashSet来检查差异,提高效率
    .collect(Collectors.toList()); // 收集结果到一个新的列表

// 打印结果
System.out.println("List C (common elements): " + listC);
System.out.println("List D (unique to list B): " + listD);

补充说明:

如果集合A和集合B都是使用List实现,那么两种方法的时间复杂度在本质上是相同的。每次调用contains方法时,都会在另一个列表上进行线性搜索,这意味着每次调用的时间复杂度都是O(n)。

对集合A中的每个元素调用listB::contains,如果集合A有n个元素,集合B有m个元素,那么总的时间复杂度就是O(n*m)

对集合B中的每个元素调用listA::contains,同样地,如果集合A有n个元素,集合B有m个元素,那么总的时间复杂度也是O(n*m)

如果集合A远大于集合B,遍历较小的集合B通常在实际应用中效率更高,即使时间复杂度在理论上是相等的。这是因为较小的集合遍历次数更少,从而减少了实际执行的总步骤数。不过,这种效率的差异只能在实际运行时才能体现。

三、如果集合中存放的是对象,该如何操作?

通常情况下,我们不会在集合中存放字符串,都是放一些对象数据,这时候该如何获取呢?在这里我们定义一个Person作为示例,假设Person对象在nameage属性都相同时被认为是相等的。

在Java中使用contains方法来检查一个集合是否包含某个对象时,就需要重写对象的equalshashCode方法。这是因为contains方法的实现依赖于equals方法来比较对象,而hashCode方法则用于快速查找和确定对象在散列数据结构(如HashSetHashMap)中的位置。

equalshashCode方法之间有一个重要的一致性约定:

  • 如果两个对象根据equals方法是相等的,那么它们的hashCode方法也必须返回相同的值。
  • 如果两个对象的hashCode值不同,那么它们一定不相等(根据equals方法)。

这个约定对于HashSetHashMap等集合的正确运作至关重要。如果你只重写了equals方法而没有重写hashCode方法,可能会导致集合的行为不符合预期,例如,即使两个对象相等,HashSet也可能认为它们是不同的对象并存储两个副本。

示例代码

public class Person {
    private String name;
    private int age;

    // 构造函数、getter和setter省略

    @Override
    public boolean equals(Object o) {
        if (this == o) return true; // 如果是同一个对象,直接返回true
        if (o == null || getClass() != o.getClass()) return false; // 如果对象为空或者类类型不一致,返回false

        Person person = (Person) o; // 向下转型

        // 比较name和age属性
        return Objects.equals(name, person.name) && age == person.age;
    }

    @Override
    public int hashCode() {
        // 使用31作为质数,可以减少哈希冲突
        int result = 17;
        result = 31 * result + Objects.hashCode(name); // 根据name计算哈希码
        result = 31 * result + Integer.hashCode(age); // 根据age计算哈希码
        return result;
    }
}

在这个实现中,equals方法首先检查是否是同一个对象,然后检查对象是否为空或者是否是不同的类型。如果这些检查都通过了,它会通过Objects.equals方法比较name属性,并直接比较age属性的值。

hashCode方法使用了一个固定的质数(在这里是17)作为初始哈希码。然后,它使用31作为乘数(31是一个质数,通常用于计算哈希码,因为它有助于避免哈希冲突)。hashCode方法分别对nameage属性调用Objects.hashCodeInteger.hashCode方法来计算它们的哈希码,并将它们组合起来。

以上就是使用Java获取List交集数据的实现方案小结的详细内容,更多关于Java获取List交集数据的资料请关注脚本之家其它相关文章!

相关文章

  • Struts2开发 基本配置与类型转换

    Struts2开发 基本配置与类型转换

    本篇文章,小编将为大家介绍关于Struts2开发 基本配置与类型转换,有需要的朋友可以参考一下
    2013-04-04
  • IDEA个性化设置注释模板详细讲解版

    IDEA个性化设置注释模板详细讲解版

    IDEA自带的注释模板不是太好用,我本人到网上搜集了很多资料系统的整理了一下制作了一份比较完整的模板来分享给大家,下面这篇文章主要给大家介绍了IDEA个性化设置注释模板的相关资料,需要的朋友可以参考下
    2024-01-01
  • 基于Java class对象说明、Java 静态变量声明和赋值说明(详解)

    基于Java class对象说明、Java 静态变量声明和赋值说明(详解)

    下面小编就为大家带来一篇基于Java class对象说明、Java 静态变量声明和赋值说明(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-06-06
  • Mybatis-Plus注入SQL原理分析

    Mybatis-Plus注入SQL原理分析

    本文主要介绍了Mybatis-Plus注入SQL原理分析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-07-07
  • 解决mybatis-plus3.4.1分页插件PaginationInterceptor和防止全表更新与删除插件SqlExplainInterceptor过时失效问题

    解决mybatis-plus3.4.1分页插件PaginationInterceptor和防止全表更新与删除插件SqlE

    这篇文章给大家介绍了在Spring.xml文件中配置mybatis-plus3.4.1分页插件PaginationInterceptor和防止全表更新与删除插件SqlExplainInterceptor过时失效问题解决方案,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2020-12-12
  • java控制台输出百分比进度条示例

    java控制台输出百分比进度条示例

    这篇文章主要介绍了java控制台输出百分比进度条示例,需要的朋友可以参考下
    2014-04-04
  • Mybatis-Plus的条件构造器QueryWrapper & UpdateWrapper示例详解

    Mybatis-Plus的条件构造器QueryWrapper & UpdateWrapper示例详解

    Mybatis-Plus的条件构造器QueryWrapper和UpdateWrapper为开发者提供了强大、灵活的条件构建工具,能够大大简化数据库操作的代码,通过本文的介绍,读者可以更加深入地理解这两个条件构造器的使用方法,并在实际项目中灵活应用,感兴趣的朋友跟随小编一起看看吧
    2024-01-01
  • Spring Boot整合EhCache的步骤详解

    Spring Boot整合EhCache的步骤详解

    EhCache 是一个纯Java的进程内缓存框架,具有快速、精干等特点,是Hibernate中默认CacheProvider。这篇文章主要介绍了Spring Boot整合EhCache的步骤详解,需要的朋友可以参考下
    2020-02-02
  • Java swing仿酷狗音乐播放器

    Java swing仿酷狗音乐播放器

    这篇文章主要为大家详细介绍了Java swing实现音乐播放器,Java开发图形界面程序音乐播放器仿酷狗音乐播放器,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-06-06
  • java设计模式学习之装饰模式

    java设计模式学习之装饰模式

    这篇文章主要为大家详细介绍了java设计模式学习之装饰模式的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-10-10

最新评论