Stream流根据属性去重

2023-05-13 16:24 由 zxxstar 发表于 #后端开发

List根据属性去重

创建一个user集合

 User user1 = new User("user1", 18, "AAA");
        User user2 = new User("user2", 18, "BBB");
        User user3 = new User("user3", 18, "AAA");
        User user4 = new User("user4", 75, "CCC");
        User user5 = new User("user5", 35, "AAA");

        ArrayList<User> list = new ArrayList<>();
        list.add(user1);
        list.add(user2);
        list.add(user3);
        list.add(user4);
        list.add(user5);

自定义Predict函数，使用filter()

写一个Predict

public class DistinctKeyUtil {
    public static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {
        ConcurrentHashMap<Object, Boolean> map = new ConcurrentHashMap<>();
        return t -> map.putIfAbsent(keyExtractor.apply(t), Boolean.TRUE) == null;
    }
}

使用filter方法

/**
* 写一个Predict进行属性过滤
*/
//先过滤age在过滤hobby
List<User> result = list.stream()
.filter(DistinctKeyUtil.distinctByKey(n -> n.getAge()))
.filter(DistinctKeyUtil.distinctByKey(n -> n.getHobby()))
.collect(Collectors.toList());

result.forEach(System.out::println);

结果：

User{name='user1', age=18, hobby='AAA'}
User{name='user4', age=75, hobby='CCC'}

小结：

实质上是将每个元素都放到distinctByKey()中的ConcurrentHashMap作为key进行过滤，如果key不存在那么就加上去，如果已经存在了就不加。所以这种方式的过滤只保留第一个重复元素。

利用TreeSet

        //过滤age
        ArrayList<User> result2 = list.stream().collect(
                Collectors.collectingAndThen(
                        Collectors.toCollection(
                                () -> new TreeSet<>(Comparator.comparing(o -> o.getAge()))), ArrayList::new));
								
        result2.forEach(System.out::println);

结果与上面的一样

同时过滤两个属性

        //age和hobby一起过滤
        ArrayList<User> result1 = list.stream().collect(
                Collectors.collectingAndThen(
                        Collectors.toCollection(
                                () -> new TreeSet<>(Comparator.comparing(o -> o.getHobby() + ";" + o.getAge()))), ArrayList::new)
        );
        result1.forEach(System.out::println);

结果：

User{name='user1', age=18, hobby='AAA'}
User{name='user5', age=35, hobby='AAA'}
User{name='user2', age=18, hobby='BBB'}
User{name='user4', age=75, hobby='CCC'}

小结：

TreeSet存储唯一的元素，并且按升序对元素进行排序。

Map：保证Key的唯一性

        /**
         * map 根据某属性过滤
         */
        //  Function.identity() 相等于  o->o
        Map<String, User> map1 = list.stream().collect(Collectors.toMap(User::getHobby, Function.identity(), (t1, t2) -> t1));
        Set<Map.Entry<String, User>> entries1 = map1.entrySet();
        entries1.forEach(System.out::println);

结果：

AAA=User{name='user1', age=18, hobby='AAA'}
CCC=User{name='user4', age=75, hobby='CCC'}
BBB=User{name='user2', age=18, hobby='BBB'}

小结：

map可以选择保留重复属性中的前一条数据还是后一条：(t1, t2) -> t1)

热门相关：天神下凡横行霸道修仙界最后的单纯战神无限杀路

浅谈如何使用 github.com/yuin/gopher-lua

最近熟悉 go 项目时，发现项目中有用到 github.com/yuin/gopher-lua 这个包，之前并没有接触过，特意去看了官方文档和找了些网上的资料，特此记录下。本次介绍计划分为两篇文章，这一次主要介绍 github.com/yuin/gopher-lua 这个包的介绍以及基础使用，下一 ...阅读全文

瑞吉外卖day4

菜品管理业务开发文件上传与下载文件上传介绍服务端要接收客户端页面上传的文件，通常都会使用Apache的两个组件 1.commons-file upload 2.commons-io Spring框架在spring-web包中对文件上传进行了封装。只需要在Controller的方法中声明一个M ...阅读全文

spring框架_@AutoWiredAnnotationBeanPostProcessor执行分析

AutoWiredAnnotationBeanPostProcessor 执行依赖注入的时候（解析@Autowired）调用了postProcessProperties 方法这个方法首先要找到哪些属性，方法被标注了@Autowired注解，把这些数据添加到 InjectMetadata中，然后调用 ...阅读全文

go相当详细的基础语法

运行命令 go run xx.go或者 go build xx.go + ./xx package main import ( "fmt" ) func main() { fmt.Println("hello world") } 基础语法 package main import ( "fmt" ...阅读全文

随机生成工具类---主要目的是为了造大量数据准备

有时候需要造大量数据进行测试，或者是用于学习，当然了这个工具类的目的就是为了后面测试easyExcel与 easyPoi 两者性能准备的需要引入一个 hutool工具类 hutool 工具类在此工具类上的影响并不多，好像就一个随机生成年龄的地方，才用到了，如果不想引入可以直接删除即可 <depen ...阅读全文

用go设计开发一个自己的轻量级登录库/框架吧(业务篇)

本篇将讲讲登录库中的三种登录模式的实现: 同一用户只能登录一次, 同一用户多次登录多token,同一用户多次登录共享一个token，源码：weloe/token-go: a light login library (github.com) ...阅读全文

R语言数据绘图学习（0x01）-安装ggplot2与尝试

0x01 安装与R基础一直听说数据分析里R语言是比较‘正统’，况且久闻ggplot2这些R语言的数据分析库大名，想到今后数据分析和整理的需要，这里开一个简单的系列学习一些R语言和ggplot2的绘图基础。本人学习的书籍是Winston Chang大佬的《R Graphics Cookbook》，且 ...阅读全文

python高级技术（进程二）

一进程对象及其他方法 '''一台计算机上面运行着很多进程，那么计算机是如何区分并管理这些进程服务端的呢？计算机会给每一个运行的进程分配一个PID号如何查看 windows电脑进入cmd输入tasklist即可查看 tasklist|findstr PID查看具体的进程 linux电脑进入终端之 ...阅读全文

Django笔记四十之运行Django环境的python脚本

本文首发于公众号：Hunter后端原文链接：Django笔记四十之运行Django环境的python脚本这一篇笔记介绍如何在 Django 中运行脚本。假设说我们要实现一个功能，需要获取 blog.models.Blog 这张表里的总数且使用 print() 输出。如果代码逻辑很短，且是一次 ...阅读全文

使用 IDEA 时突然断电导致 git 本地分支损坏的解决方案

使用IDEA提交项目的时候突然断电，重启后项目 git 损坏，所有文件变成了 untracked，IDEA 界面上表示为所有文件名变成绿色，并且无法 pull （也可能是无法 push）提示 Git Pull Failed From http://***************** * branc ...阅读全文