如何通过Java Stream高效计算多表关联后的平均值并进行排序?

2026-05-17 12:451阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计1608个文字,预计阅读时间需要7分钟。

如何通过Java Stream高效计算多表关联后的平均值并进行排序?

使用Java Stream API,我们可以高效地处理多表关联数据,计算平均值并进行排序。以下是一个示例,演示如何从用户、电影和评分数据中找出评分最高的5部电影,并按预测评分降序排列。

javaimport java.util.*;import java.util.stream.Collectors;

// 假设我们有以下类定义class User { int id; String name;}

class Movie { int id; String title; double predictedRating;}

class Rating { int userId; int movieId; double rating;}

public class MovieRatings { public static void main(String[] args) { // 模拟数据 List users=Arrays.asList(new User(1, Alice), new User(2, Bob)); List movies=Arrays.asList(new Movie(1, Inception, 4.5), new Movie(2, The Matrix, 4.7), new Movie(3, The Dark Knight, 4.8), new Movie(4, Interstellar, 4.9), new Movie(5, Avatar, 4.6)); List ratings=Arrays.asList(new Rating(1, 1, 4.0), new Rating(1, 2, 5.0), new Rating(2, 1, 3.5), new Rating(2, 4, 5.0), new Rating(1, 5, 4.5), new Rating(2, 3, 5.0));

// 计算每个电影的平均评分并找出评分最高的5部电影 List topMovies=ratings.stream() .collect(Collectors.groupingBy(rating -> movies.stream() .filter(movie -> movie.id==rating.movieId) .findFirst() .orElse(new Movie()))) .entrySet().stream() .sorted(Map.Entry.comparingByValue().reversed()) .limit(5) .map(Map.Entry::getKey) .collect(Collectors.toList());

// 输出结果 for (Movie movie : topMovies) { System.out.println(Title: + movie.title + , Average Rating: + rating); } }}

这个代码示例中,我们首先创建了模拟的用户、电影和评分数据。然后,我们使用Stream API计算每个电影的平均评分,并通过降序排序和限制数量来找出评分最高的5部电影。最后,我们输出这些电影的信息。

使用 Java Stream 处理多表关联数据

在实际应用中,经常会遇到需要关联多个表的数据进行分析和处理的情况。Java Stream API 提供了强大的功能,可以方便地进行数据过滤、转换、聚合和排序。本文将通过一个具体的例子,演示如何使用 Java Stream API,从用户、电影和评分三个表中,找出平均评分最高的 5 部电影,并按照预算进行降序排列。

数据模型

首先,定义三个数据模型:User、Movie 和 Score。

record User(int id, String name) {} record Movie(int id, String name, int budget) {} record Score(int userId, int movieId, int score) {}

示例数据

接下来,创建一些示例数据,用于演示 Stream API 的使用。

立即学习“Java免费学习笔记(深入)”;

List<Movie> movies = List.of( new Movie(101, "Mov 1", 200), new Movie(102, "Mov 2", 500), new Movie(103, "Mov 3", 300)); List<Score> scores = List.of( new Score(1, 101, 7), new Score(2, 101, 8), new Score(1, 102, 6), new Score(2, 102, 9));

使用 Stream API 计算平均评分并排序

核心逻辑是使用 scores 列表,按照 movieId 进行分组,计算每个电影的平均评分,然后按照平均评分降序排列,最后取前 5 部电影,并按照预算降序排列。

Map<Integer, Movie> movieMap = movies.stream() .collect(Collectors.toMap(Movie::id, Function.identity())); List<Movie> top5 = scores.stream() .collect(Collectors.groupingBy( Score::movieId, Collectors.averagingDouble(Score::score))) .entrySet().stream() .sorted(Collections.reverseOrder(Entry.comparingByValue())) .limit(5) .map(e -> movieMap.get(e.getKey())) .sorted(Collections.reverseOrder(Comparator.comparing(Movie::budget))) .toList(); top5.forEach(System.out::println);

代码解释:

  1. movieMap 的创建: 将 movies 列表转换为一个 Map<Integer, Movie>,key 为 movieId,value 为 Movie 对象本身。这方便后续通过 movieId 查找对应的 Movie 对象。
  2. scores.stream(): 从 scores 列表创建一个 Stream。
  3. collect(Collectors.groupingBy(...)): 使用 groupingBy 收集器,按照 Score::movieId 对评分进行分组,并使用 averagingDouble(Score::score) 计算每个电影的平均评分。结果是一个 Map<Integer, Double>,key 为 movieId,value 为平均评分。
  4. .entrySet().stream(): 将 Map<Integer, Double> 转换为一个 Stream<Map.Entry<Integer, Double>>,方便进行排序。
  5. sorted(Collections.reverseOrder(Entry.comparingByValue())): 按照平均评分降序排列。Entry.comparingByValue() 返回一个比较器,用于比较 Map.Entry 的 value(即平均评分)。Collections.reverseOrder() 将比较器反转,实现降序排列。
  6. limit(5): 取前 5 部电影。
  7. map(e -> movieMap.get(e.getKey())): 使用 movieMap,将 movieId 转换为对应的 Movie 对象。
  8. sorted(Collections.reverseOrder(Comparator.comparing(Movie::budget))): 按照电影的预算降序排列。
  9. toList(): 将 Stream 转换为一个 List<Movie>。
  10. top5.forEach(System.out::println): 打印结果。

完整代码示例

import java.util.Collections; import java.util.Comparator; import java.util.List; import java.util.Map; import java.util.function.Function; import java.util.stream.Collectors; import java.util.Map.Entry; public class StreamExample { record User(int id, String name) {} record Movie(int id, String name, int budget) {} record Score(int userId, int movieId, int score) {} public static void main(String[] args) { List<Movie> movies = List.of( new Movie(101, "Mov 1", 200), new Movie(102, "Mov 2", 500), new Movie(103, "Mov 3", 300)); List<Score> scores = List.of( new Score(1, 101, 7), new Score(2, 101, 8), new Score(1, 102, 6), new Score(2, 102, 9)); Map<Integer, Movie> movieMap = movies.stream() .collect(Collectors.toMap(Movie::id, Function.identity())); List<Movie> top5 = scores.stream() .collect(Collectors.groupingBy( Score::movieId, Collectors.averagingDouble(Score::score))) .entrySet().stream() .sorted(Collections.reverseOrder(Entry.comparingByValue())) .limit(5) .map(e -> movieMap.get(e.getKey())) .sorted(Collections.reverseOrder(Comparator.comparing(Movie::budget))) .toList(); top5.forEach(System.out::println); } }

注意事项

  • 确保数据模型的定义清晰,并与实际数据结构一致。
  • 理解 Stream API 的各个操作符的含义和作用,例如 groupingBy、averagingDouble、sorted、limit 和 map 等。
  • 注意 Stream 操作的顺序,不同的顺序可能会影响结果。
  • 在处理大量数据时,可以考虑使用并行 Stream,以提高性能。例如,可以使用 scores.parallelStream() 创建一个并行 Stream。

总结

本文介绍了如何使用 Java Stream API,针对多表关联数据,计算平均值并进行排序。通过一个具体的例子,演示了如何从用户、电影和评分三个表中,找出平均评分最高的 5 部电影,并按照预算进行降序排列。掌握 Stream API 可以方便地进行数据分析和处理,提高开发效率。

本文共计1608个文字,预计阅读时间需要7分钟。

如何通过Java Stream高效计算多表关联后的平均值并进行排序?

使用Java Stream API,我们可以高效地处理多表关联数据,计算平均值并进行排序。以下是一个示例,演示如何从用户、电影和评分数据中找出评分最高的5部电影,并按预测评分降序排列。

javaimport java.util.*;import java.util.stream.Collectors;

// 假设我们有以下类定义class User { int id; String name;}

class Movie { int id; String title; double predictedRating;}

class Rating { int userId; int movieId; double rating;}

public class MovieRatings { public static void main(String[] args) { // 模拟数据 List users=Arrays.asList(new User(1, Alice), new User(2, Bob)); List movies=Arrays.asList(new Movie(1, Inception, 4.5), new Movie(2, The Matrix, 4.7), new Movie(3, The Dark Knight, 4.8), new Movie(4, Interstellar, 4.9), new Movie(5, Avatar, 4.6)); List ratings=Arrays.asList(new Rating(1, 1, 4.0), new Rating(1, 2, 5.0), new Rating(2, 1, 3.5), new Rating(2, 4, 5.0), new Rating(1, 5, 4.5), new Rating(2, 3, 5.0));

// 计算每个电影的平均评分并找出评分最高的5部电影 List topMovies=ratings.stream() .collect(Collectors.groupingBy(rating -> movies.stream() .filter(movie -> movie.id==rating.movieId) .findFirst() .orElse(new Movie()))) .entrySet().stream() .sorted(Map.Entry.comparingByValue().reversed()) .limit(5) .map(Map.Entry::getKey) .collect(Collectors.toList());

// 输出结果 for (Movie movie : topMovies) { System.out.println(Title: + movie.title + , Average Rating: + rating); } }}

这个代码示例中,我们首先创建了模拟的用户、电影和评分数据。然后,我们使用Stream API计算每个电影的平均评分,并通过降序排序和限制数量来找出评分最高的5部电影。最后,我们输出这些电影的信息。

使用 Java Stream 处理多表关联数据

在实际应用中,经常会遇到需要关联多个表的数据进行分析和处理的情况。Java Stream API 提供了强大的功能,可以方便地进行数据过滤、转换、聚合和排序。本文将通过一个具体的例子,演示如何使用 Java Stream API,从用户、电影和评分三个表中,找出平均评分最高的 5 部电影,并按照预算进行降序排列。

数据模型

首先,定义三个数据模型:User、Movie 和 Score。

record User(int id, String name) {} record Movie(int id, String name, int budget) {} record Score(int userId, int movieId, int score) {}

示例数据

接下来,创建一些示例数据,用于演示 Stream API 的使用。

立即学习“Java免费学习笔记(深入)”;

List<Movie> movies = List.of( new Movie(101, "Mov 1", 200), new Movie(102, "Mov 2", 500), new Movie(103, "Mov 3", 300)); List<Score> scores = List.of( new Score(1, 101, 7), new Score(2, 101, 8), new Score(1, 102, 6), new Score(2, 102, 9));

使用 Stream API 计算平均评分并排序

核心逻辑是使用 scores 列表,按照 movieId 进行分组,计算每个电影的平均评分,然后按照平均评分降序排列,最后取前 5 部电影,并按照预算降序排列。

Map<Integer, Movie> movieMap = movies.stream() .collect(Collectors.toMap(Movie::id, Function.identity())); List<Movie> top5 = scores.stream() .collect(Collectors.groupingBy( Score::movieId, Collectors.averagingDouble(Score::score))) .entrySet().stream() .sorted(Collections.reverseOrder(Entry.comparingByValue())) .limit(5) .map(e -> movieMap.get(e.getKey())) .sorted(Collections.reverseOrder(Comparator.comparing(Movie::budget))) .toList(); top5.forEach(System.out::println);

代码解释:

  1. movieMap 的创建: 将 movies 列表转换为一个 Map<Integer, Movie>,key 为 movieId,value 为 Movie 对象本身。这方便后续通过 movieId 查找对应的 Movie 对象。
  2. scores.stream(): 从 scores 列表创建一个 Stream。
  3. collect(Collectors.groupingBy(...)): 使用 groupingBy 收集器,按照 Score::movieId 对评分进行分组,并使用 averagingDouble(Score::score) 计算每个电影的平均评分。结果是一个 Map<Integer, Double>,key 为 movieId,value 为平均评分。
  4. .entrySet().stream(): 将 Map<Integer, Double> 转换为一个 Stream<Map.Entry<Integer, Double>>,方便进行排序。
  5. sorted(Collections.reverseOrder(Entry.comparingByValue())): 按照平均评分降序排列。Entry.comparingByValue() 返回一个比较器,用于比较 Map.Entry 的 value(即平均评分)。Collections.reverseOrder() 将比较器反转,实现降序排列。
  6. limit(5): 取前 5 部电影。
  7. map(e -> movieMap.get(e.getKey())): 使用 movieMap,将 movieId 转换为对应的 Movie 对象。
  8. sorted(Collections.reverseOrder(Comparator.comparing(Movie::budget))): 按照电影的预算降序排列。
  9. toList(): 将 Stream 转换为一个 List<Movie>。
  10. top5.forEach(System.out::println): 打印结果。

完整代码示例

import java.util.Collections; import java.util.Comparator; import java.util.List; import java.util.Map; import java.util.function.Function; import java.util.stream.Collectors; import java.util.Map.Entry; public class StreamExample { record User(int id, String name) {} record Movie(int id, String name, int budget) {} record Score(int userId, int movieId, int score) {} public static void main(String[] args) { List<Movie> movies = List.of( new Movie(101, "Mov 1", 200), new Movie(102, "Mov 2", 500), new Movie(103, "Mov 3", 300)); List<Score> scores = List.of( new Score(1, 101, 7), new Score(2, 101, 8), new Score(1, 102, 6), new Score(2, 102, 9)); Map<Integer, Movie> movieMap = movies.stream() .collect(Collectors.toMap(Movie::id, Function.identity())); List<Movie> top5 = scores.stream() .collect(Collectors.groupingBy( Score::movieId, Collectors.averagingDouble(Score::score))) .entrySet().stream() .sorted(Collections.reverseOrder(Entry.comparingByValue())) .limit(5) .map(e -> movieMap.get(e.getKey())) .sorted(Collections.reverseOrder(Comparator.comparing(Movie::budget))) .toList(); top5.forEach(System.out::println); } }

注意事项

  • 确保数据模型的定义清晰,并与实际数据结构一致。
  • 理解 Stream API 的各个操作符的含义和作用,例如 groupingBy、averagingDouble、sorted、limit 和 map 等。
  • 注意 Stream 操作的顺序,不同的顺序可能会影响结果。
  • 在处理大量数据时,可以考虑使用并行 Stream,以提高性能。例如,可以使用 scores.parallelStream() 创建一个并行 Stream。

总结

本文介绍了如何使用 Java Stream API,针对多表关联数据,计算平均值并进行排序。通过一个具体的例子,演示了如何从用户、电影和评分三个表中,找出平均评分最高的 5 部电影,并按照预算进行降序排列。掌握 Stream API 可以方便地进行数据分析和处理,提高开发效率。