Java 8：在流上执行reduce操作

Question

Java 8：在流上执行reduce操作

5

我有一个包含键值对的 java.util.stream.Stream，例如：

<1,3> <1,5> <3,1> <4,2> <4,7> <4,8>

现在我想合并所有具有相同键的条目：

<1,[3,5]>  <3,[1]> <4,[2,7,8]>

数据已经排序，因此只需要合并连续的数据集。

现在我正在寻找一种方法来转换流中的内容，而不必将所有数据集加载到内存中。

我希望得到一个java.util.stream.Stream作为结果，其中包含一个值列表而不是单个值。

我的唯一方法是使用自定义迭代器执行合并，但将其转换为迭代器再转回流似乎非常丑陋。

对此，最好的方法是什么？

- Spille

6

你已经找到了目前可能最好的选择。流媒体并不是你所想要的那种操作的理想选项。 - Louis Wasserman

我认为.groupBy()操作可能会起作用，具体取决于流中的内容。不过，@LouisWasserman可能更好地理解了您的要求。 - KevinO

“不将所有数据集加载到内存中”是什么意思？你的输入是什么？读取文件？查询数据库？通过网络流式传输？无论如何，你需要编写自己的Spliterator，以检索输入，收集下一个键的值，然后在下一个tryAdvance()调用中提供该值。但是，请注意，Spliterator比Iterator更丑陋，因此如果丑陋是你的试金石，你最好坚持使用Iterator。 - Andreas

3

如果我理解正确的话：OP已经有一种方法将其数据库结果集转换为流。他只是不想将所有结果集加载到内存中以获取结果（使用stream.groupBy()的幼稚用法会产生这种令人讨厌的影响）。 - Adrian Shum

1

@Andreas：Spliterator并不比Iterator更丑陋，它更简单。 - Holger

显示剩余6条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- user_3380739 · Accepted Answer

这里是由SteamEx提供的解决方案。

int[][] datasets = { { 1, 3 }, { 1, 5 }, { 3, 1 }, { 4, 2 }, { 4, 7 }, { 4, 8 } };

StreamEx.of(datasets) //
        .collapse((a, b) -> a[0] == b[0], groupingBy(a -> a[0], mapping(a -> a[1], toList()))) //
        .forEach(System.out::println);

你可以将 int[] 替换为你自己的 dataset 对象。我们可以添加 peek 来验证它是否进行了惰性加载/计算：

StreamEx.of(datasets) //
        .peek(System.out::println) //
        .collapse((a, b) -> a[0] == b[0], groupingBy(a -> a[0], mapping(a -> a[1], toList()))) //
        .limit(1) //
        .forEach(System.out::println);