Java 8:在流上执行reduce操作

5

我有一个包含键值对的 java.util.stream.Stream,例如:

<1,3> <1,5> <3,1> <4,2> <4,7> <4,8>

现在我想合并所有具有相同键的条目:
<1,[3,5]>  <3,[1]> <4,[2,7,8]>

数据已经排序,因此只需要合并连续的数据集。
现在我正在寻找一种方法来转换流中的内容,而不必将所有数据集加载到内存中。
我希望得到一个java.util.stream.Stream作为结果,其中包含一个值列表而不是单个值。
我的唯一方法是使用自定义迭代器执行合并,但将其转换为迭代器再转回流似乎非常丑陋。
对此,最好的方法是什么?

6
你已经找到了目前可能最好的选择。流媒体并不是你所想要的那种操作的理想选项。 - Louis Wasserman
我认为.groupBy()操作可能会起作用,具体取决于流中的内容。不过,@LouisWasserman可能更好地理解了您的要求。 - KevinO
“不将所有数据集加载到内存中”是什么意思?你的输入是什么?读取文件?查询数据库?通过网络流式传输?无论如何,你需要编写自己的Spliterator,以检索输入,收集下一个键的值,然后在下一个tryAdvance()调用中提供该值。但是,请注意,SpliteratorIterator更丑陋,因此如果丑陋是你的试金石,你最好坚持使用Iterator - Andreas
3
如果我理解正确的话:OP已经有一种方法将其数据库结果集转换为流。他只是不想将所有结果集加载到内存中以获取结果(使用stream.groupBy()的幼稚用法会产生这种令人讨厌的影响)。 - Adrian Shum
1
@Andreas:Spliterator并不比Iterator更丑陋,它更简单。 - Holger
显示剩余6条评论
1个回答

4
这里是由SteamEx提供的解决方案。
int[][] datasets = { { 1, 3 }, { 1, 5 }, { 3, 1 }, { 4, 2 }, { 4, 7 }, { 4, 8 } };

StreamEx.of(datasets) //
        .collapse((a, b) -> a[0] == b[0], groupingBy(a -> a[0], mapping(a -> a[1], toList()))) //
        .forEach(System.out::println);

你可以将 int[] 替换为你自己的 dataset 对象。我们可以添加 peek 来验证它是否进行了惰性加载/计算:

StreamEx.of(datasets) //
        .peek(System.out::println) //
        .collapse((a, b) -> a[0] == b[0], groupingBy(a -> a[0], mapping(a -> a[1], toList()))) //
        .limit(1) //
        .forEach(System.out::println);

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接