阅读 Spark 中的 sortByKey 方法:
sortByKey([ascending], [numTasks]) When called on a dataset of (K, V) pairs where K implements Ordered, returns a dataset of (K, V) pairs sorted by keys in ascending or descending order, as specified in the boolean ascending argument.
是否可以仅返回“N”个结果。因此,不是返回所有结果,而是只返回前10个结果。我可以将排序的集合转换为数组并使用take
方法,但由于这是O(N)操作,是否有更有效的方法?