Spark中UDAF与聚合器的性能比较

3
我正在尝试编写一些性能意识代码,并思考是否应该为我的Dataframe上的汇总操作编写一个Aggregator或User-defined Aggregate Function(UDAF)来提高性能。我无法在任何地方找到关于这些方法的速度和哪个应该在Spark 2.0+中使用的数据。请参考以下链接:AggregatorUser-defined Aggregate Function

你在考虑哪些“Rollup操作”?Rollup聚合已经被Spark SQL支持了。 - Jacek Laskowski
@JacekLaskowski 你好,我的意思是使用 rollup,但是使用自定义聚合函数。 - Thomas Russell
1个回答

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接