我是一个对Spark/Scala比较新的人。我想知道是否有一种简单的方法来以列的方式聚合Array[Double]。以下是一个例子:
c1 c2 c3
-------------------------
1 1 [1.0, 1.0, 3.4]
1 2 [1.0, 0,0, 4.3]
2 1 [0.0, 0.0, 0.0]
2 3 [1.2, 1.1, 1.1]
然后,当聚合完成时,我将得到一个类似于以下表格的表格:
c1 c3prime
-------------
1 [2.0, 1.0, 7.7]
2 [1.2, 1.1, 1.1]
现在正在查看UDAF,但想知道我是否需要编写代码?
感谢您的考虑。