我有一个关于Spark Scala的问题,我想从Rdd数据中计算平均值,我创建了一个新的RDD,如下所示:
[(2,110),(2,130),(2,120),(3,200),(3,206),(3,206),(4,150),(4,160),(4,170)]
我想这样计数,
[(2,(110+130+120)/3),(3,(200+206+206)/3),(4,(150+160+170)/3)]
然后,得到如下结果:
[(2,120),(3,204),(4,160)]
我该如何使用Scala从RDD中实现此操作?我使用的是Spark 1.6版本。