我有一个数据框(Dataframe),是从CSV文件中读取的,有很多列,例如:时间戳(timestamp)、步数(steps)、心率(heartrate)等。
我想要对每一列的值进行求和,比如说在“steps”列上求步数的总和。
据我所见,我需要使用这些函数: http://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.functions$
但是我不知道如何使用sum函数。
当我写下以下内容时:
val df = CSV.load(args(0))
val sumSteps = df.sum("steps")
函数sum无法解析。
我是否错误地使用了函数sum? 我需要先使用函数map吗? 如果是,应该怎么做?
一个简单的例子会非常有帮助! 我最近开始学习Scala。
df.agg(sum("col1"), sum("col2"), ...)
这样做。 - Daniel de Paula