我有这段代码:
l = [('Alice', 1),('Jim',2),('Sandra',3)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df.withColumn('age2', df.age + 2).toPandas()
功能良好,能够满足要求。但是假设我只想显示前n行,然后调用toPandas()
返回一个pandas数据帧,我该怎么办呢?我不能调用take(n)
,因为它不会返回数据帧,因此我无法将其传递给toPandas()
。
换句话说,我如何从数据帧中获取前n行,并在结果数据帧上调用toPandas()
?我觉得这应该不难,但我想不出来。
我正在使用Spark 1.6.0。