有没有一种方法可以将Spark DataFrame(而不是RDD)转换为pandas DataFrame?
我尝试了以下方法:
我尝试了以下方法:
var some_df = Seq(
("A", "no"),
("B", "yes"),
("B", "yes"),
("B", "no")
).toDF(
"user_id", "phone_number")
代码:
%pyspark
pandas_df = some_df.toPandas()
错误:
NameError: name 'some_df' is not defined
有什么建议。
var
关键字来声明。 - user3483203