我有以下使用Spark的Python代码:
from pyspark.sql import Row
def simulate(a, b, c):
dict = Row(a=a, b=b, c=c)
df = sqlContext.createDataFrame(dict)
return df
df = simulate("a","b",10)
df.collect()
我正在创建一个Row
对象,并希望将其保存为一个DataFrame
。
然而,我遇到了这个错误:
TypeError: Can not infer schema for type: <type 'str'>
它发生在这行代码上:
df = sqlContext.createDataFrame(dict)
我做错了什么?