无法推断类型<type 'str'>的模式。

14

我有以下使用Spark的Python代码:

from pyspark.sql import Row

def simulate(a, b, c):
  dict = Row(a=a, b=b, c=c)
  df = sqlContext.createDataFrame(dict)
  return df

df = simulate("a","b",10)
df.collect()

我正在创建一个Row对象,并希望将其保存为一个DataFrame

然而,我遇到了这个错误:

TypeError: Can not infer schema for type: <type 'str'>

它发生在这行代码上:

df = sqlContext.createDataFrame(dict)

我做错了什么?

1个回答

24

创建单元素数据框是没有意义的。如果您想让它起作用,可以使用列表:df = sqlContext.createDataFrame([dict])


1
存在警告:UserWarning: 推断模式从字典中已经过时,请改用pyspark.sql.Row - Kumar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接