类型错误：'DataFrameReader'对象不可调用。

Question

类型错误：'DataFrameReader'对象不可调用。

5

我正在使用PySpark读取csv文件，以下是我的简单代码。

from pyspark.sql.session import SparkSession

def predict_metrics():
    session = SparkSession.builder.master('local').appName("PredictFacebookMetrics").getOrCreate()
    dataframe = session.read().format('com.databricks.spark.csv') \
        .option('header', True) \
        .option('delimiter', ';') \
        .option('inferSchema', True) \
        .load(r'D:\M\Facebook_metrics_data\dataset_Facebook.csv')
    dataframe.printSchema()
    dataframe.show(False)

if __name__=='__main__':
    predict_metrics()

执行以上代码后，我收到以下错误信息：

TypeError: 'DataFrameReader' 对象不可调用

如何解决这个错误？

- MSS

2

它是session.read.format....而不是session.read().format.. :) - mkaran

1

是的，成功了。谢谢！ - MSS

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- MSS · Accepted Answer

建议中提到，应该使用session.read.format而不是session.read().format

我真傻！