类型错误:'DataFrameReader'对象不可调用。

5

我正在使用PySpark读取csv文件,以下是我的简单代码。

from pyspark.sql.session import SparkSession

def predict_metrics():
    session = SparkSession.builder.master('local').appName("PredictFacebookMetrics").getOrCreate()
    dataframe = session.read().format('com.databricks.spark.csv') \
        .option('header', True) \
        .option('delimiter', ';') \
        .option('inferSchema', True) \
        .load(r'D:\M\Facebook_metrics_data\dataset_Facebook.csv')
    dataframe.printSchema()
    dataframe.show(False)

if __name__=='__main__':
    predict_metrics()

执行以上代码后,我收到以下错误信息:
TypeError: 'DataFrameReader' 对象不可调用
如何解决这个错误?

2
它是session.read.format....而不是session.read().format.. :) - mkaran
1
是的,成功了。谢谢! - MSS
1个回答

8
建议中提到,应该使用session.read.format而不是session.read().format

我真傻!


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接