我正在使用PySpark读取csv文件,以下是我的简单代码。
from pyspark.sql.session import SparkSession
def predict_metrics():
session = SparkSession.builder.master('local').appName("PredictFacebookMetrics").getOrCreate()
dataframe = session.read().format('com.databricks.spark.csv') \
.option('header', True) \
.option('delimiter', ';') \
.option('inferSchema', True) \
.load(r'D:\M\Facebook_metrics_data\dataset_Facebook.csv')
dataframe.printSchema()
dataframe.show(False)
if __name__=='__main__':
predict_metrics()
执行以上代码后,我收到以下错误信息:
TypeError: 'DataFrameReader' 对象不可调用
如何解决这个错误?
session.read.format....
而不是session.read().format..
:) - mkaran