这是关于如何将DataFrame保存为CSV文件的延续。
我正在尝试在pyspark 3.0.1中保存我的pyspark数据框df。所以我写了:
我正在尝试在pyspark 3.0.1中保存我的pyspark数据框df。所以我写了:
df.coalesce(1).write.csv('mypath/df.csv)
执行完毕后,我看到了一个名为df.csv的文件夹,其中包含以下4个文件。
1._committed_..
2._started_...
3._Success
4. part-00000-.. .csv
你能建议我如何将所有数据保存在 df.csv
文件中吗?
!pip3 install dbutils
但是当我运行你的第一行代码时:listFiles = dbutils.fs.ls(path_nm+'.dir/')
我收到了错误信息AttributeError: module 'dbutils' has no attribute 'fs'
。非常感谢您的帮助。 - GenDemo