我需要从多个目录中读取parquet文件。
例如,
有没有一种方法可以将这些文件读入一个单独的pandas数据帧中?
注意: 所有parquet文件都是使用pyspark生成的。
例如,
Dir---
|
----dir1---
|
.parquet
.parquet
|
----dir2---
|
.parquet
.parquet
.parquet
有没有一种方法可以将这些文件读入一个单独的pandas数据帧中?
注意: 所有parquet文件都是使用pyspark生成的。
RuntimeError: 解压缩“SNAPPY”不可用。选项:['GZIP','UNCOMPRESSED']
。 - Ahmad Senousi