我有一个parquet文件,我正在用Spark读取:
SparkSession.builder()
.appName("test")
.config("spark.sql.parquet.compression.codec", "gzip")
.read().parquet(resourcePath)
这是用于读取parquet文件的代码片段。
当文件未经压缩时,一切正常,但当使用gzip压缩它时:
gzip fileName.parquet
然后我遇到了一个运行时异常:
is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 64, 91, 0]
但gzip格式应该被支持了,它是被支持的,我在这里做错了什么?