我有一个包含许多文件和子目录的目录,我希望将其压缩并从hdfs导出到fs。
我遇到了这个问题 - Hadoop:在HDFS中压缩文件? 但似乎只适用于文件,并且使用hadoop-streaming和GzipCodec无法成功处理目录。
将HDFS文件夹压缩为单个gzip文件的最有效方法是什么? 提前致谢。
我遇到了这个问题 - Hadoop:在HDFS中压缩文件? 但似乎只适用于文件,并且使用hadoop-streaming和GzipCodec无法成功处理目录。
将HDFS文件夹压缩为单个gzip文件的最有效方法是什么? 提前致谢。
gzip
操作。您需要先将其转换为tar/har
或类似格式,然后再进行压缩。 - philantrovertTarArchiveOutputStream
这样的类,你可以深入了解一下。 - philantrovert