如何解压以snappy结尾的Hadoop reduce输出文件?

13
我们的Hadoop集群默认使用snappy编解码器。 Hadoop作业reduce输出文件名称类似于part-r-00000.snappy。 由于JSnappy需要以SNZ开头,而reduce输出文件以一些字节0开头,因此JSnappy无法解压缩该文件。您如何解压该文件?

2
类似于在Hadoop邮件列表上提出的问题 - http://mail-archives.apache.org/mod_mbox/hadoop-mapreduce-user/201305.mbox/%3C1165688733-1369155084-cardhu_decombobulator_blackberry.rim.net-1208212455-@b4.c16.bise7.blackberry%3E - Chris White
2
hadoop fs -text snappy_file 可以正常运行。谢谢! - DeepNightTwo
1个回答

18
使用"Hadoop fs -text"命令读取此文件并将其导出到txt文件。 例如: /tmp/mydatafile.txt

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接