我正在使用Snappy压缩格式在HDFS上存储文件。我希望能够检查这些文件是否被创建的Hadoop进程正确执行,因此想将它们复制到本地Linux文件系统上进行检查。
当我将它们复制到本地并尝试使用Google标准库对其进行解压缩时,它告诉我该文件缺少Snappy标识符。当我试图通过插入Snappy标识符来绕过此问题时,它会破坏校验和。
有什么方法可以在不编写单独的Hadoop程序或通过类似Hive的方式传递文件的情况下读取这些文件吗?
当我将它们复制到本地并尝试使用Google标准库对其进行解压缩时,它告诉我该文件缺少Snappy标识符。当我试图通过插入Snappy标识符来绕过此问题时,它会破坏校验和。
有什么方法可以在不编写单独的Hadoop程序或通过类似Hive的方式传递文件的情况下读取这些文件吗?