我需要将我的Hadoop结果以.csv格式输出。 我该怎么做? 我的代码:https://github.com/studhadoop/xml/blob/master/XmlParser11.java
我是否应该在我的代码中简单地包含csvoutputFormat。 我正在使用mapreduce API。
myjob.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
解决方案
是的,我在 cat 命令中漏掉了 > 符号。
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
cat /Users/jobsubmit/part-r-00000 > /Users/jobsubmit/output.csv
缺少重定向操作符。注意命令中的“>”,它会将标准输出写入文件。此外,使用“part-r-*”,以便如果有多个文件,所有文件都被考虑在内。 - Rags