以文件大小为顺序递归列出HDFS文件夹中的文件

3

如果我需要按文件大小递归列出HDFS文件夹中的文件,是否有任何脚本可以参考?

谢谢提前, 林

2个回答

11
bin/hdfs dfs -ls -R / | sort -r -n -k 5

0
尽管@kostya提供了出色的答案,但使用一些awk可以帮助重新排列输出,以改善下游进程。
hdfs dfs -ls -R ${hdfspath} 2> ${hdfsname}.err \
|awk "{ printf \"%s:%s:%s:%s:%s\n\",\$5,\$6,\$3,\$1,\$8; }" \
|sort -rn > hdfs-${hdfsname}.du

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接