我在hdfs上有一个文件夹,其中有两个子文件夹,每个子文件夹大约有30个子文件夹,最终每个子文件夹都包含xml文件。 我想列出所有的xml文件,只给出主文件夹的路径。 在本地,我可以使用apache commons-io的 FileUtils.listFiles()来做到这一点。 我已经尝试过了。
FileStatus[] status = fs.listStatus( new Path( args[ 0 ] ) );
但它只列出了前两个子文件夹,而没有继续往下查找。在Hadoop中有没有其他方法可以实现这一点?
hadoop fs -ls -R /user/your_directory
应该会递归地列出目录。 - user9074332