我需要在bash脚本中运行hadoop命令,该命令通过亚马逊S3上的一堆文件夹,然后将这些文件夹名称写入txt文件,然后进行进一步处理。但问题是当我运行脚本时,似乎没有文件夹名称被写入txt文件。我想知道是否是hadoop命令运行时间过长,导致bash脚本没有等待它完成就继续进行其他进程。如果是这样,我该如何让bash等待hadoop命令完成后再进行其他进程?
以下是我的代码,我尝试了两种方法,但都不起作用:
以下是我的代码,我尝试了两种方法,但都不起作用:
1.
listCmd="hadoop fs -ls s3n://$AWS_ACCESS_KEY:$AWS_SECRET_KEY@$S3_BUCKET/*/*/$mydate | grep s3n | awk -F' ' '{print $6}' | cut -f 4- -d / > $FILE_NAME"
echo -e "listing... $listCmd\n"
eval $listCmd
...other process ...
2.
echo -e "list the folders we want to copy into a file"
hadoop fs -ls s3n://$AWS_ACCESS_KEY:$AWS_SECRET_KEY@$S3_BUCKET/*/*/$mydate | grep s3n | awk -F' ' '{print $6}' | cut -f 4- -d / > $FILE_NAME
... other process ....
有人知道可能出了什么问题吗?是使用eval函数更好还是直接运行hadoop命令的第二种方法更好呢?
谢谢。