我希望能够自动化每周从FTP服务器下载文件并将其导入到CDH5 Hadoop集群中。哪种方法是最佳的呢?
我考虑使用Oozie协调器工作,但是我无法想出一个好的下载文件的方法。
我希望能够自动化每周从FTP服务器下载文件并将其导入到CDH5 Hadoop集群中。哪种方法是最佳的呢?
我考虑使用Oozie协调器工作,但是我无法想出一个好的下载文件的方法。
http://oozie.apache.org/docs/3.3.0/DG_ShellActionExtension.html
这段代码可以直接使用
wget http://myftp.com/file.name
你可以在脚本中进行任何你想要的操作