8得票1回答
Apache Spark还是Cascading框架?

我对何时使用层叠框架和何时使用Apache Spark感到困惑。每个框架适用的合适用例是什么? 任何帮助都将不胜感激。

8得票3回答
如何防止Hadoop作业因损坏的输入文件而失败

我正在运行hadoop作业,处理许多输入文件。但是,如果其中一个文件损坏了,整个作业就会失败。 我该如何让作业忽略损坏的文件?也许可以为我编写一些计数器/错误日志,但不要使整个作业失败。

7得票1回答
为什么这个Gradle构建脚本无法编译Java类?

我正在尝试在我的Hadoop项目中使用Cascading。我正在尝试实现《Enterprise Data Workflows with Cascading》书中给出的第一个示例。我编写了一个包含Cascading相关代码的Java类,并且我还有一个build.gradle文件,它应该编译那个J...

7得票2回答
工作流工具比较:Oozie Vs Cascading

我正在寻找一个工作流程工具来运行复杂的Map-Reduce任务。我考虑使用Oozie,但也想探索Cascading。你能提供使用Cascading API链接现有M/R任务的示例代码或实例吗?另外,你能比较一下Oozie和Cascading吗?