11得票3回答
运行oozie工作流时出现IOException: Filesystem closed异常

我们正在oozie中运行一个工作流。它包含两个步骤:第一个是MapReduce任务,它在HDFS中生成文件;第二个任务是将这些文件中的数据复制到数据库中。 两部分都成功完成,但最后oozie抛出了一个异常,将其标记为失败的过程。 以下是异常信息:2014-05-20 17:29:32,24...

10得票2回答
如何部署和运行Oozie作业?

我想使用oozie来完成一个简单的任务。它将只包含一个简单的Pig操作。我有一个文件:FirstScript.pig 包含如下内容:dual = LOAD 'default.dual' USING org.apache.hcatalog.pig.HCatLoader(); store dual...

7得票2回答
Oozie fs:exists命令带有变量

我在使用Oozie工作流定义中的变量检查特定文件是否已创建时遇到了困难。像以下这样使用绝对路径是有效的,但我无法使用绝对路径: ${fs:exists('/mypath/file.hql')} 在我的情况下,nameNode和工作流ID必须被替换,但在决策节点中这并不起作用。变量没有被替...

7得票3回答
我该如何检查Oozie日志

我的协调器出现了错误:E0301 无效的资源[文件名] 当我执行hadoop fs -ls [filename]命令时,该文件被列出。如何调试出错的原因?如何查看日志文件? 在我的情况下,oozie job -log需要jobId。但是我没有job id,这种情况下如何查看日志。感谢您的回...

7得票3回答
错误:E0505:E0505:应用程序定义

在执行下面的命令时出现错误。 oozie job -oozie http://localhost:11000/oozie -config coordinator.properties -run 错误:E0505:应用程序定义[hdfs://localhost:8020/tmp/oozi...

7得票2回答
在OOZIE-4.1.0中运行多个工作流时出现错误

我按照http://gauravkohli.com/2014/08/26/apache-oozie-installation-on-hadoop-2-4-1/上的步骤,在Linux机器上安装了Oozie 4.1.0。 hadoop version - 2.6.0 maven - 3.0.4...

8得票4回答
Hive内部错误:java.lang.ClassNotFoundException(org.apache.atlas.hive.hook.HiveHook)

我正在使用Hue通过Oozie运行Hive查询。 我通过Hue-Oozie工作流创建了一张表。 我的任务失败了,但是当我在Hive中检查时,表已经被创建了。 日志显示以下错误: 16157 [main] INFO org.apache.hadoop.hive.ql.hooks.ATSHoo...

11得票1回答
在Oozie中Ext JS库未正确安装。

当我访问oozie UI时,我遇到了以下信息: Oozie Web控制台已禁用。 要启用Oozie Web控制台,请安装Ext JS库。 我使用HDP分发,并通过ambari服务安装程序进行安装。 我尝试按照以下链接操作: https://docs.hortonwor...

9得票4回答
oozie -- 输出数据超过其限制 [2048]

我将尝试运行一个简单的工作流,执行一个Hive脚本。 这个Hive脚本只是调用JOIN操作(表非常大); 完成Hive脚本执行后,我期望看到工作流状态从RUNNING变为成功,但事实并非如此。 以下是工作流日志内容: 2016-05-31 15:52:34,590 WARN org.ap...

26得票1回答
选用哪个,Apache Oozie 还是 Apache Airflow?需要做一份比较。

我对作业调度程序还不熟悉,想找一个在大数据集群上运行作业的调度程序。但是现有的选择让我感到困惑。相比于TWS、Autosys等已有的调度程序,发现Oozie存在很多限制。 请提供一些Oozie和Airflow之间的比较点。 非常感谢您的帮助。