需要从一个包含10万多个记录的单个文件中加载数据,并将其分别插入到MySQL的多个表中,同时保持文件/表中定义的关系;也就是说,关系已经匹配。解决方案应该在最新版本的MySQL上运行,并且需要使用InnoDB引擎;MyISAM不支持外键。 我完全不了解使用Pentaho Data Integ...
如何让Pentaho在连接错误时重试rest请求? 我们有一个Pentaho BI系统,它在众多数据源中为每次运行查询特定的REST API,共进行超过20k个查询变化。 可预见的是,在大多数运行中,由于连接故障,其中一些请求会失败。这通常会在Pentaho日志中表现为org.pentah...
终于让水壶开始工作并且不卡住了,但我仍然不能充分利用它,因为当我尝试创建新的数据库连接(在创建新的转换之后)时,我得到了这个错误:org.pentaho.ui.xul.XulException: java.lang.reflect.InvocationTargetException 此后,我对...
我有一个要求,每当我运行我的Kettle作业时,数据库连接参数必须从每次运行的Excel来源动态获取。 假设我有一张包含列名的 Excel:HostName,Username,Database,Password。 我想在作业运行时将这些连接参数动态传递给我的表输入步骤。 这就是我试图做的...
我已经编写了Java代码来执行我的转换和作业,并手动将 data-integration/lib 文件夹中存在的所有 Jar 文件添加到我的类路径中,一切正常。现在我想将我的项目 Maven 化,并寻找一个 XML,其中指定了 data-integration lib 目录中每个 jar 的 ...
我正在考虑一种ETL工具,因为我需要处理高日常需求和重业务逻辑处理。目前我已经尝试了kettle和SSIS,并且也想测试Rhino ETL。我不关心Kettle和SSIS的可视化流程结构,使用它们创建复杂的业务规则似乎非常困难... Rhino ETL 似乎更友好,因为它有自己的DSL来转换数...
我已经通过Spoon UI中的复制表向导生成了一个作业,该作业将一些表从Oracle数据库源复制到SQL Server,并对作业进行了一些更改。 现在我想复制相同的作业(相同的表和相同的更改),但只更改连接。这在Spoon中可行吗? 我已经查看了Spoon UI,没有找到任何可以让我复制作...
我正在尝试使用JSON输入步骤处理以下内容: {"address":[ {"AddressId":"1_1","Street":"A Street"}, {"AddressId":"1_101","Street":"Another Street"}, {"AddressId":"...
目前 Pentaho Kettle(v.9.1)只官方支持 Java 8,这对我们来说是个问题,因为我们正在维护一个需要 Java 11 的插件,因为一个必要的库需要 Java 11。有没有人知道迁移到 Java 11 的路线图的详细信息?我只能找到一些较旧的信息表明 Java 11 在路线图...