7得票1回答
使用Java停止运行Kettle作业/转换

我正在使用Java开发基于Kettle引擎的Web应用程序ETL工具。 我在尝试停止运行中的作业时遇到了问题。我不确定是否正确使用CarteSingleton.java。我正在使用自定义的单例映射。 我的代码如下: Job job = new Job(null, jobMeta); jo...

8得票4回答
导入具有可变标题的Excel文件

我有一个SSIS包,可以将Excel文件加载到数据库中。我创建了Excel Source任务来将Excel列名映射到数据库表列名,并且它运行良好。 很少情况下,我们会收到带有一些空格的Excel文件列名(例如:列名为“ABC”,但我们收到的是“ABC ”),这会导致映射问题并使SSIS失败。...

13得票3回答
读取CSV文件时缺少一些列

我正在尝试使用以下代码将CSV文件读入我的VB.net应用程序:While Not EOF(1) Input(1, dummy) Input(1, phone_number) Input(1, username) Input(1, product_name) ...

37得票3回答
Integration Services Catalog使用哪些用户凭据来执行包?

我们有一个 SSIS 包,可以从一个共享网络目录中读取文本文件。当我在 SSDT 中执行此包时,它可以正常工作。但是,当我们将项目部署到 Integration Services Catalog 并尝试从那里运行相同的包时,出现了一个错误,表明被拒绝访问该目录。 我一直认为,当我登录数据库并...

12得票4回答
从Glue移动数据到DynamoDB的方法

我们正在为我们的一个仪表盘应用程序设计一个大数据解决方案,并且认真考虑将 Glue 作为我们最初的 ETL。目前,Glue 支持 JDBC 和 S3 作为目标,但是我们的下游服务和组件将更适合使用 dynamodb。我们想知道将记录从 Glue 移动到 Dynamo 的最佳方法是什么。 我们...

7得票8回答
空字符串导致“在命令行参数中检测到错误,请确保所有参数设置正确”。

在一个SQL 2016服务器上,我有一个调用SSIS包的作业。该包在SSISDB中的项目中具有参数。其中一个参数是字符串类型,默认为空白。 我使用空值运行了此参数的作业,并成功运行。 然后我打开了作业属性,进入调用该包的步骤并进入配置,给该参数赋值。 我再次运行作业,它成功运行,并且参数...

11得票3回答
如何将第三方库添加到Talend项目中?

如何将第三方库(jar文件)添加到Talend项目中?还有一个问题是,每个Talend 组件 都使用LogFactory,但在我的情况下会抛出异常。java.lang.NoClassDefFoundError: org.apache.commons.logging.LogFactory ...

8得票2回答
数据仓库建模:Data Vault与持久化分层区(PSA)的比较

考虑以下两种DWH架构: 使用原始数据仓库(Raw Data Vault)的DWH,层次结构如下: 源系统 暂存区(每次加载时截断,与源表具有相同的模式) 原始数据仓库(建模为数据仓库,包含记录历史,以源系统结构为模型,采用hub/sat/link模型,不应用任何业务规则) 数据集市(维...

10得票2回答
何时使用非阻塞/线程和阻塞/ goroutines 与clojure core.async相关?

我正在编写一个ETL进程,从产品数据库中读取事件级别的数据,进行转换/聚合,并将其写入分析数据仓库。我使用Clojure的core.async库将这些进程分开为并发执行的组件。下面是我现在代码的主要部分: (ns data-staging.main (:require [...

26得票3回答
向Airflow日志中添加日志记录

如何将自己的日志添加到自动生成的Apache Airflow日志中?任何打印语句都不会被记录在里面,所以我想知道如何添加我的日志,以便在UI上显示出来?