9得票1回答
SSIS - 动态循环遍历多个数据库

我需要将1000多个结构/表相同的数据库中的数据汇总到一个唯一的数据库中。 由于可能每天都会添加和删除数据库,因此我需要动态检索数据库列表并运行动态生成的SQL查询以从每个数据库中提取数据。 我设计了一个数据流,其中包含一个变量的查询,如果使用静态值执行,则可以正常工作。 使用SQL任...

15得票1回答
错误[ERR_STREAM_PREMATURE_CLOSE]: Node管道流中的过早关闭

我正在使用Node的stream.pipeline功能将一些数据上传到S3。我正在实现的基本思想是从请求中提取文件并将它们写入S3。我有一个pipeline可以成功地从请求中提取zip文件并将其写入S3。但是,我希望我的第二个pipeline执行相同的请求,但解压缩并将未压缩的文件写入S3。管...

9得票4回答
SSIS目录包错误 - FlatFile目标版本与DataFlow版本不兼容

出现错误 "The version of flat file destination is not compatible with this version of the dataflow" 当尝试从目录中执行SSIS包时,该包在Visual Studio中执行良好。我已经尝试在目录中以...

7得票3回答
Pentaho数据集成中新插入或更新的行数

我是Pentaho数据集成的新手;我需要将一个数据库整合到另一个位置作为ETL作业。我想在ETL作业期间计算插入/更新的数量,并将该计数插入到另一个表中。有人可以帮助我吗?

9得票2回答
如何将扁平文件数据拆分并加载到数据库的父子表中?

我有一些非规范化的数据(来自文件),需要导入到父子表中。源数据大致如下: Account# Name Membership Email 101 J Burns Gold alpha@foo.com 101 J...

8得票2回答
在SSIS中,数据流传输任务比在“执行SQL任务”中编写SQL查询要慢得多。

我对SSIS还很陌生,有一些问题: 我想将同一个数据库中的1,25,000行数据从一个表转移到另一个表。但是,当我使用“数据流任务”时,花费的时间太长了。我尝试过使用“ADO NET Destination”和“OLE DB Destination”,但性能不可接受。当我在“执行SQL任务...

9得票2回答
SSIS - “外部表格格式不符合预期”和.xls文件

在SSIS ETL转换中,我试图加载某个 .xls 文件。我有几个相同的文件,拥有类似的模式,所有这些文件都可以正常工作。但是这一个文件却出现了"外部表格不符合预期格式"的错误信息。以下是我尝试过的方法: 我已经将连接字符串从 Jet OLEDB 改为 ACE OLEDB,但没有结果。 我...

7得票3回答
使用ElasticSearch和Kibana进行商务智能

我们正在使用ElasticSearch来实现产品的搜索功能,这已经运作良好。 现在我们希望为客户提供自助商业智能服务。由于性能影响,在操作数据库上进行报告非常困难。在运行时,对于1000万条记录计算平均“订单解决时间”将无法及时获取结果。传统方法是通过使用ETL加载操作数据并进行汇总来创建数...

7得票8回答
空字符串导致“在命令行参数中检测到错误,请确保所有参数设置正确”。

在一个SQL 2016服务器上,我有一个调用SSIS包的作业。该包在SSISDB中的项目中具有参数。其中一个参数是字符串类型,默认为空白。 我使用空值运行了此参数的作业,并成功运行。 然后我打开了作业属性,进入调用该包的步骤并进入配置,给该参数赋值。 我再次运行作业,它成功运行,并且参数...

9得票2回答
我在使用AWS Glue的笔记本创建动态框架时遇到了错误"java.io.FileNotFoundException: No such file or directory"。

我正在AWS Glue中设置一个新的Jupyter Notebook作为开发端点,以测试运行ETL脚本的代码。到目前为止,我使用AWS Glue创建了基本的ETL脚本,但是在尝试在Jupyter Notebook上运行代码时,出现了“FileNotFoundException”的错误。 我使...