16得票4回答
SSIS如何通过分隔符获取字符串的一部分

我需要一个SSIS表达式,用于获取分隔符之前字符串的左侧部分,然后将新字符串放入新列中。我已在Derived Column中查找,但似乎没有这样的表达式。Substring只能返回固定长度的字符串部分。 例如,使用分隔符字符串-:Art-Reading Shou...

15得票3回答
从CSV文件填充SQL数据库

我需要使用SSIS创建一个基于CSV文件的数据库。这个CSV文件包含四列: 我需要使用该表的信息来填充下面我在SQL中创建的三个表。 我意识到我需要使用员工表中的一列EmployeeNumber和组表中的GroupID来填充EmployeeGroup表。为此,我认为Merge Join...

15得票5回答
SQL Server管理工具:静默导入并忽略99.9%的数据

问题 我正在尝试使用SQL Server Management Studio的导入数据任务将数据导入表中。它只导入了26行,而原始数据有49,325行。(编辑:这就是99.9%来自的地方:(1-26/49325)*100 = 99.9%) 使用企业管理器中的DTS可以正确地导入所有的49,...

15得票3回答
Python实现ETL

我正在处理一个数据仓库,寻找一种使用Python的ETL解决方案。 我已经尝试了SnapLogic作为ETL工具,但我想知道是否还有其他的解决方案。 这个数据仓库才刚刚开始。我还没有导入任何数据。最初我想要加载的数据子集很容易就会超过100GB。

15得票1回答
错误[ERR_STREAM_PREMATURE_CLOSE]: Node管道流中的过早关闭

我正在使用Node的stream.pipeline功能将一些数据上传到S3。我正在实现的基本思想是从请求中提取文件并将它们写入S3。我有一个pipeline可以成功地从请求中提取zip文件并将其写入S3。但是,我希望我的第二个pipeline执行相同的请求,但解压缩并将未压缩的文件写入S3。管...

15得票3回答
SSIS脚本任务丢失代码

我遇到一个非常奇怪的问题,导致脚本任务代码被清空。我已经在2-3台不同的计算机上进行了测试。我们正在运行SSDT 15.4预览版。复现此问题的步骤如下: 在foreach循环容器中创建一个脚本任务。 在脚本任务中创建一个注释。 更改或添加foreach中的变量映射。 保存包。 关闭包。 打...

15得票4回答
将文本文件内容加载到sqlite表中?

我有一些包含普通文本的简单文本文件。 我想知道是否有一种方法可以将文本内容加载到sqlite表中。 所以也许我可以 Create table myTable(nameOfText TEXT, contents TEXT); 然后将nameOfText放入第一列,内容放在第二列。 如果放入文...

15得票1回答
Spring Cloud Data Flow过滤器组件中的JsonPath无法正常工作

我正在尝试编写一个简单的SCDF流程,从Kafka读取消息,根据特定值的存在过滤消息,并将数据推送到Mongo。作为其中的一部分,我不得不编写以下#jsonPath。 #jsonPath(payload,'$[?(@.metadata!=null)].metadata[?(@.trigger-...

14得票6回答
在Oracle 11g分区表上进行并发统计信息收集

我正在使用Oracle 11g开发数据仓库。我们有一些大表(250+万行),按值分区。每个分区都分配给不同的数据源,并且每个分区都是独立的,因此它们可以同时加载和处理。 数据分布非常不均匀,我们有数百万行的分区,也有不到一百行的分区,但我没有选择分区方案,而且我也无法更改。 考虑到数据量,...

14得票3回答
复制列顺序

我想要使用COPY命令的HEADER选项,但是我的文件中的标题行和数据库指定的列顺序不同。那么,我的文件中的列名顺序是否必须与数据库中的一致呢? 下面是我的代码:COPY table_name ( SELECT column...