SSIS与Pentaho的比较

7
有人使用过这两个软件并做了比较吗?我正在做学校项目,所以SSIS的费用不是问题,因为我们已经拥有许可证。
背景介绍如下。我将下载约10年的专利信息到平面文件中。结果将会是2080个分隔文件。我希望能一次性将它们全部加载到MS SQL Server中。然后当发布新的文件时,我希望能将其附加到数据库中。
软件速度并不打扰我太多,因为我可以让它在晚上运行。我只是想要一个具有一定灵活性,而且更重要的是相对容易使用的东西。我以前从未做过这样的项目,将会从论坛中学习如何操作。
谢谢!

1
从未使用过Pentaho,但可以尝试使用SSIS:http://msdn.microsoft.com/zh-cn/library/dd537533(v=sql.100).aspx - William Salzman
WOW,30分钟内传输1TB的速度对我来说已经足够快了。感谢@WilliamToddSalzman的文章... - Johnny B
2个回答

6
我曾在真实的项目中使用过两种工具。因为易用性和灵活性,我更喜欢Pentaho(PDI)而不是SSIS。开始使用之前,请先了解一下相关的知识。关于kettle(PDI),有几本优秀的书籍可供阅读,或者您可以在PDI的帮助菜单中阅读入门指南。如果您遇到了困难,论坛是一个不错的地方,或者在IRC上搜索##pentaho也是一个好的选择。欢迎界面中提供的示例也会很有帮助。我希望您能喜欢它,我自从2006年开始使用它后就一直很满意,每次使用SSIS时都感到不爽。顺便说一句:连接SQL Server数据库时请使用jtds jdbc驱动程序,这将为您省去一些麻烦。希望对您有所帮助,Bart。

感谢您的回答。在我一直使用的样本数据集中,平面文件一直是个麻烦。我可以将它们导入Excel或Access中,但是当我尝试使用MS SQL Server时,基本上会被告知我在吸毒。因此,我必须将数据导入Access,然后保存为.mdb,然后从Access中导入到SQL Server。Pentaho中的增强灵活性是否有助于解决这个问题? - Johnny B
我之所以问这个问题,是因为数据转储程序已经编码并且在某种程度上可以工作,显然它分隔数据的方式是问题所在,但如果我能找到一些东西,在数据转储后让我修复它,而不是让我学习如何编写Python代码,那我会非常兴奋。 - Johnny B

1

在花费了几天时间使用PDI和SSIS开发ETL包后,我可以自信地说,PDI绝对更加用户友好。单单用户界面就更加清晰,流畅,非常直观易用。


虽然我不同意这个观点,但你可以查看以下链接进行公正的比较:https://sqlkover.com/ssis-and-pentaho-a-quick-comparison/ - Hadi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接