我们正在尝试设计一种最佳方法来将非常大的Excel文件导入SQL数据库。使用SSIS有些麻烦,因为它会扫描前X条记录以确定文件的格式,但下面的行可能不同,所以需要很多试错,我们必须将不寻常的列移到顶部,以便SSIS可以“学习”。
当我们得到要导入的新文件格式时,它们符合行格式等规范 - 因此我们可以预先知道模式。 SQL目标表具有相同的模式,还有一些额外的列,例如插入日期和原始文件名。
是否有更简单的方法来创建我们将要插入的新文件的格式定义?我们不必使用SSIS,我们对任何其他工具都持开放态度,以尽可能自动化。还有一个问题是测试我们将要导入的数据的完整性,我们计划针对临时数据集进行基本查询,例如“少于1%的记录可能缺少邮政编码”等。
非常感谢。
当我们得到要导入的新文件格式时,它们符合行格式等规范 - 因此我们可以预先知道模式。 SQL目标表具有相同的模式,还有一些额外的列,例如插入日期和原始文件名。
是否有更简单的方法来创建我们将要插入的新文件的格式定义?我们不必使用SSIS,我们对任何其他工具都持开放态度,以尽可能自动化。还有一个问题是测试我们将要导入的数据的完整性,我们计划针对临时数据集进行基本查询,例如“少于1%的记录可能缺少邮政编码”等。
非常感谢。