我需要将一个大型数据集加载到生产数据库中。
共有15个文件需要上传并插入到一个表中。每个文件大小约为500 MB。
我有两个需要建立索引的ID列。如果我在上传时已经建好索引,上传需要大约3小时。如果我先去掉索引、用load data local infile命令加载数据,最后再重新建索引,则整个操作只需要30分钟。
问题是,当新导入的数据进行索引时,数据库的响应能力会受到很大影响。有没有办法让索引以“低优先级”方式运行,这样其他查询仍可以在95-100%的速度下运行,而索引操作则在后台缓慢处理?
我使用Amazon RDS,因此无法在不同服务器上加载数据,然后复制表文件。
我会添加赏金,因为我仍然想知道是否有一种方法可以在特定的服务器上进行索引并获得良好性能。