我有一些大型XML文件(每个文件大小约为5GB),需要将它们导入到MongoDB数据库中。我正在使用Expat解析文档,进行一些数据操作(删除某些字段,单位转换等),然后将其插入到数据库中。我的脚本基于此脚本:https://github.com/bgianfo/stackoverflow-mongodb/blob/master/so-import
我的问题是:是否有一种方法可以通过批量插入来改进这个过程?将这些文档存储在数组中再进行插入是否是一个好主意?在插入之前应该存储多少个文档?将JSON写入文件,然后使用mongoimport会更快吗?
感谢任何建议。
感谢任何建议。