在不同的文章中,我经常看到"bulk loading"这个表达。它在技术上意味着什么?
它有什么含义?
如果有使用案例的解释更好。
在不同的文章中,我经常看到"bulk loading"这个表达。它在技术上意味着什么?
它有什么含义?
如果有使用案例的解释更好。
索引通常针对逐个插入行进行优化。但是,当您一次性添加大量数据时,逐个插入行可能效率低下。例如,在使用B-Tree时,单个键的最佳插入方法是往空索引中添加一堆数据的非常糟糕的方法。
而是采用不同的策略来处理B-Tree。您可以预先对所有数据进行排序,并将其分组为块。然后,您可以通过将这些块转换为树节点来构建新的B-Tree。尽管这两种技术具有相同的渐近性能O(n log(n)),但批量加载操作具有更小的系数。
批量加载用于导入/导出大量数据。通常情况下,批量操作不会被记录,并且事务完整性可能无法按预期工作。通常,批量操作绕过触发器和完整性检查,如约束条件。这显著提高了处理大量数据的性能。