Mongo删除和插入与更新的区别

Question

Mongo删除和插入与更新的区别

6

我正在使用mongo 3.0数据库和Java驱动程序。我有一个包含10万多条记录的集合。每天大约会有500次更新和500次插入，这些操作应该进行批处理。我将获得旧字段加上一些新字段的已更新文档，需要存储它们。我不知道哪些是新添加的字段，对于每个字段，我都在维护摘要统计信息。由于我不知道哪些是更改过的，所以我必须获取已存在的记录以查看更新的记录和新记录之间的区别，以适当地设置摘要统计信息。因此，我想了解如何有效地完成这项工作。

我应该删除现有记录并重新插入，还是应该更新500条记录？如果有潜在优势，是否应考虑执行1000个upser？

示例用例：初始记录包含：f=[185, 75, 186]。我将会收到更新请求，如：f=[185, 75, 186, 1, 2, 3]，对于相同的记录。另外，上述摘要统计信息存储f中id的计数。因此，1、2、3的计数将增加，而185、75、186的计数保持不变。

- Terminator

3个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Pio · Answer 1

Upserts 用于在文档不存在时添加文档。因此，如果您期望有新的文档，则需要设置 {upsert: true}。

为了更新您的统计数据，我认为最简单的方法是重新计算统计数据，如果您是在 mongo 中进行统计（例如使用聚合框架）。如果您正确地索引了文档，那么应该没问题。我假设您的统计更新是离线操作。

如果您没有在 mongo 中进行统计，则可以添加另一个 collection，在其中保存更新以及旧字段（当然还要更新当前集合），这样您就会知道哪些文档在一天中发生了更改。在一天结束时，您只需删除此临时/日志 collection，一旦提取所需信息即可。

- user2775185 · Answer 2

Mongo使用本地数据库中的oplog.rs capped集合来维护每个更改日志。我们基于时间戳在oplog.rs上创建可追溯的游标，并通过流媒体传输每个数据库/集合中的更改操作。相信这是识别mongo更改的最佳方式。人们可以放心地丢弃无关紧要的文档更改。更多阅读http://docs.mongodb.org/manual/reference/glossary/#term-oplog。

- upsers · Answer 3

我认为最简单的方法是如果您在mongo中进行统计（例如使用聚合框架）就重新做。如果您正确索引upsers文档，那么应该没问题。我假设您的统计更新是离线操作。