需要什么样的架构来存储100TB的数据并进行聚合查询?需要多少个节点?每个节点的磁盘大小是多少?最佳实践是什么?
每天将写入240GB的数据,但由于相同数量的数据将被删除,因此大小将保持不变。
或者关于存储数据和快速分组查询的任何不同想法?
请参考相关问题,
引用顶部答案:
MongoDB网站上的"生产部署"页面可能对您有帮助。列出了大量具有基础架构信息的演示文稿。例如:
http://blog.wordnik.com/12-months-with-mongodb说他们每个节点存储3 TB。
我强烈推荐使用 HBase。
Facebook将其用于消息服务,截至2010年11月,该服务每天处理150亿条消息。
我们尝试了MongoDB用于一个大型数据集,但最终选择了HBase并且现在已经快乐地使用了数个月。