我正在开发一个保存大型科学数据集的数据库。典型的使用场景是每天会向数据库写入约5GB的新数据,同时也会删除5GB的数据。总数据库大小将约为50GB。我运行的服务器无法在内存中存储整个数据集。
我已经设计了这个数据库,使主数据表只是一个键/值存储,包括唯一的ID和值。
查询通常是针对大约100个连续值,例如:
在开始安装新软件并重写整个数据库之前,我想大致了解一下使用NoSQL DB(例如Tokyo Tyrant,Cassandra,MongoDB)而不是MySQL进行这些检索时是否有可能看到显着的性能提升。
谢谢
我已经设计了这个数据库,使主数据表只是一个键/值存储,包括唯一的ID和值。
查询通常是针对大约100个连续值,例如:
SELECT Value WHERE ID BETWEEN 7000000 AND 7000100;
我目前正在使用MySQL / MyISAM,这些查询需要大约0.1-0.3秒的时间,但最近我意识到MySQL可能不是基本上是一个大型键/值存储的最佳解决方案。在开始安装新软件并重写整个数据库之前,我想大致了解一下使用NoSQL DB(例如Tokyo Tyrant,Cassandra,MongoDB)而不是MySQL进行这些检索时是否有可能看到显着的性能提升。
谢谢