我想知道Cassandra是否有节点硬件规格的限制,例如每个节点的最大存储容量是否存在任何限制。
我打算使用两个节点,每个节点具有48TB的存储空间(24个2TB 7200rpm硬盘),以及一些优秀的双路至强处理器。
我已经查找了这样的限制是否存在,但没有找到任何关于这个问题的资料。并且,为什么最近Cassandra的关注度如此之低,尽管它正在变得更加成熟,而且已经发布了0.8版,而大多数文章/博客都只与0.6v相关呢?
这里有一些关于大数据集考虑的注意事项(链接)。
每个节点的48 TB数据可能太多了。最好有更多节点,每个节点存储较小量的数据。定期需要运行nodetool repair,其中涉及读取机器上的所有数据。如果在一台机器上存储了许多TB的数据,则这将非常痛苦。
我建议将每个节点的数据限制在约1TB左右。
在使用Cassandra时,您还应该小心使用大量的RAM。 RAM对于缓存SSTables中的数据非常有用,但是给JVM过多的堆空间是适得其反的。不要给JVM超过12 GB的堆空间,否则垃圾回收将花费太长时间并阻碍性能。这也是为什么在Cassandra中拥有更多的较小节点更好的另一个原因。