我正在尝试使用Datastax Academy数据建模课程中的公式计算具有任意数量的列和类型的表中每行的分区大小。
为此,我需要知道一些常见Cassandra数据类型的“字节大小”。我试图在Google上搜索这个问题,但得到了很多建议,所以我感到困惑。
我想知道的数据类型包括:
- 一个单独的Cassandra文本字符(我从2-4字节的答案中搜索)
- Cassandra DECIMAL
- Cassandra INT(我认为它是4个字节)
- Cassandra BIGINT(我认为它是8个字节)
- Cassandra BOOELAN(我认为它是1个字节,..或者是一个位)
当然,关于Cassandra中数据类型的大小,任何其他考虑都将受到赞赏。
添加更多信息,因为似乎难以理解我只是尝试估计数据在未经任何压缩和Cassandra执行的优化的情况下占用的“最坏情况磁盘使用量”。
我正在遵循Datastax Academy课程DS220(请参见末尾链接),并实现该公式,并将使用此处的答案信息作为该公式中的变量。
https://academy.datastax.com/courses/ds220-data-modeling/physical-partition-size