在Cassandra中存储numpy数组

3
我对Cassandra数据建模不熟悉,想知道是否可以使用复杂数据类型setlistmap来存储向量(在许多情况下,这些向量来源于Python中的numpy数组)?
我应该只使用二进制格式吗?
我将存储以标量和“有限”长度的向量形式呈现的科学数据,大约1000并且通常是10x1000的矩阵。理想情况下,向量不应该是不透明的,而矩阵可以是不透明的,这不是真正的问题。
1个回答

1
如果数据量很大或元素数量巨大,我建议避免使用任何集合类型。在被问及的情况下,如果一定要使用集合,出于性能考虑,我会使用List,并且在集合中,重复的值不会被明确地存储。但最好的方法可能是通过BLOB来实现。有关集合用法的更多阅读资料:https://docs.datastax.com/en/cql/3.3/cql/cql_using/useSet.html

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接