我们目前正在评估使用Cassandra作为分析应用程序的数据存储。计划是将原始数据倒入Cassandra中,然后主要运行聚合查询。看到CQL时,它似乎不支持一些传统的SQL运算符,例如:
- 典型的聚合函数,如平均值、总和、Count-Distinct等
- Groupby-having运算符
我在文档中没有找到任何有助于实现上述操作的内容。还检查了是否有提供此类功能作为扩展的钩子。比如像Mongodb中的数据库Map-Reduce或关系型数据库中的用户定义函数。
人们确实谈论过付费的Datastax Enterprise Edition,但这也不是通过普通的Cassandra实现的,而是通过单独的组件(如Hadoop-Hive-Pig-Hadoop等)实现的。或者建议在倒入数据到数据库之前进行所需的预聚合,因为Cassandra的写入速度很快。
对于我们需要的基本功能来说,这看起来有点繁琐。我是否忽略了某些基本的东西?
非常感谢您的帮助。