我有一个应用程序需要对不同层级的聚合数据进行分析,这是OLAP工作负载。我也希望经常更新我的数据库。
例如,下面是我的更新样式(模式如下:时间,目标,源IP,浏览器 -> 访问量)。
例如,下面是我的更新样式(模式如下:时间,目标,源IP,浏览器 -> 访问量)。
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
然后我想问一下上个月有多少次访问是通过Firefox浏览器访问www.stackoverflow.com的。
我了解Vertica系统可以以相对便宜的方式(就性能和可扩展性而言,但可能不包括成本方面)完成此操作。我有两个问题。
1)是否有开源产品可以用来解决此问题?特别是Mondrian系统的工作效果如何?(可扩展性和性能) 2)是否有基于HBase或Hypertable的解决方案(显然,裸露的HBase/Hypertable无法解决这个问题)?但如果有基于HBase/Hypertable的项目,则我认为可扩展性可能不是问题。
谢谢!