12得票2回答
为什么要使用ROLAP而不是普通的MySQL?

使用ROLAP服务器(如Mondrian)是否比仅查询MySQL数据库有性能优势? 我是在大多数查询相对简单的情况下提出这个问题的(例如查找某一时期内的所有销售),但数据库的大小相当大(有数十万条记录)。 我的想法是使用OLAP加速查询,但现在我对于这种技术(特别是ROLAP形式)的实际用...

12得票2回答
星型模式是一种反规范化的模式吗?

一个OLAP数据库由非规范化形式的数据组成。这意味着数据冗余,而这种数据冗余可以通过较少的连接来检索数据,从而加快检索速度。 但是,OLAP数据库的一种流行设计是事实-维度模型。事实表将存储基于事实的数字条目(销售数量等),而维度表将存储与事实相关的“描述性属性”,即销售所涉及的客户的详细信...

12得票2回答
NUMA架构如何影响ActivePivot的性能?

我们正在将一个ActivePivot应用迁移到一台新的服务器(4个Intel Xeon插槽,512GB内存)。部署后,我们启动了应用基准测试(这是大型OLAP查询与实时事务并发的混合),测得性能比之前的服务器慢了近一倍,尽管该服务器具有类似的处理器但核心数和内存都是两倍。 我们已经调查了两台...

12得票2回答
从关系型OLTP数据库到OLAP立方体的最佳方法是什么?

我有一个相当标准的OLTP正规化数据库,我意识到需要在数据的不同维度上进行一些复杂的查询、平均数和标准差计算。 因此,我转向了SSAS和OLAP立方体的创建。 然而,要创建立方体,我认为我的数据源结构需要处于“星型”或“雪花型”配置中(我认为现在不是这样)。 正常的步骤是使用SSIS将主...

11得票2回答
OLAP - 计算流失三角形,包括样本数据和立方体(PostgreSQL/Mondrian)

现实描述: 我们有一些项目清单。每个项目都有很多账户。您可以在每个账户上执行许多操作。我定义了以下简化的维度和事实表:Dimensions and attributes: Project project_key project_name industry number_of_...

11得票4回答
数据库仓库设计:事实表和维度表

我正在使用关系型数据库构建一个简易的数据仓库。我已确定需要记录以下关键“属性”: 性别(真/假) 人口统计分类(A,B,C等) 出生地点 出生日期 体重(每天记录):所记录的事实 我的要求是能够运行允许我执行“OLAP”查询的查询,这些查询使我能够: “切片和切块” 在数据上“钻取...

10得票1回答
不建议将Elasticsearch作为OLAP cube的原因

乍一看,似乎使用 Elasticsearch 作为后端在构建具有类似传统商业智能环境中所使用的数据透视表功能的报表时非常容易且快速。 所谓“数据透视表”,是指按照一个或两个维度对数据进行分组、筛选和排序,并通过多个指标(例如求和或计数)进行聚合。 所谓“容易”,是指在一个足够大的集群中,不...

10得票3回答
Python:与复杂数据仓库交互

我们已经努力工作,制定了一个完整的问题维度数据库模型,现在是开始编码的时候了。我们之前的项目使用手工构建的查询来进行字符串操作。 在Python和复杂的数据库布局之间有最佳/标准实践吗? 我已经简要评估了SQLAlchemy、SQLObject和Django-ORM,但它们似乎(我可能容易...

10得票1回答
Spring Boot支持任何动态OLAP报表生成工具吗?

我需要将OLAP报表支持添加到我现有的Spring Boot Web应用程序中。我已经了解了多个BI工具,如BIRT、JasperServer Report和Saiku,但对于所有这些工具,我必须使用已经创建好的cube。如果数据有任何修改,则不会反映在我的报表中。 是否有任何第三方工具可以...

10得票4回答
任何可扩展的OLAP数据库(Web应用规模)?

我有一个应用程序需要对不同层级的聚合数据进行分析,这是OLAP工作负载。我也希望经常更新我的数据库。 例如,下面是我的更新样式(模式如下:时间,目标,源IP,浏览器 -> 访问量)。(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, saf...