63得票8回答
星型模式设计

星型模式设计对于数据仓库是必要的吗?还是可以使用其他设计模式进行数据仓库建设?

12得票1回答
在Hive中生成星型模式

我是来自SQL数据仓库领域的,我从一个平面数据源生成维度和事实表。在一般的数据仓库项目中,我们将数据源分为事实表和维度表。例如: 我完全不了解Hadoop,但我知道可以在Hive中构建数据仓库。现在,我熟悉使用GUID,在Hive中作为主键。所以,下面的策略是在Hive中加载事实表和维度...

10得票2回答
在一个维度之间加入多个事实表

如果请求的报告需要关于相同维度(且以相同粒度)的汇总信息,但基础数据存储在不同的事实表中,那么数据仓库设计的好方法是什么? 例如,当薪水和支出记录在不同的事实表中时,显示每个员工每年支付的总薪水和报告的总支出的报告。或者,当销售来自一个事实表,接收来自另一个事实表时,列出每个SKU销售的每月...

8得票2回答
维度建模 - 模糊关系

我一直在尝试解决一个问题,但到目前为止我还没有能够达到最优解。我有一个维度(Features),需要在另外两个维度(Actions和Sessions)中进行引用,这两个维度都从同一事实表(UserAction)中进行引用。这会产生歧义,我无法完成模式: (注:这是模型的一部分,而非整个模型...

8得票3回答
在DW的上下文中,“Grain”是什么意思?

根据Kimball的《数据仓库工具包》, "The grain must be declared before choosing dimensions or facts because every candidate dimension or fact must be consistent...

8得票1回答
审计表与类型2慢变化维度:区别和用途

在SQL Server 2008+中,我们希望启用对操作数据库中“Customers”表历史更改的跟踪。这是一个新表,我们的应用程序控制所有对数据库的写入,因此我们不需要像触发器这样的恶意黑客。相反,我们将把更改跟踪构建到我们的业务对象层中,但我们需要找出正确的数据库架构来使用。 行数将少于...

7得票4回答
为什么在事实表中将NULL值映射为0?

在维度建模的数据仓库中,为什么事实表中的度量字段通常将NULL值映射为0? 这是因为在数据分析中,NULL值可能会导致不准确的结果。如果在计算时出现NULL值,它们将被忽略并且无法进行计算。为了避免这种情况,通常将NULL值映射为0,以确保计算的准确性和一致性。

7得票2回答
扁平表与维度事实表的Redshift性能比较

我正在尝试在扁平的OLTP表上创建维度模型(不在第三正式化范式中)。 有些人认为维度模型表不是必需的,因为报告的大部分数据都来自单个表。但是该表包含比我们需要的更多列,例如300列。我应该仍然将扁平表分离为维度和事实,还是直接在报告中使用扁平表。

7得票4回答
在Qlikview中处理多个事实表

我有一个包含各种教育数据的PostgreSQL数据库,例如学校水平的考试成绩和入学人数。我需要将入学人数与考试成绩分开,因为这些数据在不同的粒度上。尽管入学人数与考试成绩数据的粒度不同,但很多维度是相同的。例如,我拥有: ~ ---------------------------------...