63得票8回答
星型模式设计

星型模式设计对于数据仓库是必要的吗?还是可以使用其他设计模式进行数据仓库建设?

31得票3回答
数据仓库 - 星型模式 vs 平面表格

我正在尝试设计一个数据仓库,用于存储从财务系统、项目调度系统到各种科学系统等常用数据的单个商店。也就是说,它包含许多不同的数据集市。 我一直在阅读有关数据仓库以及流行方法如星型模式和Kimball方法等的资料,但我找不到答案的一个问题是: 为什么将DW数据集市设计为星型模式而不是单个平面表...

14得票4回答
星型模式命名规范

在星型模式中,给表名加上维度或事实表的前缀是常见做法吗?列名也常常加上表名前缀吗? 在我的普通OLTP数据库中,我没有这样做,但我在星型模式中看到了这种命名方式的示例。 为数据仓库模式和OLTP模式使用不同的命名标准是否有意义? 谢谢,Dwight

13得票2回答
星型模式,规范化维度,非规范化层级键

给定以下星型模式表。 事实表,两个维度,两个度量值。 # geog_abb time_date amount value #1: AL 2013-03-26 55.57 9113.3898 #2: CO 2011-06-28 19.25 984...

12得票1回答
如何设计星型模式

我不知道从哪里开始设计星型模型。 例如,我在数据库中有以下表:Branch(branchNo, bStreetAddress, bCity) LoanManager(empNo, empName, phone, branchNo) Customer(custNo, custName, pro...

12得票2回答
星型模式是一种反规范化的模式吗?

一个OLAP数据库由非规范化形式的数据组成。这意味着数据冗余,而这种数据冗余可以通过较少的连接来检索数据,从而加快检索速度。 但是,OLAP数据库的一种流行设计是事实-维度模型。事实表将存储基于事实的数字条目(销售数量等),而维度表将存储与事实相关的“描述性属性”,即销售所涉及的客户的详细信...

10得票1回答
SQLAlchemy中的星型模式

我有一个星型架构的数据库,想在SQLAlchemy中表示。现在我面临的问题是如何以最佳方式完成此操作。目前,我有很多具有自定义连接条件的属性,因为数据存储在不同的表中。 如果可以重复使用尺寸(维度)用于不同的事实表,那就太好了,但我还没有找到如何优雅地完成这项任务。

9得票8回答
如何高效利用10台以上计算机导入数据。

我们有超过2亿行的平面文件(CSV),需要导入到包含23个维度表的星型模式中。最大的维度表有300万行。目前,我们在单台计算机上运行导入过程,需要约15小时。由于时间太长,我们希望利用40台计算机来进行导入。 我的问题是:如何高效地利用这40台计算机进行导入?主要担忧是需要将维度表复制到所有...

7得票1回答
Python Cubes OLAP框架-如何使用连接?

我是一个有用的助手,可以翻译文本。 我正在尝试在一个非常简单的数据库上使用Python的OLAP框架cubes,但我在联接表时遇到了一些问题。 我的模式看起来像这样: Users table ID | name Products table ID | name | price Pur...

7得票5回答
PostgreSQL:高效地将数据加载到星型模式中

假设在PostgreSQL 9.0上有一张如下结构的表: create table raw_fact_table (text varchar(1000)); 为了简化起见,我只提到一个文本列,实际上有十几个。这张表有100亿行,每一列都有很多重复的数据。该表是使用COPY FROM从平面...