有没有人在 OLAP 环境下使用过 PostgreSQL,例如对数据库使用多维数据立方(cubes)等。由于在使用 MySQL 进行 OLAP 时遇到了一些特殊情况,因此是否存在使用 PostgreSQL 的优势(假设我想采用开源路线)?
有没有人在 OLAP 环境下使用过 PostgreSQL,例如对数据库使用多维数据立方(cubes)等。由于在使用 MySQL 进行 OLAP 时遇到了一些特殊情况,因此是否存在使用 PostgreSQL 的优势(假设我想采用开源路线)?
有许多数据仓库软件供应商都基于Postgresql(并定期向核心贡献OLAP相关的更改)。请查看https://greenplum.org/。您会发现,PG比MySQL更适合各种工作负载,特别是OLAP。根据您的数据集和用例,Greenplum和其他类似解决方案应该比PG表现更好。
与MySQL相比,PGSQL更适合数据仓库。我们最初考虑使用MySQL,但是如果数据增长到几百万行,则在聚合方面表现不佳。在相同硬件设置下,对于单个事实表的2000万条记录,PGSQL的性能比MySQL快近20倍。如果由于某种原因您选择使用MySQL,则应该为事实表使用MyISAM存储引擎而不是InnoDB; 您将看到稍微更好的性能。