337得票15回答
MySQL数据库在性能开始下降之前能够达到多大的规模?

MySQL数据库在何时开始失去性能? 物理数据库大小是否重要? 记录数量是否重要? 任何性能下降是线性的还是指数的? 我拥有一个我认为很大的数据库,大约有1500万条记录,占用了近2GB的空间。基于这些数字,我是否有理由清理数据,或者可以让它继续扩展几年而不必担心?

155得票5回答
使用git仓库作为数据库后端

我正在进行一个有关结构化文档数据库的项目。我有一个类别树(大约1000个类别,每个级别最多有50个类别),每个类别包含数千个结构化文档(例如,最多达到10000个)。每个文档都是一些结构化形式的几千字节数据(我更喜欢YAML格式,但也可以是JSON或XML格式)。 系统用户会执行以下几种操作...

102得票1回答
如何配置MongoDB Java驱动程序的MongoOptions以用于生产环境?

我一直在搜索有关配置MongoOptions的最佳实践,以便使用MongoDB Java驱动程序,并且除了API之外,我没有找到更多信息。这个搜索是在我遇到“com.mongodb.DBPortPool $ SemaphoresOut:Out of semaphores to get db c...

83得票3回答
LOWER LIKE与iLIKE的区别

以下两个查询组件的性能如何进行比较? LOWER LIKE... LOWER(description) LIKE '%abcde%' ... iLIKE... description iLIKE '%abcde%' ...

79得票4回答
实体框架与存储过程 - 性能比较

我尝试确定Entity Framework比存储过程慢多少,希望能说服我的老板让我们使用Entity Framework来简化开发。 问题在于我进行了性能测试,看起来EF比存储过程慢了约7倍。我非常难以相信这个结果,想知道是否有什么遗漏。这个测试是否可靠?我可以做些什么来提高EF的性能吗? ...

75得票9回答
有太多列会造成什么问题?

我注意到这里很多人引用了拥有20+甚至55列的表格。虽然我不是数据库设计专家,但我一直听说这是一个可怕的做法。当我看到这种情况时,我通常会建议将其拆分为两个具有一对一关系的表:一个包含最常用的数据,另一个包含最不常用的数据。同时,这可能会导致性能问题(少JOIN等)。所以我的问题是: 在真正...

72得票4回答
Postgresql截断速度

我们使用 Postgresql 9.1.4 作为我们的数据库服务器。我一直在尝试加速测试套件,因此开始对数据库进行分析,以确定究竟发生了什么。我们使用database_cleaner在测试结束时截断表。是的,我知道事务更快,但在某些情况下我不能使用它们,所以我不关心这个问题。 我关心的是TR...

61得票2回答
在PostgreSQL中删除大型数据集中的列

我有一个包含大量数据的表格,其中有三列我想要删除。 问题是:Postgres会怎样处理? 它会遍历每个条目还是只更新映射信息而没有太多开销? 我是否可以使用ALTER TABLE或者在这种情况下应该使用交换表方式? 如果有任何不同,那么所有三列都具有固定长度(两个整数和一个数字)。 非常...

54得票8回答
NULL值在数据库搜索中如何影响性能?

我们的产品中有一个通用搜索引擎,并且试图优化搜索性能。查询中使用的许多表允许空值。为了优化,我们应该重新设计表以禁止空值还是保留原样? 我们的产品在 Oracle 和 MS SQL Server 上运行。

54得票4回答
数据库分区 - 水平 vs 垂直 - 规范化和行拆分之间的区别?

我正在努力理解数据库分区的不同概念,以下是我的理解: 水平分区 / Sharding : 将一个表拆分为不同的表,每个表都包含最初表中的一部分行。例如: 将用户表按大陆进行拆分,如为北美洲创建一个子表,为欧洲创建另一个子表等。每个分区位于不同的物理位置(即不同的“机器”)。 就我所知,水平分...