得票数最多 'cardinality' 问题

关联标签

121得票18回答

确定C++枚举类的元素数量是否可能？

是否有可能确定 C++ enum class 的基数：enum class Example { A, B, C, D, E }; 我尝试使用sizeof，但它返回的是一个枚举元素的大小。sizeof(Example); // Returns 4 (on my architecture) 有没有...

c++c++11cardinalityenum-class

109得票6回答

数据库中的基数是什么？

能否有人通过举例子来解释一下数据库中的基数是什么意思？

databasedatabase-designcardinality

63得票5回答

使用基数较低的索引是否有意义？

据我理解，如果在一个只包含少量不同值的列上设置索引，你不会得到太多好处。我有一列保存布尔值（实际上是小整数，但我将其用作标志），并且这个列在我大部分查询的WHERE子句中都被使用。在一个理论上的“平均”情况下，一半的记录值将是1，另一半是0。因此，在这种情况下，数据库引擎可以避免全表扫描...

mysqlsqlindexingcardinality

30得票4回答

SQL中基数(cardinality)的定义是什么？

我的学校教材数据库系统对基数的定义如下：一个关系的基数是它包含的元组数量。相比之下，元组的数量称为关系的势，随着元组的添加或删除而改变。高基数 - 许多元组，低基数 - 少量元组。然而，维基百科关于基数(SQL语句)的文章则将其定义为：基数是指数据库表中某一列（属性）中包含的...

mysqlsqlstatementscardinality

28得票3回答

如何真正编写UML基数？

我想知道如何写UML基数，因为我经常需要讨论它们，欢迎提供证明和来源 :) 如果我想解释一个“母亲可以有几个孩子，但一个孩子只有一个母亲”的关系，应该这样写: Mother * ---------- 1 Child 或者 Mother 1 ---------- * Child ?

oopumldata-modelingcardinality

23得票1回答

MySQL索引基数 - 性能与存储效率的权衡

假设您有一个拥有一亿条记录的MySQL 5.0 MyISAM表格，并且在两个整数列中除主键以外还有一个索引。从我对B树结构的理解来看，我认为较低基数意味着索引的存储效率更高，因为有较少的父节点。而较高基数意味着存储不太高效，但读取性能更快，因为它需要浏览的分支较少，以定位查询所需的数据并缩...

mysqlindexingperformancecardinality

20得票4回答

为什么在高基数分组时使用dplyr管道（%>%）比等效的非管道表达式慢？

我本以为一般情况下使用%>%不会对速度产生明显影响。但在这种情况下，它运行得慢了4倍。library(dplyr) library(microbenchmark) set.seed(0) dummy_data <- dplyr::data_frame( id=floor(ru...

rperformancedplyrmagrittrcardinality

16得票2回答

如何在Python中高效地计算非常大的数据集的基数？

我一直在工作中处理一些特别大的数据集，通常包含数十亿个元素，它们都存储在Memcached云中，并定期转储到文件中。对于我的一个任务，我正在尝试计算该集合的基数。为了提供一些背景信息，每个项都包含IP和一些其他属性，用base64编码，项大小为20字节。通过删除某些字段来减小项的大小并不是...

pythonoptimizationmemcachedsetcardinality

14得票2回答

在MySQL 5.x中，索引中的NULL基数是否是一个问题？

我在一个系统的线上版本上遇到了性能问题，但是我无法在本地复现这个问题。通过比较几个数据库EXPLAIN结果，我发现在线上版本中某些地方没有使用多字段索引，而在本地版本中有使用。进一步调查发现，这些索引在线上版本上的基数为NULL。我猜测这是问题所在，但空值基数表示什么意思？会导致索引未...

mysqlnullindexingcardinality

12得票1回答

Cassandra中的高低基数问题

我一直遇到这些术语：高基数（high cardinality）和低基数（low cardinality）在中。我不明白它们究竟意味着什么，对查询有什么影响以及何种方式更好。请用示例解释，因为这样更容易理解。

cassandra-2.0cardinality