最新 'partitioning' 问题 - 第2页

关联标签

8得票1回答

我意识到我提出的问题并不简单，不能仅仅通过简单的操作就解决。事实是，在一天晚上没有思考清楚的情况下，我删除了错误的分区。我尝试了几个Windows和Linux工具（分区磁盘医生、Easeus、Test disk等），但都无法解决问题。我认为这是由于我删除分区的方式造成的。我之前用C++编写...

8得票1回答

Handlersocket插件是否能感知表分区？我在文档中没有找到这方面的提及，也不知道分区是否对handler socket透明，或者是否由SQL优化器处理。

7得票8回答

从问题“分区比排序容易吗？”中：假设我有一组项目和它们之间的等价关系，并且比较两个项目需要恒定时间。我想返回项目的一个分区，例如一个包含所有等价项目的链接列表。一种方法是将等价关系扩展到项目的排序上（使用排序算法进行排序）; 然后所有等价项目将相邻。（请记住等式和等价关系之间的区...

15得票1回答

我正在集群模式下运行Spark，并通过JDBC从关系型数据库中读取数据。根据Spark 文档，这些分区参数描述了在从多个工作节点并行读取时如何对表进行分区： partitionColumn lowerBound upperBound numPartitions 这些是可选参数。 ...

9得票4回答

我能想象按日期（尤其是用于日志）进行表分区是广泛使用的，但我无法找到解决我的问题的好方法。我想创建一个按周分区的表（记录数太多，无法按月分），之所以选择按周分区是因为我需要数据供算法使用，算法将在其中查找日期作为处理的一部分。我的问题是，我希望它创建考虑到每周并使用“典型”方法的分区，...

26得票1回答

我正在使用kafka将网站用户的页面访问事件流式传输到分析服务。每个事件将包含以下消费者详细信息：用户ID 用户的IP地址由于我需要非常高的吞吐量，因此我决定以userId-ipAddress作为分区键来分区主题，即对于用户ID为1000和IP地址为10.0.0.1，事件...

7得票1回答

我希望你能帮我将数据框“df1”在3列上进行分区。该数据框的这3列有确切的990个唯一组合： In [17]: df1.createOrReplaceTempView("df1_view") In [18]: spark.sql("select count(*) from (select ...

21得票2回答

有人在使用Doctrine2库的分区功能时有经验吗？第一个问题是，Doctrine会为关联列创建外键，有人知道如何防止或禁用吗？第二个问题是如何指定自定义表定义（PARTITION BY ...）？先行致谢！

9得票1回答

我的数据库设计包括多个MYISAM表，用于在线收集测量数据，每行记录包含自增ID、一些数据和表示Unix时间的整数。我正在设计一种老化机制，并且有兴趣使用MySQL分区来动态地将每个表基于Unix时间进行分区。假设我希望每个分区都代表一个月的数据，最后一个分区应该代表2个月的数据，...

25得票6回答

我想检查如何在使用yarn集群作为部署模式时，在驱动程序端获取每个分区的信息，例如每个分区中的总记录数，以便在控制台上记录或打印。