如何在AWS Athena中创建范围分区?

4
假设在AWS Athena中有一个包含列“Id”的外部表,该列是整数类型,以及许多其他列。是否有一种按范围对“Id”列进行分区的方法?例如,按以下方式创建分区:
0 >= Id < 10
10 >= Id < 20
20 >= Id < 30
30 >= Id < 40

当一个Id对应的数据量不够大时,这种方法就非常有用了。我们可以将一定范围内的数据放在同一个桶中,从而减少分区开销。

and so on..

1个回答

0

是的,它可以,但是您将无法像正常分区一样使用它。分区通常用于减少每个查询读取的数据量,从而提高查询性能。这就是为什么大多数人选择像dt=2019-11-05这样的分区键的原因。你在这里的实际目标是什么?您可以通过桶分配来实现相同的效果。只需创建尽可能多的桶,以便拥有尽可能多的范围。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接