Hadoop：如何创建自增ID

Question

3

我需要在hadoop中找到一个与AUTO_INCREMENT id等价的SQL语句。

当我的reduce任务识别出一个新项目时，这些项目需要分配唯一的ID。

- David Parks

2

可能是Distributed sequence number generation?的重复问题。 - Praveen Sripati

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ray Toal · Accepted Answer

要执行分布式ID生成，您可以仅生成UUID或使用在Apache Zookeeper中找到的功能，在Hadoop集群上进行分布式协调。免责声明：我从未使用过Zookeeper，因此不知道是否真正（甚至理论上）可以获得全局连续的ID集，这似乎是问题所问的。

但是，生成UUID确实有成本；它们需要一些时间来生成。

有关分布式ID生成的良好通用信息，请参见此Stack Overflow问题。