我需要在hadoop中找到一个与AUTO_INCREMENT
id等价的SQL语句。
当我的reduce任务识别出一个新项目时,这些项目需要分配唯一的ID。
我该如何在整个集群中共享原子计数器?报告器计数器似乎只是增量计数器,我没有看到getAndIncrement功能。
在map/reduce任务开始之前,我如何设置该计数器?
我需要在hadoop中找到一个与AUTO_INCREMENT
id等价的SQL语句。
当我的reduce任务识别出一个新项目时,这些项目需要分配唯一的ID。
我该如何在整个集群中共享原子计数器?报告器计数器似乎只是增量计数器,我没有看到getAndIncrement功能。
在map/reduce任务开始之前,我如何设置该计数器?
但是,生成UUID确实有成本;它们需要一些时间来生成。
有关分布式ID生成的良好通用信息,请参见此Stack Overflow问题。