使用MongoDB创建唯一ID

20
如果我要创建一个博客,我可以使用博客标题作为唯一标识符,并将其解析到URL中。但是,如果我想使用数字呢?你知道Twitter的网址是www.twitter.com/username/statuses/9834542吗?是否有人已经找到了使这个工作的好方法?使用“_id”是不可能的,因为它太长了。

你可以对URL进行MD5(或其他)哈希处理,并将其存储在_id的位置。 - user2346015
5个回答

24
只要你能保证唯一性,就不必使用MongoDB提供的默认“_id”。因此,生成这个数字是由你决定的。如果你想将这个数字存储在MongoDB中,那么你可以将它存储在一个单独的集合中,并为每个新的URL递增它。通过使用$inc动词可以实现字段的递增,或者你可能想看看MongoDB如何原子更新或递增值。

正如Alan所说,您可以提供自己的id。那么问题是如何生成唯一的id。最简单的方法是如果您有一些序列服务器(即某个分配数字并递增的东西,保持锁定以使其原子化发生)。此序列服务器可以使用每个序列一个mongo记录。 - Arne Claassen
可以使用自增序列来创建uid吗? - Stu_Dent

17

可以使用findandmodify命令来完成。

假设我们有一个名为sequences的特殊集合,并且我们想要为帖子编号(称为postid)创建一个序列,您可以使用类似于以下代码:

> db.runCommand( { "findandmodify" : "sequences",
                   "query" : { "name" : "postid"},
                   "update" : { $inc : { "id" : 1 }},
                   "new" : true } );

该命令将原子地返回更新后的(new)文档以及状态。如果命令成功完成,则value字段包含返回的文档。


根据文档,@BlitzKrieg,"findandmodify在通过mongos调用时,只要它修改的集合未分片,它就会表现出相同的行为。如果集合被分片,则查询必须包含分片键。" 所以,不要对sequences集合进行分片处理? - Hubert Kario

8

如果您想在MongoDB中为自己的字段添加唯一性约束,请使用索引。然后,您可以使用任何哈希算法来生成数字并测试其唯一性。 MongoDB文档中的示例如下:

db.things.ensureIndex({firstname: 1, lastname: 1}, {unique: true});

这将防止您插入与其他文档相同的firstname和lastname的文档。

更多信息请参见文档


4
我通过创建数据集“sequence”来解决了这个问题,其中包含以下数据:
  • 名称
  • 当前值
我正在使用Morphia,所以有DAO可供使用。但是您也可以不使用Morphia进行操作。 思路是使用$atomic(由于仅更新1个实例,因此可能可以省略)和$inc修改器运算符。
序列
@Entity(value = "sys_sequence", noClassnameStored = true)
public class SequenceM {

    /**
     * Names of entity
     */
    public static enum Entity {
        USER,
        CAPABILITY_HISTORY;

        public String getEntityName() {
            return this.name().toLowerCase();
        }
    }

    @Id
    private ObjectId uid;

    @Property
    @Indexed(unique = true)
    private String name;

    @Property
    private Long value;

 //..getters/setters/etc
 }

SequenceDAO中的方法:

@NotNull
public Long nextValue(final @NotNull SequenceM.Entity entity) {
    final DB db = this.ds.getDB();
    final WriteConcern writeConcern = getWriteConcern();

    //optimization for JVM instance
    synchronized(entity) {
        do {
            SequenceM sequence = findOne("name", entity.getEntityName());

            final DBObject q = BasicDBObjectBuilder.start().add("name", entity.getEntityName()).add("value", sequence.getValue()).add("$atomic", 1).get();
            final DBObject o = BasicDBObjectBuilder.start().add("$inc", BasicDBObjectBuilder.start().add("value", 1).get()).get();

            WriteResult writeResult = db.getCollection("sys_sequence").update(q, o, false, true, writeConcern);

            if(writeResult.getN() == 1) {
                return sequence.getValue() + 1;
            }
        } while(true);
    }
}

/**
 * Determining writing concern basing on configuration
 */
private WriteConcern getWriteConcern() {
    return isOneNodeOnly ? WriteConcern.SAFE : REPLICATION_SAFE;
}

根据MongoDB的配置(仅一个节点,主/从或副本集),您需要使用正确的WriteConcern。在仅有一个实例的环境中使用REPLICATION_SAFE会导致无限循环。


这是什么编程语言? :) 引起了我的注意! - asyncwait

1

从技术上讲,ID号码太大了,无法缩短。但是可以采用一种策略。将其从十六进制转换为字母数字,从而减少字符数,使其在URL中更美观。这个方法非常实用...就是这样。

function encode(hex) {
    return new Buffer(hex, 'hex').toString('base64').replace('+', '-').replace('/', '_');
};

function decode(NoHex) {
    return new Buffer( NoHex.replace('-','+').replace('_','/'), 'base64').toString('hex');
};

IdString= MyDoc._id.toString(); 
Idencode = encode( IdString ) // 16 Caracters a-Z and 0-9 
console.log( IdEncode ); //You see That 'aqswedasdfdsadsf'
IdDecode = decode( IdEncode );
IdDecode === IdString // Is true!!!

当然,这个技术使用相同的id,mongo。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接