UPDATE Person SET Name = FirstName + ' ' + LastName
而 MongoDB 的伪代码则是:
db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
UPDATE Person SET Name = FirstName + ' ' + LastName
而 MongoDB 的伪代码则是:
db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
最好的方法是在4.2+版本中使用聚合管道(update文档)和updateOne
、updateMany
或update
(大多数语言驱动程序已弃用)集合方法。
4.2版本还引入了$set
管道阶段操作符,它是$addFields
的别名。我将在这里使用$set
,因为它与我们要实现的内容相符。
db.collection.<update method>(
{},
[
{"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
]
)
请注意,方法的第二个参数中的方括号指定了一个聚合管道,而不是普通的更新文档,因为使用简单的文档将无法正常工作。
在3.4+版本中,您可以使用$addFields
和$out
聚合管道运算符。
db.collection.aggregate(
[
{ "$addFields": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}},
{ "$out": <output collection name> }
]
)
find()
方法而不是.aggreate()
方法。$project
文档并使用$concat
字符串聚合运算符来返回连接的字符串来实现此目的。然后,您可以迭代游标并使用$set
更新运算符使用批量操作将新字段添加到您的文档中,以实现最大效率。var cursor = db.collection.aggregate([
{ "$project": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}}
])
您需要使用bulkWrite
方法。
var requests = [];
cursor.forEach(document => {
requests.push( {
'updateOne': {
'filter': { '_id': document._id },
'update': { '$set': { 'name': document.name } }
}
});
if (requests.length === 500) {
//Execute per 500 operations and re-init
db.collection.bulkWrite(requests);
requests = [];
}
});
if(requests.length > 0) {
db.collection.bulkWrite(requests);
}
从这个版本开始,您需要使用现在已被弃用的Bulk
API及其相关方法。
var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;
cursor.snapshot().forEach(function(document) {
bulk.find({ '_id': document._id }).updateOne( {
'$set': { 'name': document.name }
});
count++;
if(count%500 === 0) {
// Excecute per 500 operations and re-init
bulk.execute();
bulk = db.collection.initializeUnorderedBulkOp();
}
})
// clean up queues
if(count > 0) {
bulk.execute();
}
cursor["result"].forEach(function(document) {
db.collection.update(
{ "_id": document._id },
{ "$set": { "name": document.name } }
);
})
db.person.find().snapshot().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
save()
方法会完全替换文档,建议使用update()
方法。 - Carlos Melodb
数据库中person
集合中_id
等于elem._id
的文档,将该文档的name
字段更新为elem.firstname + ' ' + elem.lastname
的值。 - Philipp Jardascreate_guid
的函数,只有在使用 forEach
迭代时才会为每个文档生成一个唯一的 guid(即仅仅在带有 mutli=true
的 update
语句中使用 create_guid
会导致所有文档生成相同的 guid)。这个答案对我非常有效。+1 - rmirabelle自 MongoDB 3.4 起,似乎有一种高效的方法可以实现此操作,请参见styvane 的答案。
以下是已过时的回答
您无法在更新中引用文档本身(暂时还不支持)。您需要通过函数迭代处理每个文档并进行更新。请参见此答案以获取示例,或者使用服务器端eval()
,请参见此答案。
如果您的数据库活动频繁,您可能会遇到更新正在活跃更改记录的问题,出于这个原因,我建议使用snapshot()。
db.person.find().snapshot().forEach( function (hombre) {
hombre.name = hombre.firstName + ' ' + hombre.lastName;
db.person.save(hombre);
});
http://docs.mongodb.org/manual/reference/method/cursor.snapshot/
snapshot()
пјҡиҮӘMongo Shell v3.2ејҖе§ӢпјҢ$snapshot
иҝҗз®—з¬ҰеңЁMongo Shellдёӯе·Іиў«ејғз”ЁгҖӮ еңЁMongo ShellдёӯпјҢиҜ·ж”№з”Ёcursor.snapshot()
гҖӮй“ҫжҺҘ - ppython自Mongo 4.2版本起,db.collection.update()
方法支持使用聚合管道,从而能够根据另一个字段更新/创建字段。
// { firstName: "Hello", lastName: "World" }
db.collection.updateMany(
{},
[{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }]
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
第一部分 {}
是匹配查询,用于过滤要更新的文档(在我们的情况下是所有文档)。
第二部分 [{ $set: { name: { ... } }]
是更新聚合管道(注意方括号表示使用聚合管道)。$set
是一个新的聚合操作符,是$addFields
的别名。
{}
是筛选条件部分: 例如您可能想要更新doc1
和doc2
,但不想更新doc3
。如果没有第三部分,默认情况下该更新将仅应用于一个文档,例如doc1
,而doc2
则不会被更新。请注意,您还可以使用db.collection.updateMany
来摆脱第三个参数。 - Xavier Guihotupdate()
方法接受聚合管道作为参数,例如:
db.collection_name.update(
{
// Query
},
[
// Aggregation pipeline
{ "$set": { "id": "$_id" } }
],
{
// Options
"multi": true // false when a single doc has to be updated
}
)
使用聚合管道可以设置或取消现有值的字段。
注意:使用字段名称时,要在其前面加上$
,以指定需要读取的字段。
我尝试了上面的解决方案,但发现对于大量数据不太适用。后来,我发现了流功能:
MongoClient.connect("...", function(err, db){
var c = db.collection('yourCollection');
var s = c.find({/* your query */}).stream();
s.on('data', function(doc){
c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
});
s.on('end', function(){
// stream can end before all your updates do if you have a lot
})
})
以下是我们为约150,000条记录复制一个字段到另一个字段所想出的解决方案。虽然需要大约6分钟,但仍然比实例化并迭代同样数量的Ruby对象要少得多。
js_query = %({
$or : [
{
'settings.mobile_notifications' : { $exists : false },
'settings.mobile_admin_notifications' : { $exists : false }
}
]
})
js_for_each = %(function(user) {
if (!user.settings.hasOwnProperty('mobile_notifications')) {
user.settings.mobile_notifications = user.settings.email_notifications;
}
if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
}
db.users.save(user);
})
js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
result, err := collection.UpdateMany(ctx, bson.M{},
mongo.Pipeline{
bson.D{{"$set",
bson.M{"name": bson.M{"$concat": []string{"$lastName", " ", "$firstName"}}}
}},
)