Django:save() 和 update() 更新数据库有什么区别?

85

我正在编写一个Django应用程序,需要一个函数来更新数据库中的字段。是否有理由使用其中一种方法而不是另一种方法?

def save_db_field(name,field,value):
    obj = MyModel.objects.get(name=name)
    obj.field = value
    obj.save()

def update_db_field(name,field,value):
    MyModel.objects.get(name=name).update(field=value)

似乎第二个选项更好,因为它只需要一次数据库调用而不是两次。 那么获取然后更新有什么更好的原因吗?


1
@sobolevn 那个问题和答案已经过时了,因为 Django 版本是 1.0 或 1.1 或类似的版本。由于时间的推移,这些版本已经被弃用并不再受支持,因为发生了很多变化。 - FallenAngel
@FallenAngel,是的,我先看到了日期。但当我弄清楚后,我给出了答案。 - sobolevn
1
当我尝试更新时,出现了这个错误AttributeError: 'TableName' object has no attribute 'update'filter似乎可以工作,但是get不行。 - Srinath Ganesh
1
.update()方法仅适用于QuerySet,该QuerySet是.filter()方法的结果。如果使用.get(),则只会获得单个对象,并且需要使用.save() - zoidberg
显示剩余4条评论
9个回答

73

有几个关键的区别。

update用于查询集,因此可以一次性更新多个对象。

正如@FallenAngel指出的那样,自定义的save()方法触发方式可能存在差异,但同时也要注意signalsModelManagers。我建立了一个小的测试应用程序来展示一些有价值的差异。我使用的是Python 2.7.5,Django==1.7.7和SQLite,请注意不同版本的Django和不同的数据库引擎最终的SQL可能会有所不同。

好的,这是示例代码。

models.py

from __future__ import print_function
from django.db import models
from django.db.models import signals
from django.db.models.signals import pre_save, post_save
from django.dispatch import receiver

__author__ = 'sobolevn'

class CustomManager(models.Manager):
    def get_queryset(self):
        super_query = super(models.Manager, self).get_queryset()
        print('Manager is called', super_query)
        return super_query


class ExtraObject(models.Model):
    name = models.CharField(max_length=30)

    def __unicode__(self):
        return self.name


class TestModel(models.Model):

    name = models.CharField(max_length=30)
    key = models.ForeignKey('ExtraObject')
    many = models.ManyToManyField('ExtraObject', related_name='extras')

    objects = CustomManager()

    def save(self, *args, **kwargs):
        print('save() is called.')
        super(TestModel, self).save(*args, **kwargs)

    def __unicode__(self):
        # Never do such things (access by foreing key) in real life,
        # because it hits the database.
        return u'{} {} {}'.format(self.name, self.key.name, self.many.count())


@receiver(pre_save, sender=TestModel)
@receiver(post_save, sender=TestModel)
def reicever(*args, **kwargs):
    print('signal dispatched')

views.py:

def index(request):
    if request and request.method == 'GET':

        from models import ExtraObject, TestModel

        # Create exmple data if table is empty:
        if TestModel.objects.count() == 0:
            for i in range(15):
                extra = ExtraObject.objects.create(name=str(i))
                test = TestModel.objects.create(key=extra, name='test_%d' % i)
                test.many.add(test)
                print test

        to_edit = TestModel.objects.get(id=1)
        to_edit.name = 'edited_test'
        to_edit.key = ExtraObject.objects.create(name='new_for')
        to_edit.save()

        new_key = ExtraObject.objects.create(name='new_for_update')
        to_update = TestModel.objects.filter(id=2).update(name='updated_name', key=new_key)
        # return any kind of HttpResponse

这导致了以下SQL查询:

# to_edit = TestModel.objects.get(id=1):
QUERY = u'SELECT "main_testmodel"."id", "main_testmodel"."name", "main_testmodel"."key_id" 
FROM "main_testmodel" 
WHERE "main_testmodel"."id" = %s LIMIT 21' 
- PARAMS = (u'1',)

# to_edit.save():
QUERY = u'UPDATE "main_testmodel" SET "name" = %s, "key_id" = %s 
WHERE "main_testmodel"."id" = %s' 
- PARAMS = (u"'edited_test'", u'2', u'1')

# to_update = TestModel.objects.filter(id=2).update(name='updated_name', key=new_key):
QUERY = u'UPDATE "main_testmodel" SET "name" = %s, "key_id" = %s 
WHERE "main_testmodel"."id" = %s' 
- PARAMS = (u"'updated_name'", u'3', u'2')

对于update()只有一个查询,而对于save()有两个查询。

接下来,让我们谈一下如何重载save()方法。显然,save()方法只会被调用一次。值得一提的是,.objects.create()也会调用save()方法。

但是,在模型中调用update()时不会调用save()方法。如果update()没有调用save()方法,那么信号也不会触发。输出:

Starting development server at http://127.0.0.1:8000/
Quit the server with CONTROL-C.

# TestModel.objects.get(id=1):
Manager is called [<TestModel: edited_test new_for 0>]
Manager is called [<TestModel: edited_test new_for 0>]
save() is called.
signal dispatched
signal dispatched

# to_update = TestModel.objects.filter(id=2).update(name='updated_name', key=new_key):
Manager is called [<TestModel: edited_test new_for 0>]

如您所见,save() 会触发 Managerget_queryset() 两次。而 update() 只会触发一次。

解决方案。如果你需要“静默”更新你的值,而不需要调用 save() - 使用 update。使用案例:更新用户的 last_seen 字段。当您需要适当地更新您的模型时,请使用 save()


2
另一个关键区别是,当你在DataField或DateTimeField中使用"auto_now"或"auto_now_add"属性时,仅当调用Model.save()方法时字段才会自动更新。如果以其他方式更新其他字段(例如QuerySet.update()等),该字段不会被更新,但你可以在像那样的更新中指定该字段的自定义值。详情请参见https://docs.djangoproject.com/en/3.1/ref/models/fields/#datefield。 - DGideas

48

这两种方法看起来很相似,但有一些关键点:

  1. save() 方法会触发任何重写的 Model.save() 方法,而 update() 方法不会触发此方法,并直接在数据库级别进行更新。因此,如果您有一些带有重写保存方法的模型,则必须避免使用 update 或找到另一种执行重写 save() 方法所需操作的方式。

  2. 如果不小心,obj.save() 可能会产生一些副作用。您可以使用 get(...) 检索对象,并将所有模型字段值传递给您的 obj。当您调用 obj.save() 时,Django 将当前对象状态保存到记录中。因此,如果在 get()save() 之间由其他进程发生了某些更改,则这些更改将丢失。使用 save(update_fields=[.....]) 可以避免此类问题。

  3. 在 Django 1.5 版本之前,Django 在 INSERT/UPDATE 之前执行了一个 SELECT,因此需要执行 2 次查询。从 1.5 版本开始,该方法已被弃用。

这里 有一个关于 save()update() 方法以及它们如何执行的好指南。


2
所以对于第二个,最好在触发obj.save()之前使用obj.refresh_from_db() - Avinash Raj
@AvinashRaj,尽管在这两行代码之间仍然存在风险,可能会更改数据库数据。但现在已经减少了。 - Horatiu Jeflea
obj.save(['value']),即你的值列表 - Josh
这是最好的答案。 - java-addict301

13

save()方法可以用于向数据库中插入新记录和更新现有记录,通常用于保存单个记录的实例(mysql中的一行)。

update()不用于插入记录,可用于更新数据库中的多个记录(mysql中的多行)。


12

直接使用update更加高效,也可以防止数据完整性问题。

官方文档中提到:https://docs.djangoproject.com/en/3.0/ref/models/querysets/#django.db.models.query.QuerySet.update

如果只是要更新记录而不需要对模型对象进行任何操作,则最有效的方法是调用update(),而不是将模型对象加载到内存中。例如,不要这样做:

e = Entry.objects.get(id=10)
e.comments_on = False
e.save()

...做这个:

Entry.objects.filter(id=10).update(comments_on=False)

使用update()还可以防止竞争条件,在加载对象和调用save()之间的短时间内,数据库中的某些内容可能会发生变化。


6

更新(Update)只适用于更新查询集(QuerySets)。如果您想同时更新多个字段,比如从一个字典中更新单个对象实例,可以尝试以下方法:

obj.__dict__.update(your_dict)
obj.save()

请记住,您的字典必须包含正确的映射关系,其中键需要是您的字段名称,而值则是要插入的值。

4

更新操作可以提高查询集中多于一个对象的性能,因为它将每个查询集作为一个数据库调用。

然而,保存操作也是有用的,因为很容易在模型中覆盖保存方法并在那里添加额外的逻辑。例如,在我的应用程序中,当其他字段更改时,我会更新日期。

Class myModel(models.Model): 
    name = models.CharField()
    date_created = models.DateField()

    def save(self):
        if not self.pk :
           ### we have a newly created object, as the db id is not set
           self.date_created = datetime.datetime.now()
        super(myModel , self).save()

为何要使用if not self.pk :并设置self.date_created,而不是在date_created字段的声明中使用auto_now=True - Santhosh
true @SanthoshYedidi 但我认为这只是一个示例,说明您如何覆盖“save”方法。 - Jamil Noyda

2

save():

  • 可以与模型对象一起使用,但不能与QuerySetManager对象一起使用。
  • 使用select_for_update()可以运行SELECT FOR UPDATE查询

update()

  • 可以与QuerySetManager对象一起使用,但不能与模型对象一起使用。
  • 使用select_for_update()无法运行SELECT FOR UPDATE查询

例如,我有如下所示的Person模型

# "store/models.py"

from django.db import models

class Person(models.Model):
    name = models.CharField(max_length=30)

    def __str__(self):
        return self.name

然后,您可以使用下面所示的Person模型对象来调用save()

# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects.get(id=1)
    person.name = 'Tom'
    person.save() # Here

    return HttpResponse("Test")

# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects.filter(pk=1).first()
    person.name = 'Tom'
    person.save() # Here

    return HttpResponse("Test")

但是,您不能像下面示例所示那样在QuerySet对象上使用save()
# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects.filter(pk=1)
    person.name = 'Tom'
    person.save() # Here

    return HttpResponse("Test")

然后,出现以下错误:

AttributeError:'QuerySet'对象没有属性'save'

并且,您无法像下面所示使用Manager对象save()函数:
# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects
    person.name = 'Tom'
    person.save() # Here

    return HttpResponse("Test")

然后,会出现以下错误:

AttributeError: 'Manager'对象没有'save'属性

接下来,您可以使用如下所示的QuerySet对象update()方法:

# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects.filter(pk=1)
    person.update(name="Tom") # Here

    return HttpResponse("Test")

而且,您可以像下面展示的那样使用Manager对象来使用update()

# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects
    person.update(name="Tom") # Here

    return HttpResponse("Test")

但是,您不能像下面展示的那样,使用Person模型对象来使用update()

# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects.get(id=1)
    person.update(name="Tom") # Here

    return HttpResponse("Test")

# "store/views.py"

from .models import Person
from django.http import HttpResponse

def test(request):
    person = Person.objects.filter(pk=1).first()    
    person.update(name="Tom") # Here

    return HttpResponse("Test")

然后,出现以下错误:

AttributeError: 'Person'对象没有属性'update'

例如,当在Django中更新数据时,使用select_for_update()可以防止竞争条件(丢失更新或写入偏斜)

我有一个名为test视图,其中包含以下内容:save()select_for_update().filter(pk=1).first()

# "store/views.py"

from django.db import transaction
from .models import Person
from django.http import HttpResponse

@transaction.atomic
def test(request):
    person = Person.objects.select_for_update().filter(pk=1).first() # Here
    person.name = 'Tom'
    person.save() # Here

    return HttpResponse("Test")

然后,当我运行test view时,SELECT FOR UPDATEUPDATE查询如下所示运行。*我使用的是PostgreSQL,下面的日志是PostgreSQL的查询日志,您可以查看{{link1:在PostgreSQL上如何记录带有事务查询的SQL查询,例如“BEGIN”和“COMMIT”}}:

enter image description here

现在,我删除了 first() 并使用下面的 update()

# "store/views.py"

from django.db import transaction
from .models import Person
from django.http import HttpResponse

@transaction.atomic
def test(request):
    person = Person.objects.select_for_update().filter(pk=1) # Here
    person.update(name="Tom") # Here

    return HttpResponse("Test")

然后,当我运行test view时,SELECT FOR UPDATE查询没有被运行,只有如下所示的UPDATE查询被运行:

enter image description here

我有一个带有save()select_for_update().get(pk=1)test视图,如下所示:

# "store/views.py"

from django.db import transaction
from .models import Person
from django.http import HttpResponse

@transaction.atomic
def test(request):
    person = Person.objects.select_for_update().get(pk=1) # Here
    person.name = 'Tom'
    person.save() # Here

    return HttpResponse("Test")

然后,当我运行test view时,SELECT FOR UPDATEUPDATE查询如下所示:

enter image description here

现在,我将get()替换为下面所示的update()
# "store/views.py"

from django.db import transaction
from .models import Person
from django.http import HttpResponse

@transaction.atomic
def test(request):
    person = Person.objects.select_for_update() # Here
    person.update(name="Tom") # Here

    return HttpResponse("Test")

然后,当我运行测试视图时,SELECT FOR UPDATE查询并没有运行,只有UPDATE查询被执行,如下所示:

enter image description here

那么,save()select_for_update()可以运行SELECT FOR UPDATE查询,而update()select_for_update()则不能。

0

可能会引起很多麻烦的差异之一是,save会更新,但update不会更新类型为DateTimeField(auto_now=True)ModificationDateTimeField的列。

这些字段应该在将对象保存到数据库时自动设置其日期。


0
使用 _state.adding 来区分更新和创建 https://docs.djangoproject.com/en/3.2/ref/models/instances/
def save(self, *args, **kwargs):
    # Check how the current values differ from ._loaded_values. For example,
    # prevent changing the creator_id of the model. (This example doesn't
    # support cases where 'creator_id' is deferred).
    if not self._state.adding and (
            self.creator_id != self._loaded_values['creator_id']):
        raise ValueError("Updating the value of creator isn't allowed")
    super().save(*args, **kwargs)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接