如何按计算属性之和对Django模型进行排序?

3

我有两个模型,项目和会话。一个项目可以有多个会话,一个用户可以有多个项目。

class Project(models.Model):
    class Meta:
        ordering = [models.functions.Lower("name")]

    name = models.CharField(max_length=255)
    user = models.ForeignKey(User, on_delete=models.CASCADE)

class Session(models.Model):
    start = models.DateTimeField()
    end = models.DateTimeField()
    timezone = TimeZoneField()
    breaks = models.IntegerField(default=0, validators=[MinValueValidator(0)])
    project = models.ForeignKey(Project, on_delete=models.CASCADE)

    def duration(self):
        # returns minutes in (end - start)

我希望有一种方法可以获取给定用户的所有项目,并按其所有会话中持续时间的总和进行排序。由于session.duration()不是数据库字段,而是从数据库字段计算得出的,因此我无法在单个数据库查询中获取此信息。
我的当前解决方案是:
sessions = Session.objects.filter(project__user=self)
groups = [[a, sum([s.duration() for s in b])] for a, b in groupby(
 sessions, key=lambda s: s.project
)]
groups = sorted(groups, key=lambda g: g[1], reverse=True)
return [g[0] for g in groups]

这段代码使用单个查询获取所有相关会话,但是它需要按项目分组,这样会花费很长时间 - 当有大约100个项目时,需要大约1秒钟。是否有一种更快的方法来实现这一点?最好不需要为每个项目进行数据库调用。

我正在使用Django 2.0。

1个回答

1
您可以使用注释和聚合来实现这一点。首先,通过更改以下行来稍微修改Session模型:
project = models.ForeignKey(Project, on_delete=models.CASCADE)

转换为:

project = models.ForeignKey(Project, related_name='sessions', on_delete=models.CASCADE)

现在每个Project实例都将有一个sessions字段,其中包含与该Project相关的所有Session的查询集。
您可以通过获取用户的所有项目并循环遍历每个项目的会话来代替现在获取所有用户会话的方式,如下所示:
projects = Project.objects.filter(user=self)
for p in projects:
    sessions = p.sessions.all()

然后,您可以操作“sessions”查询集,使用表达式字段进行注释,例如:
from django.db.models import ExpressionWrapper, F, fields

duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
sessions = p.sessions.annotate(d=duration_)

在这一点上,每个 sessions 查询集成员都将有一个名为 d 的字段,该字段保存相应的 Session 的持续时间。 要对持续时间求和,我们可以使用 Django 查询集的 聚合 功能,如下所示:

from django.db.models import Sum
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]

在第二行我们所做的是从一个查询集中创建单个元素("聚合"),通过添加 d 字段中的所有值,并将结果分配给名为 total_duration 的字段。该表达式的结果为:

sessions.aggregate(total_duration=Sum('d'))

这是一个只有一个键(total_duration)的dict,我们从中取值。

接下来,您可以构建一个项目和持续时间的列表,并按持续时间排序,例如:

import operator
plist = []
for p in projects:
    sessions = p.sessions.annotate(d=duration_)
    total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
    # total holds the sum of this project's sessions
    plist.append({'p':p,'total':total})
plist.sort(key=operator.itemgetter('total'))

projects = [item['p'] for item in plist]

总之,这句话的意思是:
import operator
from django.db.models import F, Sum, ExpressionWrapper, fields

duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
projects = Project.objects.filter(user=self)
plist = []

for p in projects:
    sessions = p.sessions.annotate(d=duration_)
    total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
    # total holds the sum of this project's sessions
    plist.append({'p':p,'total':total})

plist.sort(key=operator.itemgetter('total'))

projects = [item['p'] for item in plist]

参考资料:这个回答, Django查询表达式, Django聚合

谢谢您的回复 - 我还是有点不清楚。这里的 total 是每个会话持续时间的总和。我需要的输出是按项目的总持续时间排序的项目列表。我感觉您已经完成了90%,只是我无法弄清如何使用上面的 duration_ 字段来实现这一点。 - Sam Ireland
@SamIreland 我已经更新了我的答案。现在应该是完整的了。 - Paolo Stefan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接