Django按小时分组

Question

Django按小时分组

5

我在Django中有以下模型。

class StoreVideoEventSummary(models.Model):
    Customer = models.ForeignKey(GlobalCustomerDirectory, null=True, db_column='CustomerID', blank=True, db_index=True)
    Store = models.ForeignKey(Store, null=True, db_column='StoreID', blank=True, related_name="VideoEventSummary")
    Timestamp = models.DateTimeField(null=True, blank=True, db_index=True)
    PeopleCount = models.IntegerField(null=True, blank=True)

我希望知道每小时进入商店的人数。为了达到这个目的，我试图按时间戳的小时分组，并求出PeopleCount列的总和。

store_count_events = StoreVideoEventSummary.objects.filter(Timestamp__range=(start_time, end_time),
                                                       Customer__id=customer_id,
                                                       Store__StoreName=store)\
        .order_by("Timestamp")\
        .extra({
            "hour": "date_part(\'hour\', \"Timestamp\")"
        }).annotate(TotalPeople=Sum("PeopleCount"))

看起来这个查询并没有按小时分组结果，它仅仅是向查询集合中的每一行添加了一个新列TotalPeople，并将其值设置为PeopleCount的值。

- CadentOrange

我感觉有些东西不对劲，"StartTime" 是从哪里来的？ "hour": "date_part(\'hour\', \"StartTime\")" - nivix zixer

抱歉，应该是“时间戳”。 - CadentOrange

3个回答

1

虽然我来晚了，但是从这份文档https://docs.djangoproject.com/en/1.11/ref/models/querysets/#django.db.models.query.QuerySet.extra中可以得到启示，下面的过滤器应该适用于你。

store_count_events = StoreVideoEventSummary.objects.filter(
    Timestamp__range=(start_time, end_time),
    Customer__id=customer_id,
    Store__StoreName=store
).order_by(
    'Timestamp'
).extra(
    select={
        'hour': 'hour(Timestamp)'
    }
).values(
    'hour'
).annotate(
    TotalPeople=Sum('PeopleCount')
)

- Mukund Muralikrishnan

start_time和end_time是什么，它们在哪里定义的？ - Rahul Sharma

hour(TimeStamp)中的hour是什么意思？ - Gilbish Kosma

1

基于您的原始代码，您能否尝试：

store_count_events = StoreVideoEventSummary.objects.filter(Timestamp__range=(start_time, end_time), Customer__id=customer_id, Store__StoreName=store)\
    .extra({
        "hour": "date_part(\'hour\', \"Timestamp\")"
    })\
    .values("hour")\
    .group_by("hour")\
    .annotate(TotalPeople=Sum("PeopleCount"))

- nivix zixer

似乎不能正常工作。它与之前的相似，唯一的区别似乎是现在每行只有2个字段hour和TotalPeople，而不是整行数据。 - CadentOrange

“QuerySet”对象没有“group_by”属性。 - mrash

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Joran Beasley · Accepted Answer

只需将其分为两个步骤

import itertools
from datetime import datetime


# ...

def date_hour(timestamp):
    return datetime.fromtimestamp(timestamp).strftime("%x %H")


objs = StoreVideoEventSummary.objects.filter(
    Timestamp__range=(start_time, end_time),
    Customer__id=customer_id,
    Store__StoreName=store
).order_by("Timestamp")

groups = itertools.groupby(objs, lambda x: date_hour(x.Timestamp))

# since groups is an iterator and not a list you have not yet traversed the list
for group, matches in groups:  # now you are traversing the list ...
    print(group, "TTL:", sum(1 for _ in matches))

这使您可以按照几个不同的标准进行分组

如果您只想按小时而不考虑日期，只需更改 date_hour

def date_hour(timestamp):
   return datetime.fromtimestamp(timestamp).strftime("%H")

如果您想按星期几分组，只需使用：

def date_day_of_week(timestamp):
   return datetime.fromtimestamp(timestamp).strftime("%w %H")

将 itertools.groupby 中的 lambda 表达式更新为使用 date_day_of_week。