同时在多个字段上进行Mongodb聚合统计(count)

23

我有这样的文件:

{
    "_id" : "someuniqueeventid",
    "event" : "event_type_1",
    "date" : ISODate("2014-01-14T00:00:00Z"),
}

我想按“事件”分组,并计算每个事件类型在每周的每一天发生了多少次。基本上,我想要得到如下结果:

{
    "_id": "event_type_1",
    "1": "number of event_type_1 for Monday",
    "2": "number of event_type_1 for Tuesday",
    ...
},
{
    "_id": "event_type_2",
    ...
}

很遗憾,我被卡在这里了:

db.data.aggregate([ {$project: {date_of_week: {$dayOfWeek: "$date"}, event: "$event"}}, 
                    {$group: {_id: "$event", .... } ])

有什么想法吗?

2个回答

26

聚合框架不会基于数据创建键,也不应该这样做,因为"data"不是一个键,而实际上是数据,所以你应该坚持模式。

这意味着你基本上可以只这样做:

db.data.aggregate([
    { "$group": {
        "_id": {
            "event_type": "$event",
            "day": { "$dayOfWeek": "$date" }
        },
        "count": { "$sum": 1 } 
    }}
])

这将统计每周事件发生的次数,虽然在输出中有多个文档,但很容易更改为每个事件一个单独的文档:

db.data.aggregate([
    { "$group": {
        "_id": {
            "event_type": "$event",
            "day": { "$dayOfWeek": "$date" }
        },
        "count": { "$sum": 1 } 
    }},
    { "$group": {
        "_id": "$_id.event_type",
        "days": { "$push": { "day": "$_id.day", "count": "$count" } }
    }}
])

那是以数组形式存在,但仍然包含您想要的结果。

如果你真的想保持你的确切表格,那么你需要像这样做:

db.data.aggregate([
    { "$group": {
        "_id": "$event",
        "1": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 1 ] },
                    1,
                    0
                ]
            }
        },
        "2": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 2 ] },
                    1,
                    0
                ]
            }
        },
        "3": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 3 ] },
                    1,
                    0
                ]
            }
        },
        "4": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 4 ] },
                    1,
                    0
                ]
            }
        },
        "5": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 5 ] },
                    1,
                    0
                ]
            }
        },
        "6": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 6 ] },
                    1,
                    0
                ]
            }
        },
        "7": {
            "$sum": {
                "$cond": [
                    { "$eq": [{ "$dayOfWeek": "$date" }, 7 ] },
                    1,
                    0
                ]
            }
        }
    }}
)

但那实在是冗长的,所以我个人认为我会坚持使用第一种或者第二种解决方案,因为它们更短更易于阅读。


1
糟糕!现在看起来很容易,我总是忘记可以将多个字段粘贴到_id中:(谢谢! - Unknown
在你的第二个例子中,$day 应该是 $_id.day,对吗? - Laizer

6

在MongoDb 3.4.4及更高版本中,您可以利用$arrayToObject运算符来获取计数。您需要运行以下聚合管道:

db.data.aggregate([
    { 
        "$group": {
            "_id": {
                "event": "$event",
                "day": { "$substr": [ { "$dayOfWeek": "$date" }, 0, -1 ] }
            },
            "count": { "$sum": 1 }
        }
    },
    { 
        "$group": {
            "_id": "$_id.event",
            "counts": {
                "$push": {
                    "k": "$_id.day",
                    "v": "$count"
                }
            }
        }
    },
    { 
        "$project": {
            "counts": { "$arrayToObject": "$counts" }
        } 
    }    
])

1
$arrayToObject 可在 3.4.4 版本开始使用。 - Asya Kamsky
@AsyaKamsky 感谢您的澄清,已更新答案。 - chridam

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接