将数据框汇总为字典

4
我有一个如下的pandas数据框。
    date        hour  level
0  2015-10-27    0     2.5
1  2015-10-27    1     2.5     
2  2015-10-27    2     2.5
3  2015-10-27    3     2.5
4  2015-10-28    0     0.0
5  2015-10-28    1     0.0
6  2015-10-28    2     0.0
7  2015-10-28    3     0.0
8  2015-10-28    4     0.0
...
14 2015-10-29    0     3.23
15 2015-10-29    1     3.23
...
hour将始终从0开始递增1;它可能达到23,也可能不到。每天逐一增加一个日期项,但日期条目的数量可能因日期而异,例如-2015-10-27有4个条目,而2015-10-28则增加到第13行。对于该日期,level条目将始终具有相同的值,但该值可能不会出现在另一个日期中。
我想要的是这种形式的字典
{'2015-10-27': '3', ..., '2015-10-29': '4', ...}

字典值表示level所在的范围,即如果level是2.5,则落在[2, 3)。我的想法是选择每个“块”的第一行并创建一个新的数据框,然后遍历该数据框并应用10个if语句(level的最大值为9.xx),或者可能使用向上取整函数。但我也不知道怎么做,而且似乎非常笨拙。
有没有更简便的方法来解决这个问题?

使用 DataFrame.groupby - shx2
@AlanH 能否请您更清楚地解释一下您的意图?您想要每个“日期”的“级别”的上限吗?如果同一日期有多个级别(来自不同的范围),该怎么办? - Anand S Kumar
@AnandSKumar 这在我的数据框中并没有发生,这就是为什么我为每个分组都创建了相同级别条目的示例的原因。 - TheRealFakeNews
1个回答

2

如果每个日期的level值都在同一范围内,则可以基于date进行分组(使用DataFrame.groupby()),然后对level列取max,然后将所有值向上取整(到上限),然后使用Series.to_dict()将该系列转换为字典。示例 -

df.groupby('date')['level'].first().apply(np.ceil).to_dict()

演示 -

In [44]: df
Out[44]:
          date  hour  level
0   2015-10-27     0   2.50
1   2015-10-27     1   2.50
2   2015-10-27     2   2.50
3   2015-10-27     3   2.50
4   2015-10-28     0   0.00
5   2015-10-28     1   0.00
6   2015-10-28     2   0.00
7   2015-10-28     3   0.00
8   2015-10-28     4   0.00
14  2015-10-29     0   3.23
15  2015-10-29     1   3.23

In [45]: df.groupby('date')['level'].first().apply(np.ceil).to_dict()
Out[45]: {'2015-10-27': 3.0, '2015-10-28': 0.0, '2015-10-29': 4.0}

如果你想将字典中的值转换为 int 类型,在使用 Series.astype() 方法将其转换为字典之前,可以先将值转换为 int。例如-
In [46]: df.groupby('date')['level'].first().apply(np.ceil).astype(int).to_dict()
Out[46]: {'2015-10-27': 3, '2015-10-28': 0, '2015-10-29': 4}

但是如果我只想表示实际值呢?例如,对于键“'2015-10-29'”,我不想像你的解决方案中那样有一个“4”,而是希望将“3.23”作为值。 - TheRealFakeNews
从上面的解决方案中删除.apply(np.ceil) - Anand S Kumar
留下 min() 的作用是什么?那么,我不明白 df.groupby('date')['level'] 是什么样子(我无法打印它)。 - TheRealFakeNews
дҢ еЏҮд»ӨдҢүз”Ё.first()д»Әж›үmin()ж€–max()гЂ‚е®ѓд»…з”ЁдғҺиҺ·еЏ–жҮЏдёҒз»„пә€жҮЏдёҒж—Өжњџпә‰зљ„дёЂдёҒеЂәгЂ‚ - Anand S Kumar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接