在两个维度上使用日期时间进行分组

3
我正在查看这个帖子,但不知何故它无法工作。
我目前有一个包含两列的数据框: enter image description here 当我检查列类型时,得到的结果为:
Datum        datetime64[ns]
MIPS                float64

现在我想按天和小时分组:

df.groupby([df['Datum'].dt.day, df['Datum'].dt.hour])['MIPS'].sum().reset_index()

但是我得到了以下错误:

ValueError: 无法插入数据,因为它已经存在

这是因为他不能创建一个有两个相同名称的分组数据框吗?我该如何避免这种情况?

1个回答

2

您可以重命名两个Series以避免出现相同名称的MultiIndex

df.groupby([df['Datum'].dt.day.rename('Day'), 
            df['Datum'].dt.hour.rename('Hour')])['MIPS'].sum().reset_index()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接