Pandas DataFrame 按条件分组和聚合计数

Question

Pandas DataFrame 按条件分组和聚合计数

3

我已经开始尝试数据分析以及相关工具：Pandas、Numpy、Jupyter等...

我正在处理的任务很简单，我可以轻松地使用常规Python完成。然而，我更感兴趣的是探索Pandas，并因此寻找Pandas解决方案。

我有这个简单的Pandas DataFrame。时间戳列只是一个Unix时间戳，但为了使事情更易读，我只是放置了一个更舒适的数字：

id	时间戳	成功
1	9999	是
2	1111	是
3	9999	否
4	1111	是
5	9999	是
6	1111	是

我想按时间戳进行分组，但我想要另一个聚合列，这是成功列的结果：如果为True，则计为1，如果为False，则计为0。

我希望下面的表可以说明我尝试实现的内容。基本上，1111有三个True，因此总和为3。9999有两个True和一个False，因此总和为2。

时间戳	成功
1111	3
9999	2

- Leonardo

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Skapis9999 · Accepted Answer

import pandas as pd

# The DataFrame
a = {
    'id': [1, 2, 3, 4, 5, 6],
    'timestamp': [9999, 1111, 9999, 1111, 9999, 1111],
    'success': [True, True, False, True, True, True]
}
df = pd.DataFrame(a)

# Group by timestamp and calculate the sum of success
result = df.groupby('timestamp')['success'].sum().reset_index()

# Result
print(result)

你的意思是这样吗？您通过时间戳对数据框进行分组，然后计算真值的频率。