我有一个如下的数据框:
df = pd.DataFrame({
'date': ['01/01/2020', '01/01/2020', '01/01/2020', '02/01/2020', '02/01/2020', '03/01/2020', '03/01/2020'],
'id': [101, 102, 103, 101, 104, 105, 106]
})
输出:
date id
0 01/01/2020 101
1 01/01/2020 102
2 01/01/2020 103
3 02/01/2020 101
4 02/01/2020 104
5 03/01/2020 105
6 03/01/2020 106
我需要累计不同值的数量,如下所示:
date id
0 01/01/2020 3
1 02/01/2020 4
2 03/01/2020 6
我尝试过像 df.groupby(['date']).nunique() 这样的方法,但显然不正确,因为它给出了每个日期的唯一计数,而我需要的是滚动的唯一计数。