我有一个pandas数据框,想通过两个列分组,然后返回一个字符串的第三列的累计和作为其中一组内的列表。
例子:
Year Bucket Name
2000 1 A
2001 1 B
2003 1 C
2000 2 B
2002 2 C
我想要的输出是:
Year Bucket Cum_Sum
2000 1 [A]
2001 1 [A,B]
2002 1 [A,B]
2003 1 [A,B,C]
2000 2 [B]
2001 2 [B]
2002 2 [B,C]
2003 2 [B,C]
我试图从两个回答中拼凑出一个答案:
https://dev59.com/55rga4cB1Zd3GeqPuvZ-#39623235 https://dev59.com/qWEh5IYBdhLWcg3wPRSq#22651188但是我还没有完全理解。