我有以下数据框:
ID ID2 SCORE X Y
0 0 a 10 1 2
1 0 b 20 2 3
2 0 b 20 3 4
3 0 b 30 4 5
4 1 c 5 5 6
5 1 d 6 6 7
我想做的是按
ID
和ID2
分组,并仅考虑唯一的分数平均SCORE
。现在,如果我使用标准的
df.groupby(['ID', 'ID2'])['SCORE'].mean()
,我将得到23.33~的分数,而我要找的是25分。我知道我可以过滤掉
X
和Y
,去除重复项并这样做,但我想保留它们,因为它们是相关的。我该如何实现?