我有一个包含30万行数据的数据集,其中有以下DataFrame:
客户ID值会批量重复。例如,第一行和第二行包含的客户ID值为17850的数据可能会在数据集的其他位置再次出现。 我正在尝试按相同的客户ID分组子集行,并对该组合计收入。我想要进行的数据框转换应该如下所示:
问题在于,如果我使用groupby方法,它会将所有具有相同CustomerID值的行分组。因此,这样它会将整个数据框中的所有17850个CustomerID值分组在一起,而不仅仅是前两行的一堆,然后是其他CustomerID值的后续一堆。
非常感谢您使用Pandas提供帮助。谢谢。
CustomerID Revenue
0 17850.0 15.30
1 17850.0 11.10
2 13047.0 17.85
3 13047.0 17.85
4 17850.0 20.34
5 13047.0 12.60
6 13047.0 12.60
7 13047.0 31.80
8 17850.0 20.34
9 17850.0 15.30
10 13047.0 9.90
11 13047.0 30.00
12 13047.0 31.80
13 12583.0 40.80
14 12583.0 39.60
15 13047.0 14.85
16 13047.0 14.85
17 12583.0 15.60
18 12583.0 45.00
19 12583.0 70.80
客户ID值会批量重复。例如,第一行和第二行包含的客户ID值为17850的数据可能会在数据集的其他位置再次出现。 我正在尝试按相同的客户ID分组子集行,并对该组合计收入。我想要进行的数据框转换应该如下所示:
CustomerID TotalRevenue
0 17850.0 26.40
1 13047.0 35.70
2 17850.0 20.34
3 13047.0 57.0
4 17850.0 35.64
5 13047.0 71.7
6 12583.0 80.4
7 13047.0 29.7
8 12583.0 131.4
问题在于,如果我使用groupby方法,它会将所有具有相同CustomerID值的行分组。因此,这样它会将整个数据框中的所有17850个CustomerID值分组在一起,而不仅仅是前两行的一堆,然后是其他CustomerID值的后续一堆。
非常感谢您使用Pandas提供帮助。谢谢。