假设我有以下数据框:
>>> Data=pd.DataFrame()
>>> Data['Color']=['Green','Green','Green','Blue','Blue','Green','Green','Blue','Green','Yellow']
>>> Data['Count']=np.random.randint(0,100,10)
>>> Data
Color Count
0 Green 75
1 Green 53
2 Green 89
3 Blue 66
4 Blue 45
5 Green 98
6 Green 7
7 Blue 28
8 Green 28
9 Yellow 7
我如何按“颜色”列和与该列相同值的其他记录形成的组进行分组。例如,我的期望输出将类似于以下内容(请注意,“Count”列上应用的函数是任意的,但在此示例中我使用了sum)。
Value
Group Color
0 Blue 111
Green 217
Yellow 7
1 Blue 28
Green 105
2 Green 28
前三条记录的颜色相同,因此在绿色的组0中。接下来两条记录的颜色相同,因此在蓝色的组0中。然后有两个更多的绿色记录,将它们放入绿色的组1中。等等,等等。