我正在尝试理解groupby()操作。仅仅理解groupby将数据分组是不够的,因为这只是第一步,我们还需要进行更多的操作:
df = pd.DataFrame({'Animal': ['Falcon', 'Falcon', 'Parrot', 'Parrot'],
'Max Speed': [380., 370., 24., 26.],
'Class': ['Prey', 'Prey', 'Not Prey', 'Not Prey']})
In [7]: df
Out[7]:
Animal Max Speed Class
0 Falcon 380.0 Prey
1 Falcon 370.0 Prey
2 Parrot 24.0 Not Prey
3 Parrot 26.0 Not Prey
我知道groupby()不是在原始数据集上操作的,而是在副本上操作的。我无法理解的是,在执行此操作后代码将是什么样子:
df.groupby('Class')
我能从视觉上理解吗?我可以理解原始的数据框,因为我可以看到它是一个表格,因此可以想象如何在其上执行操作。那么当我们执行上述grouoby()操作时会发生什么?它会创建一个新的Series还是两个新的列之一是“Classs”,另一个是包含所有其他值的字符串?
我尝试查看官方文档用户指南(https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html),但这并不能帮助理解grouby()操作后的样子。