给定这个数据集,我想计算缺失值和NaN值:
df = pd.DataFrame({'A' : [1, np.nan, 2 , 55, 6, np.nan, -17, np.nan],
'Team' : ['one', 'one', 'two', 'three','two', 'two', 'one', 'three'],
'C' : [4, 14, 3 , 8, 8, 7, np.nan, 11],
'D' : [np.nan, np.nan, -12 , 12, 12, -12, np.nan, np.nan]})
我想特别统计“团队”列中每个组的百分比。我可以通过以下代码获得原始计数:
df.groupby('Team').count()
这将得到非缺失数字的数量。我想要做的是创建一个百分比,所以不是得到原始数字,而是得到每个组中总条目数的百分比(我不知道这些组的大小都是不相等的)。我尝试使用 .agg(),但似乎无法获得我想要的结果。我该如何操作?