假设我们有一个如下的数据框:
完成此操作后,我想要检查a、b、c中哪个具有最大的行数(在本例中,
我希望添加零,因为我想在所有变量(a、b、c)上应用固定尺寸的窗口以绘制图表。
df = pd.DataFrame({ 'Col1' : ['a', 'a', 'a', 'a', 'b', 'b', 'c', 'c'],
'col2' : ['0.5', '0.78', '0.78', '0.4', '2', '9', '2', '7',]
})
我统计了在col1
中所有唯一值的行数。例如,a
有4行,b
和c
各有2行,方法如下:
df.groupby(['Col1']).size()
然后我得到的输出结果为
Col1
a 4
b 2
c 2
dtype: int64
完成此操作后,我想要检查a、b、c中哪个具有最大的行数(在本例中,
a
拥有最大的行数),并使用它们与最大值之间的差异来填充其他变量(b
和c
),填充值为零(由于b
和c
各有2行,而4是最大行数,我想用2个零来填充b
和c
)。这些零必须添加到末尾。我希望添加零,因为我想在所有变量(a、b、c)上应用固定尺寸的窗口以绘制图表。