假设'df'是数据框对象,'ca'是其中的变量。
为什么我得到了5个唯一值?我想将第五行合并到第一行,即
我该怎么修复它?
>>> df.ca.value_counts()
0.0 176
1.0 65
2.0 38
3.0 20
? 4
Name: ca, dtype: int64
如您所见,我有四个缺失值,我想要填充它们。使用以下代码:
>>> df.loc[df.ca == '?', 'ca'] = 0.0
0.0 176
1.0 65
2.0 38
3.0 20
0.0 4
Name: ca, dtype: int64
为什么我得到了5个唯一值?我想将第五行合并到第一行,即
0.0 176 + 4 = 180
1.0 65
2.0 38
3.0 20
我该怎么修复它?