我有下面这个数据框,我要使用groupby和sum()函数来处理它:
d = {'col1': ["A", "A", "A", "B", "B", "B", "C", "C","C"], 'col2': [1,2,3,4,5,6, np.nan, np.nan, np.nan]}
df = pd.DataFrame(data=d)
df.groupby("col1").sum()
这将导致以下结果:
col1 col2
A 6.0
B 15.0
C 0.0
我希望C显示NaN而不是0,因为C的所有值都是NaN。 我如何实现这一点? 使用lambda函数的apply()函数吗? 任何帮助将不胜感激。
NaN
是因为 每个 值都是NaN
吗?对于一个包含1 2 NaN
的组,你应该返回 NaN 还是 3? - ALollz