我有一个数据框,其中一些列包含nan。我想删除那些包含特定数量NaN的列。例如,在以下代码中,我想删除任何具有2个或更多NaN的列。在这种情况下,列“C”将被删除,只保留“A”和“B”。我该如何实现?
import pandas as pd
import numpy as np
dff = pd.DataFrame(np.random.randn(10,3), columns=list('ABC'))
dff.iloc[3,0] = np.nan
dff.iloc[6,1] = np.nan
dff.iloc[5:8,2] = np.nan
print dff
len(df)
应该是len(dff)
。 - pyandf[col_name_list].fillna(...)
,只将阈值应用于此子集,并将其应用于其他列df[df.columns.difference(col_name_list)].filna(....)
。 - EdChum