你好,我正在为以下问题苦苦挣扎:
给定一个带有 name
和 variable
两列的数据框,我想要创建两个列表:
list_names_nan
包含在变量列中所有值都是NaN的名称list_names_not_nan
包含在变量列中至少有一个非NaN值的名称
以下是一个示例
import pandas
import numpy
df = pandas.DataFrame(data=[['x',1],['y',2],['x',4],['z',numpy.nan],
['x',numpy.nan],['y',3],['x',numpy.nan],['z',numpy.nan],],
columns=['name','variable'])
df:
name variable
0 x 1.0
1 y 2.0
2 x 4.0
3 z NaN
4 x NaN
5 y 3.0
6 x NaN
7 z NaN
期望的输出应该是
list_names_nan = [z]
list_names_not_nan = [x,y]