如果标题有点令人困惑,请原谅。
假设我有test.h5
文件。以下是使用df.read_hdf('test.h5', 'testdata')
读取此文件的结果:
0 1 2 3 4 5 6
0 123 444 111 321 NaN NaN NaN
1 12 234 113 67 21 32 900
3 212 112 543 321 45 NaN NaN
我想选择最后一个非NaN列。我的期望结果是这样的:
0 321
1 900
2 45
我希望选择除了最后一个非NaN列以外的所有列。我的预期结果可能是这样的。它可以是numpy数组,但我还没有找到任何解决方案。
0 1 2 3 4 5 6
0 123 444 111
1 12 234 113 67 21 32
3 212 112 543 321
我在网上搜索并找到了
df.iloc[:, :-1]
用于读取除最后一列外的所有列,df.iloc[:, -1]
用于读取最后一列。使用这两个命令得到的结果如下: 1. 读取除最后一列以外的所有列。
0 1 2 3 4 5
0 123 444 111 321 NaN NaN
1 12 234 113 67 21 32
3 212 112 543 321 45 NaN
2. 读取最后一列
0 NaN
1 900
2 Nan
我的问题是,是否有任何在pandas中用于处理这些条件的命令或查询语句?
感谢任何帮助和建议。
notnull
替代isnull
的否定。 - Zero