我有一个大型数据框,需要按空行拆分。
以下是数据框的简化示例:
正文:
如您所见,第9行为空白。我的需求是将0到8行放入不同的数据框中,以及10行到下一个空白行,这样最终就会有多个数据框。请注意,在寻找空白行时,整行都需要为空白。
以下是我用于查找空白行的代码:
这段代码在简化的 DF 上测试时可以运行,但是我的真实 DataFrame 比
有什么方法可以找到下一个空行(或者像我上面做的一样,一次找到所有空行),而不必指定列名?
谢谢。
以下是数据框的简化示例:
A B C
0 1 0 International
1 1 1 International
2 NaN 2 International
3 1 3 International
4 1 4 International
5 8 0 North American
6 8 1 North American
7 8 2 North American
8 8 3 North American
9 NaN NaN NaN
10 1 0 Internal
11 1 1 Internal
12 6 0 East
13 6 1 East
14 6 2 East
...
正文:
如您所见,第9行为空白。我的需求是将0到8行放入不同的数据框中,以及10行到下一个空白行,这样最终就会有多个数据框。请注意,在寻找空白行时,整行都需要为空白。
以下是我用于查找空白行的代码:
def find_breaks(df):
df_breaks = df[(df.loc[:,['A','B','C']].isnull()).any(axis=1)]
print(df_breaks.index)
这段代码在简化的 DF 上测试时可以运行,但是我的真实 DataFrame 比
['A','B','C']
列多得多。有什么方法可以找到下一个空行(或者像我上面做的一样,一次找到所有空行),而不必指定列名?
谢谢。
9 NaN NaN NaN
? - Heinzimport numpy as np
@TomasLucena numpy导入numpy库,简写为np
- cs95