仅跳过空行读取Excel文件（pd.read_excel()）

Question

仅跳过空行读取Excel文件（pd.read_excel()）

5

我有一个如下的数据框。

    id       date       name    branch  position
0   20323   2019-02-03  Bete    H       IE
1   20326   2019-02-03  Veso    R       MGR
2   22357   2019-02-03  Nom     D       IE
3   20935   2019-02-06  Dow     A       MGR
4   NaN     NaT         NaN     NaN     NaN
5   20432   2019-02-07  Tem     W       MGR
6   23999   NaT         Bonny   NaN     NaN
7   21102   2019-02-07  Xi      A       IE

我只想删除空行（例如索引为4）。

我试图使用 df = pd.read_excel("../20191210/test.xlsx", skip_blank_lines=True) 读取数据文件。

但是，这与 df = pd.read_excel("..20191210/test.xlsx") 的结果没有区别。

这里是文件的下载链接。

有人可以帮忙吗？

- xcen

我认为只需要使用df.dropna(how='all')就足够了。 - GiovaniSalazar

我们怎么能在没有任何数据或文件本身的情况下帮助读取Excel文件呢？ - AMC

@AlexanderCécile 抱歉！我添加了下载文件的URL。 - xcen

2个回答

1

在读取Excel文件后，尝试使用df = df.dropna()。

- Prince

1

df.dropna() 删除了索引6。 - xcen

1

我认为这会有帮助：df = df.dropna(subset=['id'])。 - Prince

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- GiovaniSalazar · Accepted Answer

这是一个关于使用df.dropna(how='all')的例子：如果所有行都没有NaN值。

import pandas as pd
import numpy as np

dict = {'Col1':[100, 90, np.nan, 95],
        'Col2': [30, 45, np.nan, np.nan],
        'Col3':[np.nan, 40,np.nan, 98]}

df = pd.DataFrame(dict)
# With NaN
print(df)

# Without NaN
df = df.dropna()
print (df)

# Without NaN if all rows have NaN
df = df.dropna(how='all')
print (df)