仅跳过空行读取Excel文件(pd.read_excel())

5
我有一个如下的数据框。
    id       date       name    branch  position
0   20323   2019-02-03  Bete    H       IE
1   20326   2019-02-03  Veso    R       MGR
2   22357   2019-02-03  Nom     D       IE
3   20935   2019-02-06  Dow     A       MGR
4   NaN     NaT         NaN     NaN     NaN
5   20432   2019-02-07  Tem     W       MGR
6   23999   NaT         Bonny   NaN     NaN
7   21102   2019-02-07  Xi      A       IE

我只想删除空行(例如索引为4)。

我试图使用 df = pd.read_excel("../20191210/test.xlsx", skip_blank_lines=True) 读取数据文件。

但是,这与 df = pd.read_excel("..20191210/test.xlsx") 的结果没有区别。

这里 是文件的下载链接。

有人可以帮忙吗?


我认为只需要使用df.dropna(how='all')就足够了。 - GiovaniSalazar
我们怎么能在没有任何数据或文件本身的情况下帮助读取Excel文件呢? - AMC
@AlexanderCécile 抱歉!我添加了下载文件的URL。 - xcen
2个回答

10
这是一个关于使用df.dropna(how='all')的例子:如果所有行都没有NaN值。
import pandas as pd
import numpy as np

dict = {'Col1':[100, 90, np.nan, 95],
        'Col2': [30, 45, np.nan, np.nan],
        'Col3':[np.nan, 40,np.nan, 98]}

df = pd.DataFrame(dict)
# With NaN
print(df)

# Without NaN
df = df.dropna()
print (df)

# Without NaN if all rows have NaN
df = df.dropna(how='all')
print (df)

4
"df.dropna(how='all')"有效。是否有方法在读取时跳过行? - xcen
1
@Akira 我在谷歌搜索。 - GiovaniSalazar
在你的 Excel 中,NaN 值是 null?N/A?是空白吗? - GiovaniSalazar
我添加了空白行进行测试。 - xcen
很抱歉,我找不到你要的东西...希望我给你的代码能够有用。 - GiovaniSalazar

1
在读取Excel文件后,尝试使用df = df.dropna()

1
df.dropna() 删除了索引6。 - xcen
1
我认为这会有帮助:df = df.dropna(subset=['id']) - Prince

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接