去除 Pandas 数据框中某一列末尾的所有空格

13

我有一个 pandas 数据框,其中有许多字符串元素,包含这样的单词:

'Frost                              '

这个字符串前面有很多前导空格。当我将此字符串与以下内容进行比较时:

'Frost'

由于前导空格,我意识到比较结果是False

虽然我可以通过迭代 pandas 数据框的每个元素来解决这个问题,但由于我有大量的记录,这个过程很慢。

这种其他方法应该可行,但它目前还没有起作用:

rawlossDF['damage_description'] = rawlossDF['damage_description'].map(lambda x: x.strip(''))

所以当我检查一个元素时:

rawlossDF.iloc[0]['damage_description']

它返回:

'Frost                              '

这里发生了什么?

2个回答

25

或者你可以使用str.strip方法:

rawlossDF['damage_description'] = rawlossDF['damage_description'].str.strip()

3
我曾尝试在一个有五百万行数据的数据集上运行此代码,与使用map和lambda函数相比,它需要两倍的时间。 - manuvendev

24

请使用以下函数替换您的函数:

rawlossDF['damage_description'] = rawlossDF['damage_description'].map(lambda x: x.strip())

你的错误几乎已经被纠正了,你需要在 strip() 函数中去掉引号。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接