使用pandas python中的read_csv替换/删除连字符

3

你好,我正在尝试从CSV数据表中删除所有连字符。其中所有值都是XYZ-001、XYZ-002、XYZ-003等,我希望它们看起来像XYZ001、XYZ002、XYZ003。我似乎无法弄清如何使用.replace()功能。还有其他的想法吗?

import pandas as pd

dfz = pd.read_csv('control.csv', index_col=0, parse_dates=True)
df1 = pd.DataFrame(dfz[0])
print(dfz['Unnamed: 1'])
dfz['Unnamed: 1'].replace('-','')

1
dfz['Unnamed: 1'].str.replace('-','') - najeem
2个回答

2

您也可以使用以下方法:

df.replace(r'[\W]','',inplace=True,regex=True)

如果您不想使用 inplace (您可以查看 此处 以获取关于 inplace 的优缺点),您可以这样将其赋值回去:
df = df.replace(r'[\W]','',regex=True)

\W 可以匹配除字母、数字和下划线之外的任何字符。

只有在数据框中存在未知特殊字符时才使用此功能。


1
dfz['Unnamed: 1'] = dfz['Unnamed: 1'].str.replace('-','')

记得将其赋值回去。 文档 在这里


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接