我有两个数据框:
df
:
id string_data
1 My name is Jeff
2 Hello, I am John
3 I like Brad he is cool.
另一个名为allnames
的数据帧包含像这样的名称列表:
id name
1 Jeff
2 Brad
3 John
4 Emily
5 Ross
我想将在allnames['name']
中出现的所有单词替换为"Firstname"
,并且这些单词在df
中出现。
预期输出:
id string_data
1 My name is Firstname
2 Hello, I am Firstname
3 I like Firstname he is cool.
我尝试了这个:
nameList = '|'.join(allnames['name'])
df['string_data'].str.replace(nameList, "FirstName", case = False))
但它替换了近乎99%的单词。
That's
替换为Firstnamehat's
。其他单词都没问题,我现在会检查第二个和第三个解决方案。 - John DoeT
的变量,但它仍然失败了。非常感谢。第二个解决方案完美地解决了问题。 - John Doe