如何从字符串中每个单词末尾删除特殊字符？

Question

如何从字符串中每个单词末尾删除特殊字符？

3

我希望它只匹配每个单词的结尾。

例如：

"i am test-ing., i am test.ing-, i am_, test_ing,"

输出应为：

"i am test-ing i am test.ing i am test_ing"

- killown

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- John Kugelman · Accepted Answer

>>> import re
>>> test = "i am test-ing., i am test.ing-, i am_, test_ing,"
>>> re.sub(r'([^\w\s]|_)+(?=\s|$)', '', test)
'i am test-ing i am test.ing i am test_ing'

匹配一个或多个非字母数字字符 ([^\w\s]|_)，后面跟着一个空格 (\s) 或者字符串的结尾 ($)。(?= ) 结构是一个前瞻断言：它确保匹配的空格不包含在匹配中，因此它不会被替换；只有 [\W_]+ 会被替换。

好的，但为什么是 [^\w\s]|_？你可能会问。第一部分匹配任何非字母数字或下划线 ([^\w]) 或空格 ([^\s])，即标点符号。但我们确实想要消除下划线，所以我们将其与 |_ 包括在一起。