我正在尝试使用编译的正则表达式从字符串中匹配和删除列表中的所有单词,但我很难避免单词内的出现。
输入:
任何建议或者我是错过了一些非常明显的东西吗?
目前:
REMOVE_LIST = ["a", "an", "as", "at", ...]
remove = '|'.join(REMOVE_LIST)
regex = re.compile(r'('+remove+')', flags=re.IGNORECASE)
out = regex.sub("", text)
输入:
In: "The quick brown fox jumped over an ant"
输出:"quick brown fox jumped over t" 期望的输出:"quick brown fox jumped over" 我尝试将字符串更改为以下内容,但没有成功: regex = re.compile(r'\b('+remove+')\b', flags=re.IGNORECASE)
任何建议或者我是错过了一些非常明显的东西吗?
ant
吧? - Martijn Pieters