我有以下字符串:
line = "1234567 7852853427.111 https://en.wikipedia.org/wiki/Dictionary_(disambiguation)"
我希望使用正则表达式删除数字1234567和7852853427.111。
这是我的正则表达式:
nline = re.sub("^\d+\s|\s\d+\s|\s\d\w\d|\s\d+$", " ", line)
但它并没有做我希望它做的事情。
有人能指引我走正确的方向吗?
|
将整个正则表达式分成不同的部分 - 也就是说,第一部分匹配字符串的开头,但第二部分却不匹配。你可能需要阅读一下如何使用括号创建组。 - Jongwarehttp://
之前的所有内容”?您的标题提到了标点符号,那么开头的1..2
应该被删除吗? - Jongwareline.split()[-1]
,这种方式更容易。 - godaygo