我正在尝试使用正则表达式在网站上找到代理地址。目前我正在使用这个正则表达式:
以下是我使用的代码:
它应该返回像这样的代理:
(\d{1,3}\.){3}\d{1,3}:(\d+)
。它可以在regexr.com和sublime text上运行,但当我在Python中使用时,结果不符合预期。以下是我使用的代码:
p = re.compile("(\d{1,3}\.){3}\d{1,3}:(\d+)")
ipCandidates = p.findall(soupString)
它应该返回像这样的代理:
120.206.182.172:8123
,但它返回了元组,如下所示:('44.', '3128')
。我该怎么办才能解决这个问题?谢谢。
(?:stuff)
而不是(stuff)
。 - user2357112