我编写了一个脚本,用于在网页中查找表达式:
import sre, urllib2, sys, BaseHTTPServer
# -*- coding: utf-8 -*-
address = sys.argv[1]
web_handle = urllib2.urlopen(address)
website_text = website_handle.read()
matches = sre.findall(u"עברית", website_text)
for item in matches:
print iten
如果我使用“普通”的正则表达式(不包含希伯来字符),那么此脚本可以工作,但如果我使用它们,则无法匹配任何内容。
编辑 示例: url = https://en.wikipedia.org/wiki/Category:Countries
nsregularexpression
是苹果特定实现的正则表达式。我已经为您将该标签更换为标准的正则表达式标签。 - ArtOfWarfarere.findall(u"עברית", u"עברית")
直接粘贴到2.7.9 REPL中,它可以正常工作。我认为如果Sanich给我们一个要测试的URL,我们才能回答这个问题。 - ArtOfWarfare