我正在尝试使用Python的HTMLParser库从一个HTML页面中获取一个值。 我想要获取的值位于这个HTML元素中:
...
<div id="remository">20</div>
...
这是我的HTMLParser类:
class LinksParser(HTMLParser.HTMLParser):
def __init__(self):
HTMLParser.HTMLParser.__init__(self)
self.seen = {}
def handle_starttag(self, tag, attributes):
if tag != 'div': return
for name, value in attributes:
if name == 'id' and value == 'remository':
#print value
return
def handle_data(self, data):
print data
p = LinksParser()
f = urllib.urlopen("http://example.com/somepage.html")
html = f.read()
p.feed(html)
p.close()
我希望类的功能能够获取值为20。