我希望通过BeautifulSoup获取内容中所有data-js属性的值。
输入:
我用lxml做了这件事:
我想通过BeautifulSoup获取上述结果。
<p data-js="1, 2, 3">some text..</p><p data-js="5">some 1 text</p><p data-js="4"> some 2 text. </p>
输出:
['1, 2, 3', '5', '4']
我用lxml做了这件事:
>>> content = """<p data-js="1, 2, 3">some text..</p><p data-js="5">some 1 text</p><p data-js="4"> some 2 text. </p>"""
>>> import lxml.html as PARSER
>>> root = PARSER.fromstring(content)
>>> root.xpath("//*/@data-js")
['1, 2, 3', '5', '4']
我想通过BeautifulSoup获取上述结果。
True
只是确保data-js
键存在于p
元素中。这样你就不会遇到KeyError: 'data-js'
的错误。 - wenzul