使用Beautifulsoup获取特定属性

4
我可以帮助您翻译。这段内容是关于如何在使用beautifulsoup时从HTML标签中提取属性的问题。
例如:
<div class="search-pagination-top clearfix  mtop ">
                                            <div class="row"><div class="col-l-4 mtop pagination-number" tabindex="0"
aria-label="Page 1 of 15 "><div>Page <b>1</b> of <b>15</b> </div></div>

如何获取“aria-label”属性中的文本?
我尝试使用select(),但没有帮助。
1个回答

3

您可以像使用字典一样提取属性值。使用键 aria-label

示例:

from bs4 import BeautifulSoup

html = """<div class="search-pagination-top clearfix  mtop ">
                                            <div class="row"><div class="col-l-4 mtop pagination-number" tabindex="0"
aria-label="Page 1 of 15 "><div>Page <b>1</b> of <b>15</b> </div></div>
"""

soup = BeautifulSoup(html, "html.parser")
print( soup.find("div", class_="col-l-4 mtop pagination-number")["aria-label"] )

输出:

Page 1 of 15 

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接