我是 Python 的新手,一直在尝试从以下 HTML 代码中获取链接和内部文本:
<div class="someclass">
<ul class="listing">
<li>
<a href="http://link1.com" title="">title1</a>
</li>
<li>
<a href="http://link2.com" title="">title2</a>
</li>
<li>
<a href="http://link3.com" title="">title3</a>
</li>
<li>
<a href="http://link4.com" title="">title4</a>
</li>
</ul>
</div>
我希望只获取来自href为http://link.com
的所有链接以及它们的文本内容title
我尝试了以下代码:
div = soup.find_all('ul',{'class':'listing'})
for li in div:
all_li = li.find_all('li')
for link in all_li.find_all('a'):
print(link.get('href'))
但是我的运气不佳,有人能帮助我吗?