我有一个像这样的HTML文档:https://dropmefiles.com/wezmb 所以我需要提取<span id="1" and </span之间的文本,但我不知道如何操作。 我正在尝试编写这段代码:
from bs4 import BeautifulSoup
with open("10_01.htm") as fp:
soup = BeautifulSoup(fp,features="html.parser")
for a in soup.find_all('span'):
print (a.string)
但它会提取所有“span”标签中的信息。那么,我该如何在Python中提取标签<span id="1">和</span>之间的文本?
bs4
那样轻松地从HTML中提取文本(通过使用.find_all
和其他方法)。 - pu239