187得票26回答
导入错误:找不到模块 bs4(BeautifulSoup)

我正在使用Python和Flask进行开发。当我在电脑上运行我的主要Python文件时,一切都正常。但是当我在终端中激活虚拟环境并运行Flask Python文件时,它会显示我的主要Python文件没有“bs4”模块。请问有何建议或评论?

184得票7回答
如何使用BeautifulSoup查找节点的子元素

我想获取所有的<li>子元素中的<a>标签:<div> <li class="test"> <a>link1</a> <ul> <li> &l...

183得票16回答
使用 Python 和 BeautifulSoup 从网页中提取链接

如何使用Python检索网页的链接并复制链接的URL地址?

163得票9回答
BeautifulSoup和Scrapy爬虫的区别是什么?

我想制作一个网站,展示亚马逊和eBay产品价格的比较。哪个更好并且为什么? 我对BeautifulSoup有一些了解,但不太了解Scrapy爬虫。

158得票10回答
我们能在BeautifulSoup中使用XPath吗?

我正在使用BeautifulSoup来爬取一个URL,以下是我用来查找类为'empformbody'的td标签的代码:import urllib import urllib2 from BeautifulSoup import BeautifulSoup url = "http:...

153得票11回答
如何使用BeautifulSoup只提取可见的网页文本?

基本上,我想使用BeautifulSoup仅获取网页上的可见文本。例如,这个网页是我的测试案例。我主要只想获取正文内容和一些选项卡名称。我尝试了这个SO问题中的建议,但返回了很多我不想要的<script>标签和HTML注释内容。我无法确定函数findAll()所需的参数,以便仅获取...

137得票6回答
Python BeautifulSoup解析表格

我正在学习Python的requests和BeautifulSoup。为了练手,我选择编写一个快速的纽约市停车罚单解析器。获得了相当丑陋的HTML响应。我需要获取lineItemsTable并解析所有罚单。 您可以通过访问此处:https://paydirect.link2gov.com/N...

130得票9回答
如何使用BeautifulSoup查找只带有特定属性的标签

使用BeautifulSoup,如何搜索包含仅搜索属性的标记? 例如,我想查找所有的<td valign="top">标记。 以下代码: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) 获取了我想要...

126得票3回答
我可以使用BeautifulSoup移除脚本标签吗?

使用BeautifulSoup可以从HTML中删除<script>标签及其所有内容,也可以使用正则表达式或其他方式进行处理。

118得票7回答
使用BeautifulSoup根据name属性获取属性值

我想根据属性名称打印其值,例如 <META NAME="City" content="Austin"> 我想要做类似于这样的事情soup = BeautifulSoup(f) # f is some HTML containing the ...