初学者:需要将Beautiful Soup 4导入Python

3

我从codecademy学习了Python,现在尝试学习如何使用它从网站中挖掘数据。我没有自己的Python系统设置(只使用过Codecademy的),因此需要建议下载何种软件来运行我的代码,以及如何导入Beautiful Soup包到其中,以便使用BS4。我正在使用Mac,运行OSX 10.9.4。


你的操作系统是什么?你有查看Python网站的下载页面吗?如果没有,你应该去看一下,然后尝试安装BeautifulSoup,并且如果有任何实际问题,请提出来。 - Valentin Lorentz
我从python.org下载了Python 3.4.1,但它的用户界面不是很友好,我也无法将beautifulsoup导入其中。其实我也不太确定该怎么做。 - Katya Willard
2个回答

2
在OSX上安装Python easy_install的方法如下:

curl -O http://python-distribute.org/distribute_setup.py

sudo python distribute_setup.py

sudo rm distribute_setup.py

sudo easy_install pip

安装完python easy_install包后,您可以运行以下命令:
    easy_install beautifulsoup4

这将允许您在Python脚本中使用beautifulsoup4库:
    from bs4 import BeautifulSoup

从那里开始,您将可以访问BeautifulSoup方法,并且我假设您可以从那里开始。例如:

    soup=BeautifulSoup(urlContent)

2
这是非常过时的信息。不要告诉人们安装distribute而不是setuptools。也不要告诉他们使用easy_install而不是pip - abarnert
我也刚意识到你让他安装这个到他的系统 Python 2.7 中,但是(a)它已经有了 easy_install,并且(b)这不会帮助他在 Python 3.4 中使用 bs4。 - abarnert

1
如果您正在使用Python 3.4,您应该已经安装了pip或者pip自动引导程序,名称为pip3。所以您只需要执行以下操作:
$ pip3 install beautifulsoup4

当然,适当添加sudo

如果你不知道如何使用pip,你应该先获取它。在打包用户指南中,工具推荐是你应该查找最新说明的第一个地方,但它只会链接到pip文档,告诉你执行以下操作:

  • 下载get-pip.py
  • 使用python3 get-pip.py进行安装(如果需要,再加上sudo

pip 是一个 Unix 命令行程序,不是 Python 命令。所以,如果你对像 Mac OS X 这样的 Unix 系统一无所知,这里是你需要做的:

首先,启动 Terminal.app,可以通过 Spotlight(按下 Cmd+Space 并开始输入 Terminal.app,当完整名称出现时,按 Return 键)或通过 Finder(从侧栏打开应用程序,然后打开实用工具,然后就能找到 Terminal.app)。

现在你将得到一个运行 bash shell 的文本窗口。就像 Python 提示你使用 >>> 来输入下一个命令一样,bash 会提示你使用 $ 或者类似于 My Computer:/Users/me$ 的东西来输入下一个命令。因此,在提示符后面,你要输入 pip3 install beautifulsoup4。如果它可以正常工作,则完成了安装 bs4,因此下次运行 Python 3.4(无论是通过 IDLE、使用 python3 命令行还是其他任何方式),都可以导入它。

如果你遇到关于“权限被拒绝”的错误,你需要使用sudo来管理你的Python。你知道GUI程序(如系统偏好设置)有时会弹出一个对话框,要求你输入用户名和密码以获得管理员权限吗?sudo就是从命令行执行这个操作的方式。你可以输入sudo pip3 install beautifulsoup4,然后它会要求你输入密码。在你输入密码之后,一切都应该正常工作。
如果这听起来太麻烦了,你可能想考虑获取一个比IDLE更强大的Python IDE(集成开发环境)。我没有尝试过所有的IDE(Stack Overflow不是寻找建议的好地方,但你可以通过谷歌搜索),但我知道至少其中一些具有一个漂亮的图形界面来管理你安装的软件包,这样你就不必使用命令行和pip了。PyCharm和PyDev(Eclipse的一部分)似乎很受欢迎。然而,你真的应该考虑在某个时候完成使用Mac作为Unix系统的基本教程;即使是编写简单的Python脚本也需要许多概念。

* 略微简化 PEP 394,当您在同一系统上同时拥有2.x和3.x版本时(这是您的情况——苹果为您预装了2.7,而您安装了3.4),您需要使用python3pip3等来运行3.x版本。

** 如果您不了解基本的Unix管理知识,如何知道是否需要使用sudo?如果您通过Homebrew安装Python 3.x,则不需要。通过MacPorts或Fink安装,则需要。通过Python.org二进制安装程序或第三方二进制安装程序安装,则取决于您在安装时选择的设置,这些设置您将不记得... 因此,只需尝试不使用sudo;如果可以使用,则无需为pip使用sudo,但如果出现权限错误,请再次尝试使用sudo,如果可以使用,则需要为pip使用sudo


我觉得我比以前更困惑了!我从python.org下载了适用于Mac OSX 10.6或更高版本的Python 3.4.1。我打开编辑器,它显示Python 3.4.1 shell。当我输入$ pip3 install bs4时,我收到"$"符号的"无效语法"错误提示。我不知道sudo是什么。有人能像对待一个五岁孩子一样跟我讲解吗?我真的很困惑! - Katya Willard
@DazedandConfused:好的,让我稍微编辑一下问题,并尝试向一个5岁的孩子(或者是从1988年穿越虫洞来到现代Mac系统的经典Mac用户,他们在现代Mac系统上也会遇到同样的问题...这并不是你愚蠢或其他什么,只是因为你没有Unix经验,这是可以理解的)解释一下。 - abarnert
谢谢,它运行了一个程序或其他什么东西,并给了我消息“成功安装bs4”。这更有意义了。非常感谢您抽出时间将所有内容写出来,我非常感激!你太棒了。 - Katya Willard
@DazedandConfused:只需启动Python并使用“import”语句,或在程序顶部执行相同操作。我记不清是“import bs4”还是“import beautifulsoup”,或者是“import beautifulsoup4”,而且我现在没有电脑,但这三个中的一个。 - abarnert

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接