从网址下载一个完整文件夹的文件

4
我正在使用Python3编写程序/脚本。我知道如何从URL下载单个文件,但我需要下载整个文件夹,解压缩文件并合并文本文件。
请问有没有可能使用Python将上述链接中的所有文件下载到计算机上的新文件夹中?我已经使用urllib来下载单个文件,能否提供一个示例,说明如何从上述链接下载整个文件夹?

1
你应该将BeautifulSoup和urllib结合起来,然后尝试。 - bhansa
1个回答

6

安装bs4和requests,然后您可以使用如下代码:

import bs4
import requests

url = "http://bossa.pl/pub/metastock/ofe/sesjaofe/"
r = requests.get(url)
data = bs4.BeautifulSoup(r.text, "html.parser")
for l in data.find_all("a"):
    r = requests.get(url + l["href"])
    print(r.status_code)

然后,您需要将请求的数据保存到您的目录中。


1
我该如何将这些数据(从URL中的所有文件)保存到我的计算机文件夹中?现在,使用此代码运行程序会在终端中显示“404”和“200”。 - user5490674
2
这些是请求的响应代码。200表示成功,404表示失败。在for循环内部,您有变量lrl [“href”]是文件名,r.content是文件的二进制内容。查看请求文档以获取更多帮助。 - MegaIng
2
你能分享一下你使用的方法吗?主要问题仍未得到回答。 - Melih Durmaz
@MelihDurmaz,你说的“what method”是什么意思? - MegaIng

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接