用Python的"wget"命令如何覆盖已有文件?

7

我已经在我的Python上安装了wget,并且正在使用它从不同的URL下载文件。到目前为止,我的代码如下:

import wget
urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip', 
        'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip', 
        'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']
path = '/home/david/data/files/zip_files'

for url in urls:
   wget.download(url, path)

我希望我的代码能够在下载的文件已经存在时进行覆盖,这样每次运行代码时都会得到该文件的最新版本,而不是保留旧版本并使用不同名称下载新版本(例如,如果epitope_full_v3.zip已经存在,则执行代码时会重新下载它,但会保留旧版本并将新版本重命名为epitope_full_v3_1.zip)。

我知道wget可以在shell中使用-O参数来实现这一点,但我在Python版本的文档中没有看到这个选项。感谢您的帮助。

1个回答

8

尽管wget没有提到,但您可以自己更改它。使用os.path.basename()获取文件名,并检查其是否存在。像这样:

import wget
import os

urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',
        'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']

path = '/home/david/data/files/zip_files'

for url in urls:
    filename = path + '/' + os.path.basename(url) # get the full path of the file
    if os.path.exists(filename):
        os.remove(filename) # if exist, remove it directly
    wget.download(url, out=filename) # download it to the specific path.

谢谢你的帮助!我稍微修改了一下答案,因为它没有将文件保存到我想要的文件夹中。非常感谢你的帮助,非常感激!:D - David Masnou Sánchez
1
@DavidMasnouSánchez 我在测试我的电脑上时忘记更改了。您也可以直接在 path 变量中添加 / - jizhihaoSAMA
1
如果wget能够在download()函数内提供此功能,那将是很好的 - 现在如果由于某种原因下载失败,您最终既没有旧版本也没有新版本的文件。 - Marijn

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接