NLTK数据下载错误:[Errno 11004] getaddrinfo失败。

3
我已经安装了NLTK模块,但是当我尝试安装数据时,出现了下面的错误。
>>>import nltk
>>> nltk.download('punkt')
[nltk_data] Error loading punkt: <urlopen error [Errno 11004]
[nltk_data]     getaddrinfo failed>
False

我该如何安装数据?


1
只需键入“nltk.download()”,然后找到您想要的包。错误消息让我认为该包不叫“punkt”,我相信情况是这样的。它被称为其他东西。 - Slater Victoroff
1
有很多有用的提示可以解决问题,链接如下:https://dev59.com/c4vda4cB1Zd3GeqPgPEg - sophros
尝试运行nltk.download()时出现错误11004 - getaddrinfo失败。 - shan
这似乎是DNS问题。您能否检查设置中的HTTP代理是否存在,或者暂时更改它以下载数据? - sophros
https://dev59.com/zGs05IYBdhLWcg3wR_63 - alvas
4个回答

1
我知道这是一个很老的问题,但我想分享一下我的经验,给将来可能遇到这种情况的人。 我所做的是(在Windows 10中)-
  1. 打开命令提示符。
  2. 使用以下命令设置代理:
    set HTTP_PROXY=http://userid:password@proxyurl:port
    set HTTPS_PROXY=http://userid:password@proxyurl:port
    set FTP_PROXY=http://userid:password@proxyurl:port
    
  3. 运行以下命令:
    python -m nltk.downloader
    

1
问题可能是系统中设置的代理的问题。
>>import nltk
>>nltk.download()

使用:

>>nltk.set_proxy('SYSTEM PROXY')
>>nltk.download()

这应该解决问题。要找到系统的代理:在Windows的开始选项中搜索代理。

1

过去的几天里,我一直在为这个错误苦苦挣扎。 这段小代码帮助我解决了错误:

from nltk.corpus import stopwords

0
import socket

socket.getaddrinfo( 'localhost', 8080)

import nltk

nltk.download('all')

3
回答需要支持信息 您的回答可以通过提供更多的支持信息来改进。请[编辑]以添加进一步的细节,例如引用或文档,以便他人可以确认您的回答是否正确。您可以在帮助中心找到关于如何撰写良好回答的更多信息。 - moken
感谢您为Stack Overflow社区做出的贡献。这可能是一个正确的答案,但如果您能提供代码的额外解释,让开发人员能够理解您的推理过程,那将非常有用。对于不太熟悉语法或难以理解概念的新开发人员来说,这尤其有帮助。您是否可以编辑您的答案,以包含更多细节,造福社区? - Jeremy Caney

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接