尝试下载nltk数据时出现405错误

11

当我尝试以下代码时

python -c "import nltk; nltk.download('punkt'); 
nltk.download('averaged_perceptron_tagger'); 
nltk.download('maxent_treebank_pos_tagger'); 
nltk.download('wordnet')"

控制台显示

[nltk_data] Error loading punkt: HTTP Error 405: Not allowed.
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.

好像下载服务器挂了。 - Klaus D.
我在这里也遇到了同样的问题,所以你并不孤单。 - Kyle Campbell
相同的问题。我猜我们应该等待。 - Julien Salinas
这是由于Github原始文件链接的故障引起的。请稍等,我们会找到一个替代方案 =) - alvas
1
我们在OpenDaylight的CI基础设施中看到了这一点。https://lists.opendaylight.org/pipermail/dev/2017-July/003971.html - dfarrell07
2个回答

11

这是由于Github原始文件链接的降级引起的。

与此同时,一个权宜之计的解决方案是手动下载该文件:

PATH_TO_NLTK_DATA=/home/username/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA

我们正在努力寻找替代数据和模型下载的方法。

同时,@everyone请检查您的脚本并确保您没有过度加载数据下载! 预先感谢您的帮助!!

请查看https://github.com/nltk/nltk/issues/1787获取此问题的最新更新。


1
这里提到的解决方案对我有效。 - Koen Dercksen

0

对于MacOSX - 对上面答案的小修改:

PATH_TO_NLTK_DATA=~/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA

请注意,这是一个大文件下载(约700MB)。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接