无法下载Framenet_v15的nltk数据

5
我正在尝试下载nltk的所有数据包。但是在尝试下载framenet_v15时,它总是失败。它只是停在那里。我已经从同一台机器尝试了多次。每次都几乎等待了30分钟,有一次等了一个多小时。尝试将源服务器替换为Google SVN,但下载程序出现错误。不幸的是,我没有任何其他信息。有没有办法找出问题所在?或者是否有其他来源可以下载nltk数据?谢谢。
编辑:
最终使用wget -c下载完成,需要多次重试才能完成下载。
一些观察结果:
1.下载一定数量的数据后,连接会冻结。无法通过ping访问服务器。 2.可下载的数据共享在同一服务器上,该服务器托管nltk.org。 3.每当下载冻结时,该站点也不可用(不是nltk.org),但对于未启用缓存的其他站点仍可用。显然服务器无法提供服务。 4.可能存在资源泄漏,这在此下载中表现出来。 5.可能会有进程重启,在大约2分钟后使服务器可用。 6.为什么大型下载不使用种子?这只是下载的另一种选择。

你已经等了多久了?你尝试过多次或从另一台机器尝试吗? - Spaceghost
试一下下面的链接,对我有用。 - e h
下载仍然失败,随机卡在某个大小上。只是好奇,你在下载时有非常高速的连接吗? - Biswanath
你好,不是的。但是在运行nltk.download()时,我尝试了几次才成功。然而,下面的直接链接每次都有效。你可以尝试直接从Frame Net项目请求数据(我会在我的答案下面添加链接)。 - e h
@emh,当我在处理下载时发生了这种情况。也许还有其他原因。顺便说一下,不仅是framenet数据,而且其他一些大文件也有同样的问题。 - Biswanath
显示剩余2条评论
4个回答

3

我尝试通过下载

import nltk

nltk.download('all')

而且它对我很有效


3

编辑:这里是直接链接,您可以从Frame Net项目请求数据:https://framenet.icsi.berkeley.edu/fndrupal/framenet_request_data

当我下载NLTK数据时,我不得不多次运行下载程序,因为它经常卡住。

或者,这里有一个单独文件的列表:http://nltk.org/nltk_data/

我刚刚从这个链接下载了framenet_v15:http://nltk.github.com/nltk_data/packages/corpora/framenet_v15.zip

此外,查看这个问题以获取更多讨论:安装自然语言工具包数据


您提供的链接重定向到nltk.org页面。因此,在某种程度上,这不再是替代选择了吗?您是否有其他可以下载数据的备选来源? - Biswanath

0

顺便说一下,我也遇到了与framenet v15相同的问题。重新启动nltk.download()并仅从语料库中下载framenet包似乎对我有用。在我拥有它之后,我能够完成从收藏选项卡下载其他所有内容。


0

假设您正在使用Unix,因为使用了wget,我建议为您想要的NLTK数据包(即framenet)创建一个软件包。

我最近为类似的原因创建了{{link1:nltk-data-punkt.spec}},它可以用作其他数据包的示例。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接