在Heroku上找不到资源'corpora/wordnet'

26

我正在尝试在Heroku上使用NLTK和wordnet。我已经完成了

heroku run python
nltk.download()
  wordnet
pip install -r requirements.txt

但是我得到了这个错误:

Resource 'corpora/wordnet' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - '/app/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'

不过,我查看了/app/nltk_data目录,并且它确实存在,所以我不确定发生了什么事情。


https://devcenter.heroku.com/articles/python-nltk - Kenneth Reitz
15个回答

0

当我尝试使用词形还原器代码lemmatizer.lemmatize('goes')时,我也遇到了问题,实际上是因为他们没有下载相关的软件包。 因此,请尝试使用以下代码下载它们,这可能可以解决与此相关的许多问题。

nltk.download('wordnet') nltk.download('omw-1.4')

谢谢。


目前你的回答不够清晰,请编辑并添加更多细节,以帮助其他人理解它如何回答问题。你可以在帮助中心找到有关如何撰写好答案的更多信息。 - Community

0

在 Mac 上:

我仍然需要下载 omw-1.4 数据。代码是从一个 Python 文件运行的,nltk_data/ 目录与 Python 文件在同一目录下。

nltk.download('wordnet', "nltk_data/")

nltk.download('omw-1.4', "nltk_data/")

nltk.data.path.append('nltk_data/')


0

我遇到了同样的错误。这个Fred Foo提供的解决方法帮助我解决了问题。以下方法适用于我:

# 1) execute the below written code 
# 2) a NLTK Download window will open
# 3) select "Corpora" tab and scroll down until "wordnet"
# 4) doubleclick to install

nltk.download()
from nltk.corpus import wordnet

在NLTK中导入WordNet


0

你的回答可以通过提供更多支持性信息来改进。请编辑以添加进一步的细节,例如引用或文档,以便他人能够确认你的回答是否正确。你可以在帮助中心找到关于如何撰写好回答的更多信息。 - Community

0

在我的情况下运行后

import nltk
nltk.download('wordnet')

它没有起作用。问题在于wordnet.zip无法自行解压缩,所以只需进入python3 -m textblob.download_corpora这个命令安装包并解压文件夹的文件夹即可。

cd ~
cd nltk_data/corpora/
unzip wordnet.zip

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接