如何从nltk下载器中删除数据/模型?

13

我在Python3 NLTK中安装了一些NLTK包(通过nltk.download()),尝试了它们,并且现在不需要它们,想要将它们删除。

例如,如何从我的NLTK安装中删除large_grammars包?(我不想删除完整的NLTK安装!)

1个回答

14

默认情况下,NLTK的包/数据保存在nltk_data目录中。

首先,您需要找到该目录可能在哪里:

>>> import nltk
>>> nltk.data.path
['/home/alvas/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']

检查 nltk_data 的确切位置:

>>> import os
>>> next(p for p in nltk.data.path if os.path.exists(p))
'/home/alvas/nltk_data'
在Linux上,只需在命令行中进入目录:
$ cd /home/alvas/nltk_data/
$ ls
corpora  grammars  tokenizers
$ cd grammars/
$ ls
large_grammars  large_grammars.zip
$ rm -rf large_grammars 
$ rm large_grammars.zip 

在你的代码中,你忘记了导入 os(在检查“确切位置”之前)。成功了!谢谢!(我以为我需要在nltk框架内删除它。) - dia

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接