确定一个单词是否为名词

Question

确定一个单词是否为名词

pythonnlpstanford-nlp

9

给定一个单词，我希望确定它是否为名词（例如在歧义情况下，如“cook”可以是名词或动词，该单词必须被确定为名词）。

实际上，我使用 Stanford Parser 的 POS 标签器（以单个单词作为输入，仅从结果中提取 POS 标签）。结果相当不错，但处理时间非常长。

有没有一种方法（请使用 Python :）来比我现在执行此任务更快？

- permanganate

1

斯坦福解析器在输入上执行了许多其他操作（依赖关系分析，组成结构分析等），这在这里是浪费时间。此外，对于我想要做的事情来说，词性标注是否有点过于强大了（通常词性标注是在整个句子而不是单个单词上执行的）？ - permanganate

3个回答

1

我无法代表Python封装程序发言，但如果您使用斯坦福的POS标记器而不是解析器，速度应该更快。有Stanford CoreNLP的封装程序，其中包括标记器：https://pypi.python.org/pypi/corenlp-python; 或者，看起来nltk也有一个斯坦福标记器模块 http://www.nltk.org/_modules/nltk/tag/stanford.html。

如果您将单个单词嵌入玩具句子中，还可以获得更好的结果。这样做类似于“X是一件事情”。根据句子的不同，这可能会导致你更倾向于或远离猜测名词。

- Gabor Angeli

0

如果您正在检查单词，我会推荐使用Wordnet。我还使用了免费提供的TreeTagger：http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ 二进制运行速度非常快，并支持多种语言。如果您需要一个纯Python解决方案，请检查Brill标记器的NLTK实现：http://www.nltk.org/_modules/nltk/tag/brill.html

- Josep Valls

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Alex Riley · Accepted Answer

如果您只是想检查一个单词是否可以用作名词，最快的方法可能是构建一个包含所有名词的集合，然后仅检查该单词是否属于该集合。要获取所有名词的列表，您可以使用WordNet语料库（例如可以通过NLTK进行访问）：

>>> from nltk.corpus import wordnet as wn
>>> nouns = {x.name().split('.', 1)[0] for x in wn.all_synsets('n')}
>>> "cook" in nouns
True
>>> "and" in nouns
False