52得票5回答
什么是POS标记和浅层解析之间的区别?

我目前正在大学学习自然语言处理课程,对一些基本概念仍感到困惑。从统计自然语言处理基础这本书中得到了POS标注的定义: “标注是将句子中的每个单词标记(或标注)为其适当的词性。我们决定每个单词是名词、动词、形容词还是其他。” 但是,由于该书也将浅层分析描述为POS标注的一种实用工具,因此我无...

36得票3回答
Python NLTK pos_tag无法返回正确的词性标签

拥有这个: text = word_tokenize("The quick brown fox jumps over the lazy dog") 并运行: nltk.pos_tag(text) 我理解为: [('The', 'DT'), ('quick', 'NN'), ('b...

33得票4回答
NLTK中的NN VBD IN DT NNS RB是什么意思?

当我对文本进行分块时,输出结果中会出现许多类似于NN、VBD、IN、DT、NNS、RB的代码。请问是否有一份列表可以告诉我这些代码的含义?我已经尝试了在谷歌上搜索nltk chunk code、nltk chunk grammar和nltk chunk tokens,但是没有找到任何解释这些代...

32得票7回答
NLTK POS标注器要我下载什么?

我刚开始使用词性标注器,遇到了很多问题。 我使用以下内容开始进行词性标注:import nltk text=nltk.word_tokenize("We are going out.Just you and me.") 当我想要打印'text'时,会发生以下情况:print nltk.pos...

18得票3回答
如何在Java中使用OpenNLP?

我想要对一句英文进行词性标注并进行一些处理。我希望使用openNLP。我已经安装了它。 当我执行以下命令时:I:\Workshop\Programming\nlp\opennlp-tools-1.5.0-bin\opennlp-tools-1.5.0>java -jar opennlp...

16得票6回答
spaCy标记.tag_完整列表

以下是 spaCy 中 token.tag_ 的官方文档: 一个精细的、更详细的标签,代表了单词类别和一些基本的形态学信息。这些标签主要设计用于后续的模型特征,特别是句法分析器。它们是与语言和树库有关的。标注器被训练来预测这些精细的标签,然后使用映射表将它们缩减为粗略的.pos标签。 但它...

16得票6回答
现有的C++自然语言处理API是什么?

是否存在现成的C++ NLP API?我找到的最接近的是CLucene,这是Lucene的一个移植版本。但是,它似乎有点过时,文档也远远不完整。 理想情况下,这些API将允许进行标记化、词干提取和词性标注。

15得票3回答
如何高效地将pos_tag_sents()应用于pandas数据框?

在需要对保存在pandas数据框中以每行1个句子的形式存储的文本列进行POS标记的情况下,大多数SO上的实现使用apply方法。dfData['POSTags']= dfData['SourceText'].apply( lamda row: [pos_tag...

14得票2回答
NLTK无法找到stanford-postagger.jar!请设置CLASSPATH环境变量。

我正在进行一个项目,需要使用nltk和python对令牌进行标记。 所以我想使用这个。 但是遇到了一些问题。 我查阅了很多其他已经提出的问题和其他论坛,但我仍然无法解决这个问题。 问题是当我尝试执行以下操作时: from nltk.tag import StanfordPOSTagger...

14得票3回答
多语言 NLTK 用于词性标注和词形还原。

最近我接触了自然语言处理(NLP),并尝试使用NLTK和TextBlob分析文本。我想开发一个应用程序,分析旅行者的评论,因此我需要处理许多不同语言的文本。我需要进行两个主要操作:POS标注和词形还原。我看到在NLTK中有可能选择正确的语言对句子进行分词,如下所示: tokenizer = ...