21得票4回答
如何使用示例解决Spacy3.0中nlp.update问题

我正在尝试使用Spacy v3.0训练我的数据,但显然nlp.update不接受任何元组。这是我的一段代码:import spacy import random import json nlp = spacy.blank("en") ner = nlp.create_pip...

21得票1回答
Spacy如何使用词嵌入进行命名实体识别(NER)?

我正在尝试使用 spaCy 训练一个命名实体识别(NER)模型,以识别位置、人名和机构。我想了解 spaCy 如何识别文本中的实体,但一直没有找到答案。从 Github 上的 这个问题 和 这个示例 来看,似乎 spaCy 使用文本中存在的许多特征,如词性标注、前缀、后缀和其他字符和基于单词的...

20得票6回答
在Python的NLTK中进行命名实体识别。识别命名实体。

我需要将单词分类为它们的词性,例如动词、名词、副词等等。 我使用了 。nltk.word_tokenize() #to identify word in a sentence nltk.pos_tag() #to identify the parts of speech nltk...

20得票2回答
如何获取spaCy NER概率

我想将spaCy的命名实体识别引擎与另一个识别引擎(一个词袋模型)结合起来。我目前正在比较两个引擎的输出,试图找出二者的最佳组合方式。这两个引擎表现都不错,但很多时候spaCy会发现识别引擎漏掉的实体,反之亦然。我想要的是在spaCy找到一个识别引擎未能发现的实体时,能够访问spaCy的概率分...

19得票8回答
斯坦福命名实体识别器中的多术语命名实体

我正在使用斯坦福命名实体识别器http://nlp.stanford.edu/software/CRF-NER.shtml,它工作得很好。这是。 List<List<CoreLabel>> out = classifier.classify(text); ...

17得票1回答
如何在OpenNLP中创建一个优秀的命名实体识别训练模型?

我刚开始学习OpenNLP。我需要创建一个简单的训练模型来识别名称实体。 在这里阅读文档https://opennlp.apache.org/docs/1.8.0/apidocs/opennlp-tools/opennlp/tools/namefind,我看到了这个简单的训练文本:<S...

16得票1回答
如何在Spacy中创建多个模型的NER管道

我正在尝试为Spacy NER训练新实体。我尝试将我的新实体添加到现有的Spacy 'en'模型中。然而,这影响了' en '和我的新实体的预测模型。 因此,我创建了一个空白模型并进行了实体识别训练。这很有效,但只能预测我训练过的实体,不能进行常规的Spacy实体识别。 比如说,我将'hor...

16得票1回答
理解Spacy的得分器输出

我正在评估使用Spacy构建的自定义命名实体识别模型,并使用Spacy的Scorer类对训练集进行评估。 def Eval(examples): # test the saved model print("Loading from", './model6/') n...

15得票2回答
使用CoreNLP提取多词命名实体

我正在使用 CoreNLP 进行命名实体提取,但遇到了一些问题。 问题是,每当一个命名实体由多个标记组成时,例如“Han Solo”,该注释程序不会将“Han Solo”作为单个命名实体返回,而是作为两个单独的实体“Han”和“Solo”返回。 是否可能将命名实体作为一个标记获取? 我知道...

15得票1回答
自然语言处理:地名词典是作弊吗?

在自然语言处理中,有一个叫做“Gazetteer”的概念,它可以非常有用地创建注释。就我所理解的而言, Gazetteer由一组包含实体名称的列表组成,例如城市、组织机构、一周中的某些天等。这些列表被用于查找文本中这些名称的出现,例如用于命名实体识别任务。 因此,它本质上是一种查找。这难道...