8得票1回答
荷兰语中的NLTK命名实体识别

我正在尝试从荷兰语文本中提取命名实体。我使用nltk-trainer在conll2002荷兰语语料库上训练了标记器和块分析器。然而,块分析器的解析方法未能检测到任何命名实体。以下是我的代码: str = 'Christiane heeft een lam.' tagger = nltk.d...

9得票1回答
SpaCy:如何向预训练模型添加自定义命名实体识别标签?

我对SpaCy和NLP都很新。 我正在使用SpaCy v3.1和Python 3.9.7 64位。 我的目标:使用预训练的SpaCy模型(en_core_web_sm)并添加一组自定义标签到现有的NER标签(GPE,PERSON,MONEY等),以便该模型可以识别默认的和自定义的实体。 我...

8得票1回答
在文本分类中作为特征的命名实体?

通过现有的文本分类(监督学习)技术,为什么我们不把文本中的命名实体(NE)作为训练和测试的特征?您认为使用NE作为特征可以提高精度吗?

8得票2回答
如何最佳地将一个大字符串中的子字符串与一个庞大的关键字列表匹配?

假设您有数百万条记录,每个记录包含平均2000个单词的文本,并且您还有另一个包含约10万个项目的列表。 例如:在关键字列表中,您有一个类似“总统奥巴马”的项目,在其中一个文本记录中,您有这样的内容:“.....总统奥巴马....”,因此我想在文本中查找此关键字并将其替换为像这样的内容:“.....

9得票1回答
日期的命名实体提取

我对NER、抽取和编程一窍不通。我正在尝试找出一种方法,可以提取某些文档的截止日期和开始日期。是否有这样的方法?有没有一个起点?我一直在寻找,但遇到的问题都是一样的。可以提取日期,但无法确定日期是截止还是过期。如果只有一个日期,它是过期还是截止。像这样的东西。任何帮助将不胜感激。 示例: ...

11得票4回答
从NLTK格式中分块Stanford命名实体识别器(NER)的输出

我正在使用NLTK中的命名实体识别(NER)来在句子中找到人物、地点和组织。我能够产生如下结果:[(u'Remaking', u'O'), (u'The', u'O'), (u'Republican', u'ORGANIZATION'), (u'Party', u'ORGANIZATION')...

21得票4回答
如何使用示例解决Spacy3.0中nlp.update问题

我正在尝试使用Spacy v3.0训练我的数据,但显然nlp.update不接受任何元组。这是我的一段代码:import spacy import random import json nlp = spacy.blank("en") ner = nlp.create_pip...

19得票8回答
斯坦福命名实体识别器中的多术语命名实体

我正在使用斯坦福命名实体识别器http://nlp.stanford.edu/software/CRF-NER.shtml,它工作得很好。这是。 List<List<CoreLabel>> out = classifier.classify(text); ...

25得票7回答
NLTK命名实体识别转换为Python列表

我使用NLTK的ne_chunk从文本中提取命名实体:my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, t...

7得票1回答
GATE在自然语言处理中有多好?

我正在尝试构建一个自然语言处理应用程序,主要涉及命名实体识别(NER)。我发现了GATE。据我所知,它是构建NLP应用程序的框架。我测试了GATE附带的IE系统ANNIE,但我的领域的NER结果不符合期望。事实上,任何NER,如Stanford CoreNLP或NLTK,都没有给我所需的结果。...