9得票1回答
使用自然语言处理进行地址分割

我目前正在开发一个项目,旨在识别地址中的每个部分。例如从“str. Jack London 121, Corvallis, ARAD, ap. 1603, 973130” 中提取的输出应该如下所示: street name: Jack London; no: 121; city: Corv...

9得票1回答
SpaCy:如何向预训练模型添加自定义命名实体识别标签?

我对SpaCy和NLP都很新。 我正在使用SpaCy v3.1和Python 3.9.7 64位。 我的目标:使用预训练的SpaCy模型(en_core_web_sm)并添加一组自定义标签到现有的NER标签(GPE,PERSON,MONEY等),以便该模型可以识别默认的和自定义的实体。 我...

9得票3回答
自由标注语料库用于命名实体识别

我正在寻找一个免费的标注语料库,用于训练命名实体识别系统。我发现大部分语料库(如纽约时报)都很昂贵且不开放。有人能提供帮助吗?

9得票2回答
使用条件随机场进行命名实体识别

什么是“条件随机场”?在结构化或非结构化文本中,它如何准确地将适当的名称识别为人、组织或地点?以这个例子为例:This product is ordered by StackOverFlow Inc.。条件随机场如何识别StackOverFlow Inc.作为一个组织?

9得票2回答
文本内容地理标注的方法

有哪些好的算法可以自动标记文本的城市/地区来源?也就是说,如果一篇博客是关于纽约的,如何以编程方式判断。是否有声称可以在某种程度上做到这一点的软件包/论文? 我已经研究了一些基于tfidf的方法、专有名词交集,但迄今为止,没有惊人的成功,我希望得到一些思路! 更一般的问题是,在给定某些主题...

9得票1回答
日期的命名实体提取

我对NER、抽取和编程一窍不通。我正在尝试找出一种方法,可以提取某些文档的截止日期和开始日期。是否有这样的方法?有没有一个起点?我一直在寻找,但遇到的问题都是一样的。可以提取日期,但无法确定日期是截止还是过期。如果只有一个日期,它是过期还是截止。像这样的东西。任何帮助将不胜感激。 示例: ...

9得票2回答
从spaCy模型中返回所有可能的实体类型?

有没有一种方法能够从spaCy模型中提取所有可能的命名实体类型?你可以通过在示例文本上运行来手动计算,但我想这里应该有一种更加程序化的方法吧? 例如: import spacy model=spacy.load("en_core_web_sm") model.*returns_entity_...

9得票2回答
在Spacy中检测日期

有没有一种基于规则的系统,可以从合同文本中捕捉像开始/结束日期这样的事物呢?以下是几个真实的例子。我会将想要Spacy自动检测的日期实体加粗。如果你有其他不同于Spacy的想法也可以! 本租赁协议的初始期限为五(5)年,始于2012年2月1日(“租赁起始日期”),到2017年1月31日到期...

9得票1回答
命名实体识别和命名实体解析的区别是什么?

命名实体识别和命名实体解析有什么区别?能否给出一个实际例子?

9得票1回答
使用NLTK实现的斯坦福命名实体识别器(NER)功能

这个可能吗:只用NLTK就能获得(类似于)斯坦福命名实体识别器的功能吗? 有没有示例呢? 特别是,我对文本中位置部分的提取非常感兴趣。例如,从文本中: The meeting will be held at 22 West Westin st., South Carolina, 123...