23得票3回答
使用斯坦福NLP训练n-gram NER

最近,我一直在尝试使用斯坦福核心NLP训练n-gram实体。我已经按照以下教程操作 - http://nlp.stanford.edu/software/crf-faq.shtml#b 在此基础上,我只能指定单个标记及其所属的类别。请问有没有人能够指导我如何将其扩展为n-gram。我正在尝试...

20得票2回答
如何使用DBPedia从内容中提取标签/关键词?

我正在探索如何使用维基百科的分类信息从我的内容中提取标签/关键词。 我发现了有关DBPedia的文章。DBpedia是从维基百科中提取结构化信息并使其在Web上可用的社区努力。 是否有人使用过他们的 Web 服务?你知道它们是如何工作的,以及它们有多可靠吗?

13得票6回答
基于Java的模板,提取网页信息

目前我使用Jsoup从某些第三方网页中提取特定信息(而非所有文本),我会定期执行此操作。这一方法在某些网页HTML发生变化之前是有效的,但当网页HTML发生变化时,现有的Java代码也需要进行更改,这是一项繁琐的任务,因为这些网页经常发生变化。此外,需要一个程序员来修复Java代码。以下是我感...

13得票1回答
NLTK有哪些实体类型?

我一直在试图找到NLTK实体类型的完整列表。 我只能在这个页面上找到最常见的几种类型,但没有完整的列表。请问您能否分享NLTK拥有的命名实体类型的完整列表?

10得票3回答
从文本中提取位置的方法?

有哪些推荐的从自由文本中提取位置信息的方法? 我可以考虑使用正则表达式规则,例如“在地点的单词……”。但是除此之外还有更好的方法吗? 另外,我可以考虑使用查找哈希表来获取国家和城市的名称,然后将从文本中提取的每个标记与哈希表的内容进行比较。 是否有人知道更好的方法? 编辑:我正在尝试从...

9得票1回答
命名实体识别和命名实体解析的区别是什么?

命名实体识别和命名实体解析有什么区别?能否给出一个实际例子?

8得票4回答
实体提取网络服务

有没有付费或免费的命名实体识别网络服务可用? 基本上,我正在寻找一种东西 - 如果我传递这样的文本: “John在汉堡王吃了薯条” 它应该被识别 - 大致如下: 人物:约翰 组织机构:汉堡王 我听说过GATE中的Annie-但我不认为它有可用的网络服务。

7得票2回答
如何使用斯坦福核心NLP命名实体识别捕获像5英寸、5"、5 in.、5 in这样的测量值。

我希望使用Stanford CoreNLP来捕获测量值。(如果您可以建议其他提取器,也可以。) 例如,我想找到15kg,15 kg,15.0 kg,15 kilogram,15 lbs,15 pounds等。但在CoreNLP的提取规则中,我没有看到有关测量的规则。 当然,我可以使用纯正则...