133得票6回答
苹果如何在电子邮件中查找日期、时间和地址?

在iOS邮件客户端中,当电子邮件包含日期、时间或位置时,文本将变成超链接,只需点击链接即可创建约会或查看地图。这不仅适用于英语邮件,也适用于其他语言。我喜欢这个功能,想了解他们是如何实现的。 一种朴素的方法是使用许多正则表达式并运行它们全部。但是,这种方法不会很好地扩展,并且仅适用于特定的语...

58得票6回答
BILOU标记在命名实体识别中是什么意思?

标题基本上概括了问题。我注意到在一些论文中,人们提到了BILOU编码方案,用于命名实体识别,而不是常见的BIO标记方案(例如Ratinov和Roth在2009年的这篇论文http://cogcomp.cs.illinois.edu/page/publication_view/199)。 从处...

50得票6回答
使用自定义数据的NLTK命名实体识别

我正在尝试使用NLTK从我的文本中提取命名实体。 我发现NLTK NER对我的目的来说不太准确,我还想添加一些自己的标签。 我一直在试图找到一种训练自己的NER的方法,但似乎找不到正确的资源。 我可以使用自己的数据来训练NLTK中的命名实体识别器吗? 如果可以使用自己的数据进行训练,那么n...

28得票3回答
斯坦福命名实体识别(NER)系统是否可以被训练来识别更多类型的命名实体?

我现在正在使用一些自然语言处理库,包括Stanford和nltk。我看了Stanford的演示部分,但我想问一下是否有可能使用它识别更多类型的实体。 目前,Stanford NER系统(如演示所示)可以将实体识别为人(姓名)、组织或位置。但识别的组织仅限于大学或某些大型组织。我想知道是否可以...

27得票6回答
使用NLTK中的Stanford NER标注器提取人员和组织机构列表

我正在尝试使用Python NLTK中的Stanford命名实体识别器(NER)提取人物和组织列表。 当我运行时: 代码 from nltk.tag.stanford import NERTagger st = NERTagger('/usr/share/stanford-ner/class...

27得票4回答
Java的命名实体识别库

我正在寻找一个简单但足够好用的 Java 实体识别库(和字典),我想处理电子邮件和文档,并提取一些“基本信息”,比如:姓名、地点、地址和日期。 我已经看了很多,大部分都比较重量级,是完整的自然语言处理项目。 有什么推荐吗?

27得票3回答
NLTK用于命名实体识别

我正在尝试使用NLTK工具包从文本消息中提取地点、日期和时间信息。我刚刚在我的电脑上安装了该工具包,并编写了以下代码来进行测试:sentence = "Let's meet tomorrow at 9 pm"; tokens = nltk.word_tokenize(sentence) pos...

25得票7回答
NLTK命名实体识别转换为Python列表

我使用NLTK的ne_chunk从文本中提取命名实体:my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, t...

23得票3回答
使用斯坦福NLP训练n-gram NER

最近,我一直在尝试使用斯坦福核心NLP训练n-gram实体。我已经按照以下教程操作 - http://nlp.stanford.edu/software/crf-faq.shtml#b 在此基础上,我只能指定单个标记及其所属的类别。请问有没有人能够指导我如何将其扩展为n-gram。我正在尝试...

22得票6回答
命名实体识别算法

我希望使用命名实体识别(NER)来为数据库中的文本找到合适的标记。 我知道有一篇关于此主题的维基百科文章以及许多其他描述NER的页面,但我更喜欢从你这里听到有关此主题的信息: 您对不同算法有什么经验? 您推荐哪个算法? 哪种算法最容易实现(PHP/Python)? 这些算法是如何工作的?...