在iOS邮件客户端中,当电子邮件包含日期、时间或位置时,文本将变成超链接,只需点击链接即可创建约会或查看地图。这不仅适用于英语邮件,也适用于其他语言。我喜欢这个功能,想了解他们是如何实现的。 一种朴素的方法是使用许多正则表达式并运行它们全部。但是,这种方法不会很好地扩展,并且仅适用于特定的语...
标题基本上概括了问题。我注意到在一些论文中,人们提到了BILOU编码方案,用于命名实体识别,而不是常见的BIO标记方案(例如Ratinov和Roth在2009年的这篇论文http://cogcomp.cs.illinois.edu/page/publication_view/199)。 从处...
我正在尝试使用NLTK从我的文本中提取命名实体。 我发现NLTK NER对我的目的来说不太准确,我还想添加一些自己的标签。 我一直在试图找到一种训练自己的NER的方法,但似乎找不到正确的资源。 我可以使用自己的数据来训练NLTK中的命名实体识别器吗? 如果可以使用自己的数据进行训练,那么n...
我现在正在使用一些自然语言处理库,包括Stanford和nltk。我看了Stanford的演示部分,但我想问一下是否有可能使用它识别更多类型的实体。 目前,Stanford NER系统(如演示所示)可以将实体识别为人(姓名)、组织或位置。但识别的组织仅限于大学或某些大型组织。我想知道是否可以...
我正在尝试使用Python NLTK中的Stanford命名实体识别器(NER)提取人物和组织列表。 当我运行时: 代码 from nltk.tag.stanford import NERTagger st = NERTagger('/usr/share/stanford-ner/class...
我正在寻找一个简单但足够好用的 Java 实体识别库(和字典),我想处理电子邮件和文档,并提取一些“基本信息”,比如:姓名、地点、地址和日期。 我已经看了很多,大部分都比较重量级,是完整的自然语言处理项目。 有什么推荐吗?
我正在尝试使用NLTK工具包从文本消息中提取地点、日期和时间信息。我刚刚在我的电脑上安装了该工具包,并编写了以下代码来进行测试:sentence = "Let's meet tomorrow at 9 pm"; tokens = nltk.word_tokenize(sentence) pos...
我使用NLTK的ne_chunk从文本中提取命名实体:my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, t...
最近,我一直在尝试使用斯坦福核心NLP训练n-gram实体。我已经按照以下教程操作 - http://nlp.stanford.edu/software/crf-faq.shtml#b 在此基础上,我只能指定单个标记及其所属的类别。请问有没有人能够指导我如何将其扩展为n-gram。我正在尝试...