15得票3回答
OpenNLP与Stanford CoreNLP比较

我正在比较这两个软件包,但不确定应该选择哪一个。我需要的功能如下: 命名实体识别(人物、地点、组织等)。 性别识别。 良好的训练API。 从我所看到的情况来看,OpenNLP和Stanford CoreNLP的功能相似。然而,Stanford CoreNLP似乎活跃度更高,而OpenN...

13得票3回答
使用斯坦福类型解析器从文本文件中提取名词短语

我有一段文本,想从中提取名词短语。我可以轻松地获得适用于我的文本的类型分析器,但不知道如何提取其中的名词短语?

13得票3回答
如何使用Open nlp的chunking解析器提取名词短语

我是自然语言处理的新手。我需要从文本中提取名词短语。到目前为止,我已经使用OpenNLP的分块解析器来解析我的文本以获取树形结构。但我无法从树形结构中提取名词短语,是否有任何在OpenNLP中的正则表达式模式可以用来提取名词短语。 以下是我正在使用的代码 InputStream is ...

13得票2回答
使用OpenNLP有没有一种方法可以获取句子的主语?

有没有一种方法可以使用OpenNLP获取句子的主题?我正在尝试识别用户语句的最重要部分。通常,用户将向我们的“引擎”提交句子,我们想知道该句子的核心主题是什么。 目前,我们正在使用openNlp来: 切分句子 识别句子的名词短语、动词等 确定句子的所有“主题” (未完成!)确定句子的“核心...

12得票1回答
Java中的RNTN实现

我想在Java中实现一个递归神经张量网络 (RNTN)。 我已经使用 Deeplearning4j 对单词库进行了 Word2Vec 流程以将其向量化。 对于 NLP 流程,我使用了 Opennlp(用于分词、POS 标记和分析)。 现在,我发现我需要一个 RNTN 来实现我的目的,但是...

12得票2回答
如何使用OpenNLP和stringi检测句子边界?

我想将下一个字符串分成句子:library(NLP) # NLP_0.1-7 string <- as.String("Mr. Brown comes. He says hello. i give him coffee.") 我想演示两种不同的方法。其中一种来自openNLP软件包:...

10得票1回答
如何在OpenNLP中训练命名实体识别器?

好的,我有下面的代码来训练OpenNLP的NER标识符 FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new PlainTextByLineStream(fileReader); ...

10得票1回答
生产环境中使用NLTK?

我已经在Python NLTK中开发了几个聚类、数据抽象等算法。现在的问题是,在向风险投资家展示之前,我要将其扩展到大规模。NLTK有其自身的优点,如快速开发等。但这只是在我最初选择时对我有意义。现在我足够成熟,发现它有一些限制,比如缺乏可扩展性。我对Mahout进行了一些研究,但那也只是用于...

9得票2回答
OpenNLP中训练时的'cut-off'和'iteration'是什么意思?

cut-off 和 iteration 在 OpenNLP 中的训练中有什么含义?或者说在自然语言处理中都是怎样的概念。我只需要这些术语的通俗易懂的解释。就我所知,iteration 指的是算法重复迭代的次数,而 cut-off 是一个阈值,如果文本某个特定类别的值高于这个阈值,那么它将被映射...

9得票5回答
NLP用于找到实体之间的关系

我目前的理解是,可以使用OpenNLP、Stanford NLP等工具包从文本文档中提取实体。 但是,有没有一种方法可以找到这些实体之间的关系呢? 例如,请考虑以下文本: “正如你们中的一些人可能知道的那样,上周我在欧洲高能物理实验室CERN度过了。那里是著名的希格斯玻色子于去年7月被发...