7得票2回答
基于Lucene的SpanQueries句子感知搜索

有没有可能使用Lucene SpanQuery查找所有单句中同时出现“red”、“green”和“blue”这三个词的位置? 我的第一个(不完整/不正确)的方法是编写一个分析器,在同一位置放置一个特殊的句子标记令牌和句子的第一个单词,并查询类似以下内容: SpanQuery termsIn...

37得票6回答
如何使用Spacy按句子拆分文档

如何将文档(例如段落、书籍等)分成句子? 例如,使用spacy将"The dog ran. The cat jumped"分成["The dog ran", "The cat jumped"]?

7得票2回答
如何将数组转换为句子?

我正在使用 Ruby on Rails v3.0.9,我想将一个字符串数组转换为包含标点符号的句子。也就是说,如果我有以下数组: ["element 1", "element 2", "element 3"] 我想获取/构建: # Note: I added 'Elements are...

12得票2回答
从文本中提取动作的自然语言处理技术

我希望有人能指导我如何将文本中的动作分离出来。假设我有这段文本。我一直在寻找特定于操作的方法,但没有找到什么。它需要比仅选择动词更智能,因为有时一个操作与多个动词相关联,例如第二个项目包含“go”、“pick-up”和“get”,但这是单个操作的组成部分。当然,“Tim's flight”只是...

15得票4回答
将句子拆分为单词,但在C#中处理标点符号时遇到了困难。

我看到过一些类似的问题,但是我正在尝试实现以下目标。 给定一个字符串 str =“The moon is our natural satellite,即它围绕地球旋转!” 我想提取单词并将它们存储在一个数组中。 预期的数组元素应该是这样的。 the moon is our natu...

15得票7回答
将语料库拆分为句子的R代码

我有很多PDF文档,使用库tm读入了一个语料库,如何将该语料库分成句子? 可以通过使用qdap包中的sentSplit函数从文件中读取文本 (readLines ),生成数据帧,并对其进行拆分以实现该目标[*]。但这需要放弃使用语料库并逐个读取所有文件。 如何在tm中对语料库使用sentSp...

10得票1回答
使用Spacy实现自定义句子分割

我是Spacy和NLP的新手。我在使用Spacy进行句子分割时遇到了以下问题。我正在尝试对文本进行句子划分,其中包含带有编号的列表(编号和实际文本之间有空格),就像下面这样。 import spacy nlp = spacy.load('en_core_web_sm') text = "Th...

7得票5回答
将一组字符串句子转换为单词列表

我正在尝试将一系列包含句子的字符串转换为列表,例如: sentence = ['Here is an example of what I am working with', 'But I need to change the format', 'to something more useab...

9得票4回答
Maven:如果在pom.xml中的property标签中有if语句

如果某个环境变量已经设置了,我想要设置一个属性。我在Google上搜索了很多相关信息,但是我找到的全部都类似下面的代码,而且我一直收到以下错误消息: [FATAL] Non-parseable POM Y:\Maven\parent-pom\pom.xml: TEXT must be imme...

9得票1回答
Python正则表达式:查找字符串中的所有单词

你好,我刚接触正则表达式,并开始使用Python。我在从英文句子中提取所有单词的过程中遇到了困难。目前我所写的代码如下: import re shop="hello seattle what have you got" regex = r'(\w*) ' list1=re.findall(...