37得票6回答
如何使用Spacy按句子拆分文档

如何将文档(例如段落、书籍等)分成句子? 例如,使用spacy将"The dog ran. The cat jumped"分成["The dog ran", "The cat jumped"]?

35得票6回答
JavaScript正则表达式:将文本拆分为句子并保留分隔符。

我想使用JavaScript的split方法从一个字符串中获取句子,但保留分隔符(如!?)。 到目前为止,我的代码是:sentences = text.split(/[\\.!?]/); 这个方法是可行的,但是它没有包含每个句子的结束标点符号(.!?)。有没有人知道如何做到这一点?

15得票4回答
将句子拆分为单词,但在C#中处理标点符号时遇到了困难。

我看到过一些类似的问题,但是我正在尝试实现以下目标。 给定一个字符串 str =“The moon is our natural satellite,即它围绕地球旋转!” 我想提取单词并将它们存储在一个数组中。 预期的数组元素应该是这样的。 the moon is our natu...

15得票7回答
将语料库拆分为句子的R代码

我有很多PDF文档,使用库tm读入了一个语料库,如何将该语料库分成句子? 可以通过使用qdap包中的sentSplit函数从文件中读取文本 (readLines ),生成数据帧,并对其进行拆分以实现该目标[*]。但这需要放弃使用语料库并逐个读取所有文件。 如何在tm中对语料库使用sentSp...

12得票2回答
从文本中提取动作的自然语言处理技术

我希望有人能指导我如何将文本中的动作分离出来。假设我有这段文本。我一直在寻找特定于操作的方法,但没有找到什么。它需要比仅选择动词更智能,因为有时一个操作与多个动词相关联,例如第二个项目包含“go”、“pick-up”和“get”,但这是单个操作的组成部分。当然,“Tim's flight”只是...

10得票1回答
从给定的单词中组成一个有意义的句子

我正在开发一个程序,需要从给定的一组单词中创建一个语法正确的句子。我会向该程序传递一个字符串列表作为输入,输出应该是由这些单词和其他必要的单词构成的有意义的句子。例如:Input: {'You' , 'House' , 'Beautiful'} Output: 'Your house is b...

10得票1回答
使用Spacy实现自定义句子分割

我是Spacy和NLP的新手。我在使用Spacy进行句子分割时遇到了以下问题。我正在尝试对文本进行句子划分,其中包含带有编号的列表(编号和实际文本之间有空格),就像下面这样。 import spacy nlp = spacy.load('en_core_web_sm') text = "Th...

9得票1回答
Python正则表达式:查找字符串中的所有单词

你好,我刚接触正则表达式,并开始使用Python。我在从英文句子中提取所有单词的过程中遇到了困难。目前我所写的代码如下: import re shop="hello seattle what have you got" regex = r'(\w*) ' list1=re.findall(...

9得票1回答
句子结构识别 - Spacy

我打算使用spacy和textacy来识别英语的句子结构。 例如: The cat sat on the mat - SVO , The cat jumped and picked up the biscuit - SVV0. The cat ate the biscuit and cook...

9得票4回答
Maven:如果在pom.xml中的property标签中有if语句

如果某个环境变量已经设置了,我想要设置一个属性。我在Google上搜索了很多相关信息,但是我找到的全部都类似下面的代码,而且我一直收到以下错误消息: [FATAL] Non-parseable POM Y:\Maven\parent-pom\pom.xml: TEXT must be imme...