9得票1回答
如何使用Spacy解析动词

我正在尝试解析语料库中的动词,并将它们列在字典中,统计每个动词作为及物动词、不及物动词和双及物动词出现的次数。我想知道如何使用spacy解析这些动词,并将它们标注为及物动词、不及物动词和双及物动词。

9得票4回答
自然语言处理-词对齐

我正在寻找单词对齐工具和算法。 我正在处理双语英语 - 印地语文本,并且目前正在使用以下算法: - DTW(动态时间规整)算法 - CLA(竞争链接算法) - NATools - Giza++ 请问是否有其他的算法/工具是与语言无关的,可以实现并评估平行英语印地语语料库的统计单词对齐。一些...

8得票2回答
语言标注器错误地将词语标记为“其他单词”。

我一直在使用NSLinguisticTagger来处理句子,但是遇到了一些奇怪的问题,比如像"I am hungry"或者"I am drunk"这样的句子。虽然我们期望"I"被标记为代词,"am"被标记为动词,"hungry"被标记为形容词,但事实并非如此。它们都被标记为OtherWord。...

8得票3回答
iOS中的词干提取 - 对于单个单词无效

我将使用NSLinguisticTagger进行单词的词干处理。我可以获取句子中单词的词干,但无法获取单个单词的词干。 以下是我正在使用的代码: NSString *stmnt = @"i waited"; NSLinguisticTaggerOptions options...

8得票9回答
有没有一种相对简单的方法让脚本能够从上下文中判断“her”是否为所有格代词?

我正在编写一个脚本,以颠倒一段文本中的所有性别词汇,例如“man”被替换为“woman”,“she”被替换为“he”等等。但是,“her”应该被替换成“him”还是“his”存在歧义。

7得票2回答
波兰/斯拉夫语名词屈折算法

注意!! 了解波兰语或任何其他带有强烈屈折的自然语言,最好具有格系统(例如德语),可以回答这个问题。特别是,波兰的格变系统非常类似于其他斯拉夫语言的系统,如俄语、捷克语、塞尔维亚语等。 看看这个波兰未完成的格变工具: declinator.com 我计划将其扩展到其他语言,即俄语和拉丁语,...

7得票4回答
Justadistraction:在没有空格的情况下对英语进行分词。Murakami SheepMan

如果去除空格,你会如何对英语(或其他西方语言)中的字符串进行分词? 这个问题的灵感来自于村上春树小说《Dance Dance Dance》中的绵羊人角色。 在小说中,绵羊人被翻译成说出以下类似的话: "likewesaid, we'lldowhatwecan. Trytoreconne...

7得票2回答
有没有可以在音韵层面上输出语音转文本的软件?

有没有软件能够将音频文件转换成语音学(IPA)文本输出? 我知道大部分的软件都是直接转换成一种语言,但有没有一种可以“教授”的软件呢?

7得票1回答
理解SemCor语料库结构 H

我正在学习自然语言处理(NLP),目前正在研究词义消歧(Word Sense Disambiguation)。我计划使用semcor语料库作为训练数据,但我不太理解其xml结构。我尝试过搜索,但没有找到任何描述semcor内容结构的资源。 <s snum="1"> <wf ...

7得票5回答
检查字符串中是否包含英语句子

目前,我决定采用字典并遍历整个字典。每次我看到一个换行符,我就创建一个包含从该换行符到下一个换行符的字符串,然后我使用string.find()来查找该英文单词是否在其中。这需要很长时间,每个单词需要大约1/2至1/4秒才能验证。 它完美地工作,但我需要每秒检查成千上万个单词。我可以运行几个...