英语词形还原数据库?

4

您是否知道有没有足够大的词形还原数据库,可以返回以下示例单词的正确结果:

geese: goose
plantes: //not found

Wordnet的形态分析器并不足够,因为它会给出以下错误结果:
geese: //not found
plantes: plant
2个回答

2
"MorphAdorner"似乎在这方面更好,但仍会找到“plantes”的错误结果。
plantes: plante
geese: goose

也许您想使用MorphAdorner进行词形归并,然后将其结果与WordNet进行比较。您可以使用WordNet API执行查找操作,而无需首先执行词形归并,方法是调用findtheinfo_ds。这允许您首先使用像MorphAdorner这样的词形归并器。(如果您想使用词形归并器,则需要单独调用morph并在返回的词形上调用findtheinfo_ds。)
另一方面,我只花了大约5秒钟的时间查看MorphAdorner是否适合此目的,可能有一种方法可以消除不正确的“plantes”答案,而无需使用任何其他外部资源。

谢谢,取消选中“标准化拼写”后,它返回plante。可以将其与WordNet进行比较,以确定其不正确(我直接使用WordNet文件)。但是您是否知道“早期现代英语/十九世纪小说”选项是什么,它的语料库是否足够新,可用于现代英语? - Ali Shakiba
@Johns:当我说我只花了大约5秒钟的时间看时,我就是在暗示这个。试着查看他们的文档,看看是否有任何说明。 - Ken Bloom

1

从前, 有人向我推荐了Morpha,但我没有使用过它,所以我不知道它在这方面是否比WordNet更好。


它没有在线演示,但是通过阅读描述,似乎它不是基于数据库的。但如果我没有时间不够用,我会尝试它。 - Ali Shakiba

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接