自然语言处理包

5

我开始处理一个需要自然语言处理的项目。我们需要进行拼写检查,将句子映射到短语及其同义词。我最初考虑使用GATE,但我不确定该用什么?我在这里找到了一篇有趣的帖子,让我更加困惑。

http://lordpimpington.com/codespeaks/drupal-5.1/?q=node/5

请帮我决定最适合我的目的。我正在开发一个Web应用程序,将使用这个NLP工具作为服务。

1
从某种意义上说,'NLP'并不存在。如果您能具体说明需要执行的任务,那将更好。 - bmargulies
我需要的基本架构/工具是帮助我设置机器学习系统的。输入的句子需要被映射到某些短语/短语的同义词,这些短语可能存在于句子中。由我设置的短语集合中的哪个情感与句子的哪个情感相对应。 - Arc
2
这对我来说看起来是 https://dev59.com/ckvSa4cB1Zd3GeqPdVC3 的一个副本。 - David Thornley
3个回答

7
你没有提供太多信息,但可以尝试这个链接:http://www.nltk.org/。我不确定NLTK是否支持拼写检查(可能我记错了),但它可以为文本输入做词性标注。如果你需要查找/匹配同义词,可以使用类似WordNet的工具:http://wordnet.princeton.edu/。如果你正在进行某种特定领域的工作:建议为特定领域术语创建自己的本体论。

有多个领域需要进行分析。在这种情况下,您会建议什么?对于基本设置,我可以使用什么?像GATE这样的东西..它有多有用? - Arc
这取决于它们与给定本体(如WordNet)的匹配程度。如果您使用的大多数术语与预定义的本体以相同的方式使用,那么您就不需要自己创建。如果您以不同的方式使用相同的术语,那么您可能需要创建一个新的本体。如果您有多个领域以不同的方式使用术语,那么您可能需要创建多个本体。 - adam

4
如果您使用Python,可以使用Python Enchant开发拼写检查器。 NLTK也适用于开发情感分析系统。我也有同样的原型。
Jaggu

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接