有没有适用于文本分析的 Ruby Gem,可以进行诸如单词频率、模式检测等操作(最好能理解法语)?
The Mendicant Bug: NLP Resources for Ruby包含许多有用的Ruby NLP链接。
我曾经尝试使用Ruby语言学工具很久,记得遇到了很多问题... 我不建议轻易尝试。
如果你的大部分文本分析涉及ngrams和朴素贝叶斯等内容,我建议你自己动手。Ruby有相当不错的基本库和对正则表达式的强大支持,所以这应该不会太麻烦,并且你可以更容易地适应解决问题的特殊要求。
就像Stanford解析器gem一样,可以在Ruby中使用解决问题的Java库,但这可能会很棘手,因此可能不是解决问题的最佳方式。
words_counted
宝石。您可以在rubywordcount.com上看到演示。它具有您提到的许多分析功能,以及更多功能。API文档完善,可在Github的自述文件中找到。