我不认为有一个单一的库可以完成统计自然语言处理库用户所期望的许多任务(警告:我对统计自然语言处理知之甚少)。有一些看起来很有趣的通用核心组件,如NGrams、估算器、logfloat和hmm库。还有一些工具可以执行一些非常特定的任务,例如用于形态学的morfette或hs-gizapp,它包装了GIZA++,以获取文档对之间的单词对齐。请注意Hackage的NLP部分,并考虑加入Haskell NLP社区(该站点当前由于最近攻击Haskell社区服务器而关闭)。