是否存在现成的C++ NLP API?我找到的最接近的是CLucene,这是Lucene的一个移植版本。但是,它似乎有点过时,文档也远远不完整。
理想情况下,这些API将允许进行标记化、词干提取和词性标注。
是否存在现成的C++ NLP API?我找到的最接近的是CLucene,这是Lucene的一个移植版本。但是,它似乎有点过时,文档也远远不完整。
理想情况下,这些API将允许进行标记化、词干提取和词性标注。
Freeling是用C++编写的,虽然大多数人只使用它们的二进制文件来运行工具:http://devel.cpl.upc.edu/freeling/downloads?order=time&desc=1
尝试使用DyNet等工具,它是一个通用的神经网络框架,但大部分过程都集中在NLP领域,因为维护者是NLP社区的创作者。
或者尝试Marian-NMT,它专门设计用于序列到序列模型机器翻译,但许多NLP任务也可以结构化为序列到序列任务。
也许你可以尝试Ellogon http://www.ellogon.org/,他们支持GUI并且也有用于NLP的C/C++ API。
如果您取消对C++的限制,您将获得完美的NLTK(使用Python编写)。
剩下的工作就是在Python和C++之间进行接口交互。
NLTK
,但是使用 Cython/C/C++ 移植会显著增加对大规模真实数据的处理时间。 - alvasApache Lucy可以帮助你解决部分问题。它正在积极开发中。