我在哪里可以找到关于ARPA语言模型格式的文档?
我正在使用Pocket Sphinx STT引擎开发简单的语音识别应用程序。由于性能原因,建议使用ARPA语言模型。我想了解如何调整我的语言模型以满足自定义需求。
我找到的只是一些非常简要的ARPA格式描述:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
作为STT的初学者,我很难理解这些(n-grams等)。我正在寻找更详细的文档。就像JSGF语法文档一样: