所以,像许多人一样,我决定创建自己的语音识别引擎。事实证明,这并不容易,特别是对于英语来说,因为单词的书写方式和发音方式之间存在着明显的差异。作为来自格鲁吉亚的人,我决定为格鲁吉亚语编写语音识别程序。在格鲁吉亚语中,你会准确地按照单词的书写方式发音。就像转录一样。这个事实会显著地简化我的任务吗?还是会有更困难的问题:D?
解决这些问题总是很困难...除此之外,还需要处理语言/发音...我不知道乔治亚语,但你所描述的可能会使任务变得更容易,但仍然是一个艰巨的任务。
编辑-根据评论:
使用好的库可以降低时间框架,甚至有助于提高质量...但并非每个库都适用于语音识别,尽管在某些其他音频相关问题上可能很出色...
供参考,请查看维基百科文章http://en.wikipedia.org/wiki/Speech_recognition - 它有一个很好的概述,包括一些链接和书籍参考,这是一个很好的起点...
至于如何设计这样的API,请参考http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html