iPhone上的语音识别技术

6

我需要开发一个iPhone应用程序,可以识别语音并根据结果执行进一步的任务。

我知道iPhone 3.0不支持语音识别,因此我需要在服务器端实现语音识别软件。我只知道这些,由于我是新手,不知道如何处理这个问题。

请问我需要购买哪个软件并在服务器上实施,以及如何使用该服务?


什么是服务器端? - Shimmy Weitzhandler
1
他的意思是“不在电话上”。虽然如果有特定的服务器操作系统需要使用,可能会有所帮助。 - Paul Dixon
服务器端意味着将音频数据发送到服务器,使用大量资源和内存在那里识别语音,并将生成的文本输出发送回手机。例如,Google在Android上使用OCR和机器翻译来实现这一点:拍摄一些外语文本的照片,将其发送到服务器,进行OCR和翻译成英语,然后发送文本结果回来。 - Frank
4个回答

7
我知道的最好的开源语音识别软件包是Sphinx。
http://cmusphinx.sourceforge.net/

否则,我建议您研究Nuance软件。
目前的语音识别在有限的语法集下表现良好(如果您知道他们要说什么)。 开放的口述仍然无法足够可靠地用于许多应用程序。 在开发应用程序时请记住这一点。 我希望现在Google正在进入转录游戏(使用Google Voice),这应该会开始改善。 我认为他们将来可能会有一些东西。

3
pocketsphinx 是一个语音识别引擎,可用于嵌入式设备和桌面应用程序。它是 cmusphinx 开源项目的一部分。 - clyfe

1

实现语音识别是非常棘手的,也是一个活跃的研究领域。

虽然有一些开源解决方案可供选择,可以在这里找到。另外,还有一个新的解决方案SCARF,但我不知道它是否已经可以使用,或者只是一个概念验证。


1

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接