iPhone应用 › 添加语音识别?

15

我想开发一个利用语音识别的应用程序。我见过像谷歌等大公司实现这个功能,但我很想知道在创业初期如何实现。有人研究过吗?有没有适合我们做这个的工具?


1
我认为您需要提供更多细节 - 您想要应用程序做什么等等... - zpesk
如果您想要在iPhone上添加语音到文本控制,则请阅读此线程http://www.surreystore.com/cms/technology/7-apple/16-how-to-add-voice-to-text-for-iphone.html - iMacker
4个回答

8

4
如果你从维基百科开始,你会得到一个很好的引擎列表(http://en.wikipedia.org/wiki/Speech_recognition#Commercial_software.2Fmiddleware)
截至我写这篇文章(2009年6月24日),我认为有两个可行的开源解决方案 两者都已经被用于iPhone应用程序,但是适用于iPhone的源代码并不容易获得。
截至我编辑此文(2009年7月8日),我最近了解到Loquendo(http://www.loquendo.com/en/)对iPhone具有语音识别和语音合成(ASR&TTS)功能。

@Rohrer,如果我们为语音识别添加任何外部引擎,苹果会批准吗? - user169964
@Shibin - 我从未听说过这样的应用被拒绝,我也不会期望它们被拒绝,但你的情况可能会有所不同。您可以始终搜索特定SDK的用户,并确保他们的应用程序实际上正在发布。对于商业SDK来说,这将特别容易。 - JJ Rohrer

3
最好的方法可能是:
  1. 在手机上录制声音
  2. 将录音发送到运行语音识别软件的服务器
  3. 然后返回一些内容给手机,以指示它应该做什么

2
这是要发送的大量数据。我可能会在iPhone本身上尝试它。毕竟,10年前PC可以很好地完成这项工作,所以现在也许iPhone应该能够做到。 - Nosredna
3
这实际上是Google搜索应用程序使用的技术。 - bgw
谷歌以特殊的方式对声音进行编码,他们并不仅仅为了Nosredna所说的原因而发送原始音频数据。 - Alexander Kellett
第二步中可以包括压缩,没有任何阻碍。 - dotalchemy

0
Nuance的Dragon Mobile SDK能够满足您的要求。您需要一个互联网连接才能将音频发送到Nuance的服务器并获取文本响应列表。然后,您可以决定如何处理文本响应(例如,要求用户选择所需选项或执行某些操作)。以下是链接:

http://dragonmobile.nuancemobiledeveloper.com/


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接