适用于Mac的优秀语音识别引擎,不适用于iOS?

6
抱歉如果这是一个重复的问题,但我没有在任何地方看到它。
我正在开发一个可以接受语音命令的Mac程序,但NSSpeechRecognizer无法满足我的需求。
我想要更加动态的解决方案,以便我可以设置警报、制定日期、给出更自然的命令等。
我找到的每个开源语音引擎都是为iOS量身定做的。那么openears / vocalkit等是否同样适用于Mac程序?

1
你可以等待Mountain Lion的发布,希望苹果公司为开发者发布语音识别API。 - TheAmateurProgrammer
1
@theAmateurProgrammer:但那可能会由苹果的Siri服务支持,并需要互联网连接(如果你在IBM工作,则无法使用它)。我假设OP正在寻找一些可以本地运行的东西。 - Thilo
我不相信他们在WWDC上提到过将Siri添加到Mountain Lion中,只是带来了从语音到文本的能力(也就是所有文本框中的Dictation功能)。 - TheAmateurProgrammer
@theAmateurProgrammer 语音转文字是由同一服务完成的,该服务也负责Siri。它不是在本地完成的。 - Mahmoud Al-Qudsi
即使他们发布了一个命令API,我也怀疑它是否最适合我的需求。有人在cocoa应用程序上尝试过Pocketsphinx吗?或者它只绑定到Cocoa Touch? - kdsprogrammer
2个回答

3

语音识别异常复杂。免费的引擎之所以免费是有原因的。如果你期望有任何程度的口述(比如闹钟标签),那么你就会失望。Siri需要整个数据中心的原因也是如此。目前可用的开源软件包只能帮你实现简单的电话自动接听。

除非你具备广泛的统计学背景和空闲时间,否则我建议你考虑购买商业库或服务器实现的许可证。


瘟疫是正确的。我还要补充一点,你需要的动态功能应该考虑两个不同的因素:1.语音识别和2.自然语言处理能力。 - kineticfocus

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接