使用 Mac OSX 语音输入API 进行语音识别

9
在OSX Mavericks中,语音听写功能已经包括在内,非常有用。我正在尝试使用听写功能来创建自己的数字生活助手,但我无法找到如何使用识别功能来获取应用程序中的语音而不是文本框中的内容。
我已经研究了NSSpeechRecognizer,但它似乎更适用于编程可发音命令,具有预定义的语法,而不是听写。使用哪种编程语言并不重要,但Python或Java会很好...
谢谢你的帮助!

有解决方案吗? - Nicolas Manzini
@NicolasManzini 是的,请看我的回答。 - Franck Dernoncourt
1个回答

4
你可以使用SFSpeechRecognizer镜像)(需要macOS 10.15+):这是用于语音识别的。

对实时或预录音频执行语音识别,接收结果的转录、替代解释和置信度。

而正如您在问题中所指出的NSSpeechRecognizer镜像),确实提供了“命令和控制”风格的语音识别系统(必须在听取之前定义命令短语,与识别文本无限制的口述系统形成对比)。

来自https://developer.apple.com/videos/play/wwdc2019/256/镜像):

enter image description here

另一种方法是直接使用Mac Dictation,但据我所知,唯一的方法是重定向音频源,这不是很整洁,例如参见http://www.showcasemarketing.com/ideablog/transcribe-mp3-audio-to-text-mac-os/ (mirror)。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接