使用 Mac OSX 语音输入API 进行语音识别

Question

9

在OSX Mavericks中，语音听写功能已经包括在内，非常有用。我正在尝试使用听写功能来创建自己的数字生活助手，但我无法找到如何使用识别功能来获取应用程序中的语音而不是文本框中的内容。

我已经研究了NSSpeechRecognizer，但它似乎更适用于编程可发音命令，具有预定义的语法，而不是听写。使用哪种编程语言并不重要，但Python或Java会很好...

谢谢你的帮助！

- user3166505

有解决方案吗？ - Nicolas Manzini

@NicolasManzini 是的，请看我的回答。 - Franck Dernoncourt

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Franck Dernoncourt · Accepted Answer

你可以使用SFSpeechRecognizer（镜像）（需要macOS 10.15+）：这是用于语音识别的。

对实时或预录音频执行语音识别，接收结果的转录、替代解释和置信度。

而正如您在问题中所指出的NSSpeechRecognizer（镜像），确实提供了“命令和控制”风格的语音识别系统（必须在听取之前定义命令短语，与识别文本无限制的口述系统形成对比）。

另一种方法是直接使用Mac Dictation，但据我所知，唯一的方法是重定向音频源，这不是很整洁，例如参见http://www.showcasemarketing.com/ideablog/transcribe-mp3-audio-to-text-mac-os/ (mirror)。