谷歌语音识别库或API

Question

谷歌语音识别库或API

androidgoogle-chromespeech-recognitionchromium

3

谷歌最近在其语音识别软件方面取得了巨大进展，该软件用于多个开源产品中，例如Chromium Web Speech和Android Handsfree texting。我想将他们的语音识别作为我的服务器堆栈的一部分使用，但是我找不到太多相关信息。

这个文本识别软件是否作为库或包可用？或者，我可以从另一个程序调用Chromium来将一些音频文件转录为文本吗？

- Jeroen Ooms

请参阅类似问题http://stackoverflow.com/questions/12489321/using-google-api-speech-to-text-on-pc-version和https://dev59.com/qlzUa4cB1Zd3GeqP4IlP。 - Michael Levy

我觉得这些答案可能过时了，谷歌已经在2013年初开始公开一些部分。 - Jeroen Ooms

有链接吗？那会很有帮助的。 - Michael Levy

但是这是关于在Chrome中进行接口交互的内容，我找不到它作为一个独立的库。 - Jeroen Ooms

2个回答

1

之前在https://gist.github.com/alotaiba/1730160提到的方法对我有效。我在我的家庭自动化程序中每天都使用它。我使用Python脚本捕获音频并确定哪些是有用的音频或只是噪音，然后将小的音频片段发送到Google并在不到一秒的时间内返回文本！我已成功地将其集成到我的程序中，如果你搜索一下，你会发现更多的人也这样做了！

- Mighty Mitch

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Kinlan · Accepted Answer

Web Speech API仅适用于Chrome或Android环境。客户端需要进行大量的工作，因此没有公共的服务器API可以仅接受音频文件并处理它。如果您在github上搜索，您会发现一些工具，例如https://gist.github.com/alotaiba/1730160，但我非常确定这种访问方法100％不受支持，认可或确认其继续有效。