谷歌语音识别库或API

3
谷歌最近在其语音识别软件方面取得了巨大进展,该软件用于多个开源产品中,例如Chromium Web Speech和Android Handsfree texting。我想将他们的语音识别作为我的服务器堆栈的一部分使用,但是我找不到太多相关信息。
这个文本识别软件是否作为库或包可用?或者,我可以从另一个程序调用Chromium来将一些音频文件转录为文本吗?

请参阅类似问题http://stackoverflow.com/questions/12489321/using-google-api-speech-to-text-on-pc-version和https://dev59.com/qlzUa4cB1Zd3GeqP4IlP。 - Michael Levy
我觉得这些答案可能过时了,谷歌已经在2013年初开始公开一些部分。 - Jeroen Ooms
有链接吗?那会很有帮助的。 - Michael Levy
但是这是关于在Chrome中进行接口交互的内容,我找不到它作为一个独立的库。 - Jeroen Ooms
2个回答

1
Web Speech API仅适用于Chrome或Android环境。客户端需要进行大量的工作,因此没有公共的服务器API可以仅接受音频文件并处理它。如果您在github上搜索,您会发现一些工具,例如https://gist.github.com/alotaiba/1730160,但我非常确定这种访问方法100%不受支持,认可或确认其继续有效。

1

之前在https://gist.github.com/alotaiba/1730160提到的方法对我有效。 我在我的家庭自动化程序中每天都使用它。 我使用Python脚本捕获音频并确定哪些是有用的音频或只是噪音,然后将小的音频片段发送到Google并在不到一秒的时间内返回文本! 我已成功地将其集成到我的程序中,如果你搜索一下,你会发现更多的人也这样做了!


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接