有没有语音转文字的API或者某种“技巧”,可以使用谷歌的语音转文字功能?

4
我认为谷歌的语音转文字设施(如Google Voice自动转录语音信箱、YouTube上视频的自动字幕等)非常令人印象深刻。我曾经查看过谷歌是否通过API提供了这项服务,但似乎他们没有(我并不怪他们!)。提供语音转文字功能的云计算服务将会非常酷。那么有没有什么“黑科技”可以用来访问语音转文字呢?我的架构基本上是这样的——将15-20秒的wav/mp3/其他片段作为输入,输出为纯文本。你们有什么想法吗?

什么平台?相关的问题(请查看此页面下方和右侧)可能会提供一些见解。 - Robert Harvey
6个回答

3

有很多语音转文本的API可用。虽然谷歌没有提供他们的API,但这并不意味着你没有选择。

这里有一个适用于C#的好API。如果你的平台不是.NET,你可以搜索其他API。

http://cmusphinx.sourceforge.net/


2

Seth - 你曾经实现了这个 API 吗?你有兴趣在 Github 上分享吗? - Ben Lobaugh
我没有这样做,但我让Google识别了我在那篇文章中发布到URL上的音频片段中的文本。我放弃的原因是我的应用程序使用mp3文件,而Google的服务器只接受*.flac文件。 - Westy92

1
如果你真的想要谷歌的输出... 这是一种黑客方法。
你是否考虑过制作一个电话提交引擎?它基本上会调用你的谷歌语音邮件... 播放mp3。
通过https://code.google.com/p/google-voice-java/获取输出。
更好的答案呈现。


1

1

它可以通过Chrome 8或Opera在HTML5中使用: https://docs.google.com/View?id=dcfg79pz_5dhnp23f5&pli=1

Google语音技术也可以通过Android API在Android手机上访问。

其他产品,如Sphinx,是最适合特定领域而不是“无限制”语音转文本的语音识别引擎。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接