74得票15回答
导入错误:找不到名为google.cloud的模块。

我无法导入google.cloud.speech from google.cloud import speech 我已经使用以下方式进行安装: pip install --upgrade google-cloud-speech -t dir-name 在从文件夹名称导入时,它给了我...

39得票1回答
Android语音转文字API(Recognizer Intent)和Google Cloud Speech API之间的区别是什么?

我正在考虑开发一个语音转文字的应用程序。我做了一些研究,发现系统自带的使用 RecognizerIntent 的语音转文字 API 是免费的,但同时也发现 Google 现在提供了一种需要付费的云语音转文字 API。 我的问题是,它们之间有什么区别,如果我使用内置的 RecognizerIn...

33得票1回答
从网络流式传输音频时,无法从Google语音合成API获得结果

我想使用Python的Google-cloud-speech API从Web流式传输音频并将其转换为文本。我已经在我的Django channels代码中集成了它。对于前端,我直接复制了这个代码,后端有这个代码(请参见下面)。现在,问题来了,我没有得到任何异常或错误,但是我没有从谷歌API得到...

21得票3回答
当检测到静音时,我该如何提取先前的音频(来自麦克风)作为缓冲区?(JS)

我正在使用Google Cloud API进行语音转文本,并使用NodeJS后端。应用程序需要能够侦听语音命令,并将其作为缓冲区传输到后端。为此,当检测到静音时,我需要发送先前音频的缓冲区。如有任何帮助,包括下面的js代码在内,将不胜感激。 if (!navigator.getUserMedi...

18得票3回答
谷歌语音识别API返回为空

我正在对Google Cloud Speech API执行异步请求,但不知道如何获取操作结果:POST请求: https://speech.googleapis.com/v1beta1/speech:asyncrecognize请求体: { "config":{ ...

18得票2回答
如何从Google Cloud文本转语音API中获取SSML时间戳

我想使用SSML标记通过Google Cloud文本转语音API请求音频流中这些标记的时间。这些时间戳是必要的,以便为效果、单词/部分高亮和向用户提供反馈提供线索。 我找到了这个问题,虽然该问题涉及每个单词的时间戳,而不是SSML <mark>标记。 以下API请求返回OK,但...

15得票2回答
Google语音识别API,无效参数:400 必须使用单声道(单通道)。

我一直在Google语音转文字中遇到这个错误InvalidArgument: 400,问题似乎是我使用了2通道音频(立体声),而API正在等待单声道的wav音频。 如果我在音频编辑器中转换文件可能会起作用,但我不能使用音频编辑器批量转换文件。是否有方法在Python或Google Cloud...

15得票3回答
谷歌语音转文字API/谷歌云语音解决方案中的用户数据隐私

当我使用 Google 语音转文本 API 或 Google 云端语音解决方案时,维护了什么级别的数据隐私? 我想知道这个问题,因为我正在开发一个应用程序,将音频文件转换为文本,而这些文件可能包含用户敏感数据。

14得票1回答
我该如何通过socket.io从浏览器中实时流式传输音频到Google Cloud Speech?

我有一个React应用程序的情况,其中有一个输入框,我希望它可以语音输入。我只需要兼容Chrome和Firefox浏览器,所以我想使用getUserMedia。我知道我将使用Google Cloud的Speech to Text API。但是,我有一些注意事项: 我希望这可以实时流式传输我...

13得票5回答
谷歌云语音有没有生成SRT(或类似格式)文件的方法?

为了给我的视频生成字幕,我把它们转换成音频文件,并使用云语音转文字。它能工作,但是它只生成转录文本,而我所需要的是*.srt/*.vtt/类似格式的文件。 我需要的是像YouTube一样:生成转录并将其与视频同步,就像一种字幕格式,即:在应该出现字幕的时间点上的转录。 虽然我可以将它们上传...