9得票1回答
Web Speech API自定义单词

我阅读了关于此事的W3C文档,我认为自定义单词来自自定义语法,但我尝试访问这个演示并在控制台中输入以下javascript代码: recognition.grammars.addFromString('foo'); 这段代码运行良好,recognition.grammars[0].src...

11得票3回答
谷歌语音 API V1无法工作?

我使用了Google语音API v1开发了一个应用程序。https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang="+语言代码; 这个链接被用来获取响应。它以前工作得很好,但是从今天开...

8得票2回答
当尝试使用Python将wav文件转换为文本时,出现了wave.Error: unknown format: 3的错误。

我需要从麦克风记录音频并将其转换为文本。我已经尝试使用从网络下载的几个音频片段进行转换,并且它可以正常工作。但是当我尝试转换从麦克风录制的音频片段时,它会出现以下错误。 Traceback (most recent call last): File "C:\Users\HP\AppDat...

11得票2回答
免费(最好是开源)语音转文字库的选项

寻找一个能将语音转换成文本的库(带有Java或Python APIs)。完全准确性不是必须的,因为我只需要为原型运行一些实验。理想情况下,它应该接受一个输入文件(例如.wav),并将输出作为文本返回。 谢谢。

16得票3回答
从自己的声音文件中转换语音为文本

正如您所知,使用Android API实现语音转文字非常简单。您只需调用API的意图,它就会返回文本内容。我的情况有些不同,我有一个预先录制的3GPP声音文件,这个文件是从用户那里录制并保存在SD卡上的。我想知道是否可以像其他语音识别一样将其转录成文本。语音转文字API是否允许上传自己的声音文...

9得票2回答
使用System.Speech将mp3文件转换为文本

我想使用.NET中的语音识别功能来识别mp3文件中播客的语音,并将结果作为字符串获取。我看到的所有示例都涉及使用麦克风,但我不想使用麦克风,而是提供一个样本mp3文件作为我的音频来源。是否有人能够指向任何资源或发布一个示例? 编辑 - 我将音频文件转换为wav文件并在其上尝试了此代码。但它只...

15得票2回答
如何在PHP Web应用程序中实现Mozilla DeepSpeech以进行语音转文本?

我有一个 PHP 网页应用程序,正在寻找一种开源、高精度的语音识别实现方式,它可以接受用户的语音命令来打开网页。例如:"Make Sales"(这将打开创建销售 PHP 页面)、"Make Purchase order"、"Open END-OF-DAY reports"等。 我的问题: ...

11得票1回答
使用TensorFlow进行语音转文本

我刚开始接触TensorFlow,并正在寻求关于语音转文本识别项目的帮助。是否有一个示例展示如何使用TensorFlow进行语音转文本?我听说它在谷歌内部被用于提高25%的准确率。

19得票5回答
如何在Python中进行实时语音活动检测?

我正在对录制的音频文件进行语音活动检测,以检测波形中的语音和非语音部分。 分类器的输出如下(绿色区域表示语音): 我在这里面临的唯一问题是使其适用于音频输入流(例如:来自麦克风),并在规定的时间范围内进行实时分析。 我知道可以使用 PyAudio 动态地从麦克风记录语音,并且有几个实...

15得票6回答
Android RecognitionListener:onResults 被调用两次。

我有一个使用Kotlin编写的RecognitionListener项目。语音转文本功能一直都很成功,从未出现任何问题。 自上周以来,onResult函数开始被调用两次。该项目没有进行任何更改。我测试了旧版本的项目(几个月前的版本),它们也有同样的问题。 这里有三种不同的情况: 1. 小...