11得票2回答
免费(最好是开源)语音转文字库的选项

寻找一个能将语音转换成文本的库(带有Java或Python APIs)。完全准确性不是必须的,因为我只需要为原型运行一些实验。理想情况下,它应该接受一个输入文件(例如.wav),并将输出作为文本返回。 谢谢。

11得票1回答
使用TensorFlow进行语音转文本

我刚开始接触TensorFlow,并正在寻求关于语音转文本识别项目的帮助。是否有一个示例展示如何使用TensorFlow进行语音转文本?我听说它在谷歌内部被用于提高25%的准确率。

11得票6回答
使用Java识别人说的字母

我需要识别用户通过设备麦克风发出的字母,该设备可以是运行 Android 的移动手机。例如,当用户说“R”时,应返回“R”,而不是“Are”等。 如何在 Java 中实现这种口语字母识别?我正在寻找可以轻松转换成代码的创意思路。 基于 @David Hilditch 的建议,我制作了以下字...

11得票3回答
谷歌语音 API V1无法工作?

我使用了Google语音API v1开发了一个应用程序。https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang="+语言代码; 这个链接被用来获取响应。它以前工作得很好,但是从今天开...

11得票1回答
离线语音识别功能是否包含在AOSP中?如果是,它属于哪个软件包?

我一直在搜索Jelly Bean以查找离线语音识别功能,但没有太多的运气。正如您所知,这个源很庞大而且笨重。我找到了/external/srec文件夹,但里面的文档似乎是来自Nuance,当Android于2007年首次推出时发布的。这仅作为封闭源Google应用程序(Gms)可用吗?谢谢,J...

10得票1回答
如何使用CMU Sphinx 4和英语voxforge模型进行语音转文本

我正在尝试使用sphinx4或pocketsphinx与英文voxforge模型一起使用,但我无法使其工作。我已经试图阅读文档页面(例如此页面:http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但...

10得票1回答
Microsoft语音产品/平台之间的区别

看起来微软提供了相当多的语音识别产品,我想了解它们之间的区别。 有Microsoft Speech API,或SAPI。但一些人会混淆Microsoft Cognitive Service Speech API也叫这个名字。 现在,Azure上的Microsoft Cognitive Se...

10得票3回答
树莓派 + Pocketsphinx + ps3eye 错误:无法打开音频设备

我刚在我的树莓派上安装了pocketsphinx。我认为我可能有些疯狂,但不确定是否提供了正确的设备。 每次运行以下命令: src/programs/pocketsphinx_continuous -adcdev plughw:1,0 -nfft 2048 -samprate 480...

10得票2回答
安卓语音识别的额外功能无法正常工作

我目前正在忙于语音识别,希望语音识别器可以永久地持续监听我的声音。该应用程序的目的是等待特定关键字的语音输入:当用户说出该关键字时,服务将准备好接收用户的语音指令。经过研究,我发现我们可以通过以下常量来操作识别器的监听时间: 顺便说一下,默认的识别服务会监听大约10秒钟。(Google AP...

9得票2回答
Alexa - 如何接受自由文本作为输入/插槽。除了使用自定义插槽并提供大量列表之外,还有其他方法吗?

如何接受自由文本作为输入/插槽?除了使用自定义插槽并提供大量列表之外,是否还有其他方法?由于文字插槽类型已被弃用,如何向Alexa提供自由文本/字符串输入?