得票数最多 'speech-to-text' 问题 - 第2页

关联标签

20得票3回答

PowerShell可以说话，但如果我说话，它能写吗？

以下是让PowerShell朗读的方法。Add-Type -AssemblyName System.Speech $synthesizer = New-Object -TypeName System.Speech.Synthesis.SpeechSynthesizer $synthesizer...

powershellpowershell-2.0speech-recognitionspeech-to-text

20得票1回答

音频文件转录的开源软件

有人可以推荐一款可靠的开源软件，用于转录WAV文件中的英语语音吗？我研究过的两个主要程序是Sphinx和Julius，但我从未能够让它们正常工作，并且每个程序的转录文件文档都很简略。我正在64位Ubuntu 10.04上开发，其存储库包括sphinx2和julius，以及voxforge的...

javapythonspeech-recognitionspeech-to-textcmusphinx

20得票6回答

语音/语言转文本

我需要一个 API 或库(最好是免费的)，它可以通过麦克风将语音转换为文本(string)。此外，我还需要一个可以进行文本转语音的 API 或库。我想使用 C# 和 .NET，但其他语言也可以。谢谢。

c#.netspeech-recognitionvoice-recognitionspeech-to-text

20得票1回答

在安卓中如何使用语音输入填充编辑框？

我正在处理安卓语音输入相关的工作。我使用了来自样例的代码。 http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/apis/app/VoiceRecognition.html 我在...

androidspeech-to-text

20得票2回答

JavaScript语音转文字技术-为盲人提供帮助

我正在开发一个网站，并希望通过语音帮助盲人使用它，因此我将使用：文本转语音，为用户提供一些选项语音转文本，允许用户使用自己的声音进行选择我已经有一些文本转语音的JavaScript库（例如speak.js），但现在我需要一个好的语音转文本库。有一些解决方案可以实现这个目的（例如s...

javascripthtmlgoogle-chromespeech-recognitionspeech-to-text

19得票5回答

如何在Python中进行实时语音活动检测？

我正在对录制的音频文件进行语音活动检测，以检测波形中的语音和非语音部分。分类器的输出如下（绿色区域表示语音）：我在这里面临的唯一问题是使其适用于音频输入流（例如：来自麦克风），并在规定的时间范围内进行实时分析。我知道可以使用 PyAudio 动态地从麦克风记录语音，并且有几个实...

pythonspeech-recognitionspeech-to-textspeechpyaudio

18得票6回答

Pocketsphinx-添加单词和提高准确性

我终于成功编译并运行了pocketsphinx(pocketsphinx_continuous)。我遇到的问题是如何提高准确性。据我所知，可以指定一个字典文件(-dict test.dic)。因此我使用默认字典文件，并添加了一些单词的发音，例如： pencil P EH N S AH L p...

sphinxspeech-recognitionspeech-to-text

17得票4回答

Python中的音高检测

我正在开发一个Python模块的概念，它可以检测特定频率（人类语音频率80-300hz），并通过从数据库中检查来显示句子的语调。我使用SciPy绘制声音文件的频率，但我无法设置任何特定的频率以分析音高。我该怎么做？更多信息：我想能够设置一种定义好的语音模式（例如上升、下降），并且程序会检测...

pythonsignal-processingspeech-recognitionspeech-to-textspeech

16得票3回答

从自己的声音文件中转换语音为文本

正如您所知，使用Android API实现语音转文字非常简单。您只需调用API的意图，它就会返回文本内容。我的情况有些不同，我有一个预先录制的3GPP声音文件，这个文件是从用户那里录制并保存在SD卡上的。我想知道是否可以像其他语音识别一样将其转录成文本。语音转文字API是否允许上传自己的声音文...

androidfileaudiospeech-to-text

15得票1回答

INVALID_ARGUMENT: 请求有效载荷大小超过限制：10485760字节。

我第一次在一个项目中使用Google云端语音识别API将一系列音频文件转换成文本。每个文件大约有60分钟长，是一个人在整个时间内持续讲话。我已经安装了GC SDK，并使用它执行请求，如下所示：gcloud ml speech recognize-long-running \ "/path/to...

speech-recognitionspeech-to-textgoogle-speech-api