20得票3回答
PowerShell可以说话,但如果我说话,它能写吗?

以下是让PowerShell朗读的方法。Add-Type -AssemblyName System.Speech $synthesizer = New-Object -TypeName System.Speech.Synthesis.SpeechSynthesizer $synthesizer...

20得票1回答
音频文件转录的开源软件

有人可以推荐一款可靠的开源软件,用于转录WAV文件中的英语语音吗?我研究过的两个主要程序是Sphinx和Julius,但我从未能够让它们正常工作,并且每个程序的转录文件文档都很简略。 我正在64位Ubuntu 10.04上开发,其存储库包括sphinx2和julius,以及voxforge的...

20得票6回答
语音/语言转文本

我需要一个 API 或库(最好是免费的),它可以通过麦克风将语音转换为文本(string)。 此外,我还需要一个可以进行文本转语音的 API 或库。 我想使用 C# 和 .NET,但其他语言也可以。 谢谢。

20得票1回答
在安卓中如何使用语音输入填充编辑框?

我正在处理安卓语音输入相关的工作。我使用了来自样例的代码。 http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/apis/app/VoiceRecognition.html 我在...

20得票2回答
JavaScript语音转文字技术-为盲人提供帮助

我正在开发一个网站,并希望通过语音帮助盲人使用它,因此我将使用: 文本转语音,为用户提供一些选项 语音转文本,允许用户使用自己的声音进行选择 我已经有一些文本转语音的JavaScript库(例如speak.js),但现在我需要一个好的语音转文本库。有一些解决方案可以实现这个目的(例如s...

19得票5回答
如何在Python中进行实时语音活动检测?

我正在对录制的音频文件进行语音活动检测,以检测波形中的语音和非语音部分。 分类器的输出如下(绿色区域表示语音): 我在这里面临的唯一问题是使其适用于音频输入流(例如:来自麦克风),并在规定的时间范围内进行实时分析。 我知道可以使用 PyAudio 动态地从麦克风记录语音,并且有几个实...

18得票6回答
Pocketsphinx-添加单词和提高准确性

我终于成功编译并运行了pocketsphinx(pocketsphinx_continuous)。我遇到的问题是如何提高准确性。据我所知,可以指定一个字典文件(-dict test.dic)。因此我使用默认字典文件,并添加了一些单词的发音,例如: pencil P EH N S AH L p...

17得票4回答
Python中的音高检测

我正在开发一个Python模块的概念,它可以检测特定频率(人类语音频率80-300hz),并通过从数据库中检查来显示句子的语调。我使用SciPy绘制声音文件的频率,但我无法设置任何特定的频率以分析音高。我该怎么做? 更多信息:我想能够设置一种定义好的语音模式(例如上升、下降),并且程序会检测...

16得票3回答
从自己的声音文件中转换语音为文本

正如您所知,使用Android API实现语音转文字非常简单。您只需调用API的意图,它就会返回文本内容。我的情况有些不同,我有一个预先录制的3GPP声音文件,这个文件是从用户那里录制并保存在SD卡上的。我想知道是否可以像其他语音识别一样将其转录成文本。语音转文字API是否允许上传自己的声音文...

15得票1回答
INVALID_ARGUMENT: 请求有效载荷大小超过限制:10485760字节。

我第一次在一个项目中使用Google云端语音识别API将一系列音频文件转换成文本。每个文件大约有60分钟长,是一个人在整个时间内持续讲话。我已经安装了GC SDK,并使用它执行请求,如下所示:gcloud ml speech recognize-long-running \ "/path/to...