21得票3回答
使用PocketSphinx识别多个关键词

我已安装了PocketSphinx演示程序,并且在Ubuntu和Eclipse下工作正常,但是尽管我尝试过,我仍然不知道如何添加对多个单词的识别。 我只希望代码能够识别单个单词,然后在代码中使用switch(),例如“up”,“down”,“left”,“right”。我不想识别句子,只想识...

20得票1回答
音频文件转录的开源软件

有人可以推荐一款可靠的开源软件,用于转录WAV文件中的英语语音吗?我研究过的两个主要程序是Sphinx和Julius,但我从未能够让它们正常工作,并且每个程序的转录文件文档都很简略。 我正在64位Ubuntu 10.04上开发,其存储库包括sphinx2和julius,以及voxforge的...

18得票3回答
ARPA语言模型文档

我在哪里可以找到关于ARPA语言模型格式的文档? 我正在使用Pocket Sphinx STT引擎开发简单的语音识别应用程序。由于性能原因,建议使用ARPA语言模型。我想了解如何调整我的语言模型以满足自定义需求。 我找到的只是一些非常简要的ARPA格式描述: http://kered....

14得票1回答
实时语音识别

我有一个使用speech_recognition软件包的Python脚本,用于识别语音并返回所说内容的文本。不过转录会有几秒钟的延迟。是否有另一种编写此脚本的方法可以在每个单词被说出时即刻返回?我有另一个使用pysphinx软件包来实现此功能的脚本,但结果不准确。 安装依赖项:pip ins...

14得票1回答
CMUSphinx PocketSphinx - 识别所有(或大量)单词

在尝试使用PocketSphinx进行Android开发之前,我使用了谷歌的语音识别API。 我不需要设置搜索名称或字典文件。它只是认出每一个被说出来的单词。 现在,在PocketSphinx中,我需要这样做。但是我只能找到如何设置对于一个单词的识别,或者设置一些词汇表(演示项目中提供的只有很...

14得票2回答
使用5万个单词创建ARPA语言模型文件

我想创建一个包含近50000个单词的ARPA语言模型文件。我无法通过将我的文本文件传递给CMU Language Tool来生成语言模型。是否有其他链接可以获取这么多单词的语言模型?

12得票4回答
如何关闭Pocketsphinx中的E_INFO?

E_INFO是在打印大量日志信息。我不知道如何关闭它。我在pocket/base sphinx的所有源文件中搜索了E_INFO,但我找不到设置标志的位置。 E_INFO指的是打印的日志级别,如果想要关闭这些日志,可以修改相应的配置文件或者修改代码中的日志级别设置。在pocket/base s...

11得票2回答
安卓上的Pocket Sphinx

如何在Android上使用PocketSphinx? 我在网上找到了一些提示,说这是可能的,但没有真正的答案,因此我在这里提出我的问题。

10得票1回答
如何使用CMU Sphinx 4和英语voxforge模型进行语音转文本

我正在尝试使用sphinx4或pocketsphinx与英文voxforge模型一起使用,但我无法使其工作。我已经试图阅读文档页面(例如此页面:http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但...

10得票3回答
树莓派 + Pocketsphinx + ps3eye 错误:无法打开音频设备

我刚在我的树莓派上安装了pocketsphinx。我认为我可能有些疯狂,但不确定是否提供了正确的设备。 每次运行以下命令: src/programs/pocketsphinx_continuous -adcdev plughw:1,0 -nfft 2048 -samprate 480...