20得票2回答
安卓文本转语音API发出的声音听起来很机械

我第一次学习Android开发,我的目标是创建一个简单的“Hello World”应用程序,接受一些文本并朗读出来。 我基于我找到的一个示例编写了我的代码,以下是我的代码:class MainFeeds : AppCompatActivity() { override fun o...

19得票4回答
去除音轨中人声的算法

我想从mp3音轨中去除人声。我在谷歌上搜索并尝试了几款软件,但没有一个令人信服的。我计划读取mp3文件,获取波形,并去除超过指定限制的波形。 您有任何关于如何进行的建议吗? -- 更新 我只需要能够读取mp3文件格式的代码。有这样的软件吗?

17得票4回答
从任意音频文件中提取语音部分的好方法是什么?

我有一组由用户上传的音频文件,不知道它们包含什么内容。 我想要取出任意音频文件中每个人发言的实例,并将其分别生成为新的音频文件。我不需要检测实际单词,只需要“开始说话”和“停止说话”点,并在这些点生成新文件。 (我正在针对Linux环境开发Mac) 我找到了Sox,它看起来很有前途,并具...

17得票3回答
有没有简单的语音活动检测实现?

我正在寻找一些用于VAD(语音活动检测)的C/C ++代码。 基本上,我的应用程序正在从设备读取PCM帧。我想知道用户何时在说话。我不是在寻找任何语音识别算法,而只是想要声音检测。 我想知道用户何时在说话以及何时结束: bool isVAD(short* pcm,size_t count);

16得票1回答
在C/C++中读取和处理WAV文件数据

我正在进行一项非常重要的学校项目,需要用C/C++提取WAVE文件的信息并使用该信息获取语音信号的LPC。但是,为了做到这一点,我需要对信号进行一些预处理,例如进行零交叉和能量分析等操作。这意味着我需要符号和实际值。问题是我不知道如何获取有用的信息和正确的格式。我已经阅读了文件中的每个字段,但...

14得票1回答
如何开发类似Talking Tom的语音识别应用程序

如何开发像Talking Tom这样的语音识别应用程序? 1. 我的要求是如何在没有任何事件(如按钮、触摸事件)的情况下识别声音。 2. 所有的录音示例都是通过按钮进行的,但我的要求是当用户说话时自动记录语音,并在用户停止说话时自动将语音转换成其他声音(如Tom或鹦鹉)。 ...

14得票2回答
如何向speechSynthesis添加语音/语言?

当我在Chrome中运行speechSynthesis.getVoices()时,我会得到一份可能的语音列表。该列表因计算机和Chrome版本而异。 有没有办法扩展支持并添加更多语音? 我认为可以通过要求用户下载其选择语言的语音文件来实现。这样的文件存在吗? 编辑: 这需要在Windo...

14得票2回答
从歌曲中提取人声

我的问题是如何使用Python语言提取音乐中的人声,我看过这段代码,但它提取的是背景音乐。from pydub import AudioSegment from pydub.playback import play # read in audio file and get the two m...

13得票3回答
高质量、情感丰富、流畅多变的文本转语音引擎?

在查看了一些服务/工具后,我得出了一个结论。大多数文本转语音工具的声音过于技术化、机械化——换句话说,质量很差。 而且,看起来它们都带有“硬编码”的语音模板,因此缩短了变化和自定义的可能性。有些工具允许你设置阅读速度和音调,但这还不够。 我猜测情感方面的问题在于,很难从纯文本中判断情感,特...

12得票1回答
如何通过编程将文本传递给Google语音短信?

I use the following code to start the SMS application: Intent smsIntent=new Intent(Intent.ACTION_SENDTO, Uri.parse("sms:")); smsIntent.putExt...