我已经实时从麦克风输入计算出FFT和音高+绝对频率。现在我想计算音色。 我看到了Mel频率倒谱系数-MFCC,但我并没有很好地理解它。有人能给我一些提示吗?
你知道钢铁侠在电影中是如何使用语音命令来操作他的集成开发环境(IDE)的吗?是否有任何Visual Studio插件可以做到这种事情?如果没有,那么该如何自己制作呢?
我正在寻找一款C++语音识别/语音识别API。我已经尝试了一些,包括VOCE和pocketphenix。然而,我的要求如下: 文本转语音 语音转文本(语音命令 - 我计划将语音转换为字符串,并检查它是否是一个命令) 识别我的声音(非必需) VOCE API看起来似乎不能提供我所需的功能,...
我希望比较两个语音文件并找出它们之间的差异。假设我有一首音乐曲目的原始文件和另一个由我读出的文件,我想比较这两个文件并找出它们之间的音素差异。实际上,对我来说单词并不重要,重要的是音素的相似性,我想要找到类似于相似度百分比的东西。我希望用Python实现这样的功能。
Google开发者关于语音操作的视频指出可以实现自定义语音操作。给出的示例是: Ok Google, Shazam this song 显然,这不是系统语音操作之一(拍照、设置闹钟等)。视频提供的链接指向自定义语音操作页面,该页面说明如下: For example, developer...
我正在尝试为Android创建一个旅游应用程序。 我需要用户通过语音进行引导。我一直在查看googlemaps Android API,但没有关于语音方向的内容。 您知道任何解决方法吗?是否有其他API / SDK可供我使用来实现此功能? 提前感谢。
我需要更改语音通话的输入流和输出流,例如将男人的声音更改为女人的声音或将人类的声音更改为卡通声音。需要根据要求进行更改。 如果您有任何想法或安卓源代码,请分享。
我想知道是否有一个好的C++ API可以进行“语音识别”和“文本转语音”。我已经看过Festival,但你甚至无法说出计算机在说话,因为它太真实了,还有voce。不幸的是,Festival似乎不支持语音识别(我的意思是“语音到文本”),而voce是用Java构建的,由于JNI,在C++中使用起...