9得票1回答
Mel频率倒谱系数是如何工作的?

我已经实时从麦克风输入计算出FFT和音高+绝对频率。现在我想计算音色。 我看到了Mel频率倒谱系数-MFCC,但我并没有很好地理解它。有人能给我一些提示吗?

9得票7回答
Visual Studio语音命令

你知道钢铁侠在电影中是如何使用语音命令来操作他的集成开发环境(IDE)的吗?是否有任何Visual Studio插件可以做到这种事情?如果没有,那么该如何自己制作呢?

9得票1回答
C++语音识别API

我正在寻找一款C++语音识别/语音识别API。我已经尝试了一些,包括VOCE和pocketphenix。然而,我的要求如下: 文本转语音 语音转文本(语音命令 - 我计划将语音转换为字符串,并检查它是否是一个命令) 识别我的声音(非必需) VOCE API看起来似乎不能提供我所需的功能,...

9得票1回答
如何使用Python找到两个语音文件的差异

我希望比较两个语音文件并找出它们之间的差异。假设我有一首音乐曲目的原始文件和另一个由我读出的文件,我想比较这两个文件并找出它们之间的音素差异。实际上,对我来说单词并不重要,重要的是音素的相似性,我想要找到类似于相似度百分比的东西。我希望用Python实现这样的功能。

9得票1回答
自定义语音操作

Google开发者关于语音操作的视频指出可以实现自定义语音操作。给出的示例是: Ok Google, Shazam this song 显然,这不是系统语音操作之一(拍照、设置闹钟等)。视频提供的链接指向自定义语音操作页面,该页面说明如下: For example, developer...

8得票1回答
安卓应用程序的GPS语音导航功能

我正在尝试为Android创建一个旅游应用程序。 我需要用户通过语音进行引导。我一直在查看googlemaps Android API,但没有关于语音方向的内容。 您知道任何解决方法吗?是否有其他API / SDK可供我使用来实现此功能? 提前感谢。

8得票4回答
语音比对算法

如果有两个数字化格式的录音声音,是否有一种算法可以比较这两个声音并返回相似度系数呢?

7得票1回答
如何在安卓系统中实现按需更改通话声音?(如将男性声音变为女性声音等)

我需要更改语音通话的输入流和输出流,例如将男人的声音更改为女人的声音或将人类的声音更改为卡通声音。需要根据要求进行更改。 如果您有任何想法或安卓源代码,请分享。

7得票4回答
C++ API用于“文本转语音”和“语音转文本”

我想知道是否有一个好的C++ API可以进行“语音识别”和“文本转语音”。我已经看过Festival,但你甚至无法说出计算机在说话,因为它太真实了,还有voce。不幸的是,Festival似乎不支持语音识别(我的意思是“语音到文本”),而voce是用Java构建的,由于JNI,在C++中使用起...

7得票1回答
使用Twilio在呼出电话中播放DTMF音调

在我的基于Twilio的应用程序中,我通过Twilio REST API创建出站呼叫。当目标方响应时,我将其放入最近创建的会议中。如何在将其放入会议之前播放一定集合的DTMF音调?响应方是接受DTMF音调的某个系统,我需要播放一些数字集合。我已经阅读了文档,但没有找到实现这一点的方法。是否可能?