语音识别API

4
我有一个Java应用程序,想在上面实现语音识别功能。就像这样:假设我有一些记录,用户称之为“嘿”,“一”,“二”,“茶”。当他/她说“嘿”时,语音识别API应该识别记录的第一个输入。“嘿”,“一”,“二”,“茶”可能是英语中不是单词的东西。
我已经查找了一些支持语音识别或具有音频指纹算法的API。但是我不想使用它们。让我解释一下为什么我不使用这些API。首先,语音识别API尝试理解单词并将其转换为文本。然而,这仅限于一个API支持的语言。即使语音识别API支持英语,由于用户发音不好,也可能会得到糟糕的结果。因此,我不想在我的应用程序中使用语音识别API。因为该功能不应基于语言。
此外,当我寻找语音识别API时,我发现了“音频指纹”API。我使用了开源的“musicg” API,然后开发了一个测试应用程序。该应用程序记录包含非单词语音的4个不同音频文件。之后,我录制了一个与其中一个类似的声音,并且测试API使用musicg API将最后一个与前面的音频文件进行了比较。然而,结果也非常糟糕。
正如我之前提到的,我需要获得一个像旧电话一样的语音识别功能。

我也有同样的问题,先生。仍在寻找答案。关于鼓掌识别有什么参考资料吗? - Sagar Nayak
@SagarNayak 你可以使用musicg api来识别拍手声。https://groups.google.com/forum/?fromgroups#!topic/musicg-api/oWRpUo3ZNXo - ziLk
一定要尝试并更新。谢谢@zilk。 - Sagar Nayak
请看这个问题。你或许可以帮助我。http://stackoverflow.com/questions/37925382/detectionapi-supports-mono-wav-only - Sagar Nayak
1个回答

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接