音频匹配(音频指纹识别)

5
我正在编写一款安卓应用程序,可以通过麦克风录制用户的声音并将其保存在存储器中,并将其链接到特定的内容(如联系人)。稍后,用户再次调用该语音,应用程序应与保存的音频文件进行比较,并找到匹配该语音的文件。
我搜索了很多资料,并找到了一些在线实现此功能的库,例如 EchoPrint 生成来自录制音频的指纹并将其发送到开源服务器并返回结果。但我需要离线实现此功能。
有人知道这样的库吗?
2个回答

7
如果你想比较用户的旧录音和新来电,像Python服务器上的Dejavu或C++的Echoprint这样的音频指纹解决方案将无法帮助你。它们用于对记录的音频片段和噪声进行识别和检索。它们无法处理人声的变化。在这里可以看到一个解释here
如果是这种情况,你所指的是speaker recognition,这更加困难,并涉及相当多的机器学习。要在大量用户中进行此操作(特别是在手机离线状态下),可能会很困难。但是对于确定几个用户之间的差异,这可能是可行的。

1

这不是一个说话者识别库。 - tobassist

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接