音频匹配（音频指纹识别）

Question

5

我正在编写一款安卓应用程序，可以通过麦克风录制用户的声音并将其保存在存储器中，并将其链接到特定的内容（如联系人）。稍后，用户再次调用该语音，应用程序应与保存的音频文件进行比较，并找到匹配该语音的文件。

我搜索了很多资料，并找到了一些在线实现此功能的库，例如 EchoPrint 生成来自录制音频的指纹并将其发送到开源服务器并返回结果。但我需要离线实现此功能。

有人知道这样的库吗？

- Shayan_Aryan

2个回答

1

以下是一个好的图书馆。它易于使用。但在此之前，您需要将音频文件转换为Wave格式。

- dinukahetti

这不是一个说话者识别库。 - tobassist

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- lollercoaster · Accepted Answer

如果你想比较用户的旧录音和新来电，像Python服务器上的Dejavu或C++的Echoprint这样的音频指纹解决方案将无法帮助你。它们用于对记录的音频片段和噪声进行识别和检索。它们无法处理人声的变化。在这里可以看到一个解释here。

如果是这种情况，你所指的是speaker recognition，这更加困难，并涉及相当多的机器学习。要在大量用户中进行此操作（特别是在手机离线状态下），可能会很困难。但是对于确定几个用户之间的差异，这可能是可行的。