音频指纹的局部敏感哈希

Question

4

我正在开发一个音频指纹系统，最近阅读了一些论文和研究，特别是这个页面：c# AudioFingerprinting and Locality Sensitive Hashing。

现在我已经得到了每32毫秒音频的一系列指纹。我想要做的是使用LSH或其他相似性保持方法对这些单独的指纹进行哈希（而不是将它们的序列一起哈希）。根据我对LSH的理解，它适用于多维向量，并产生二进制字符串，然后可以在汉明空间中进行比较。

我的问题在于，我拥有的指纹不是多维的，它们只是单个长整数。如何使用LSH对这些进行哈希？有没有一种方法可以以相似性保持的方式哈希单维标量？

- Arnolin

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Arnolin · Accepted Answer

回复晚了，但是这件事情很简单，只是不知道为什么错过了。

LSH将使用随机投影矢量将矢量或标量投影到不同维度的空间中，同时保持相似性。在这里检查一个好的答案https://dev59.com/1Wcs5IYBdhLWcg3wTyRl#12967538

所以我所要做的就是创建一个阶数为[n x 1]的随机投影矩阵，然后将其与标量[1 x 1]或一个标量向量[1 x m]相乘，以获得投影[n x 1]或[n x m]。之后阈值化以获得二进制向量即可。

尽管我认为这是正确的方法（之前也是这样做的），但目前我似乎无法获得好的二进制向量。当我更深入地研究问题时，可能会再发一篇文章。