音频指纹的局部敏感哈希

4
我正在开发一个音频指纹系统,最近阅读了一些论文和研究,特别是这个页面:c# AudioFingerprinting and Locality Sensitive Hashing
现在我已经得到了每32毫秒音频的一系列指纹。我想要做的是使用LSH或其他相似性保持方法对这些单独的指纹进行哈希(而不是将它们的序列一起哈希)。根据我对LSH的理解,它适用于多维向量,并产生二进制字符串,然后可以在汉明空间中进行比较。
我的问题在于,我拥有的指纹不是多维的,它们只是单个长整数。如何使用LSH对这些进行哈希?有没有一种方法可以以相似性保持的方式哈希单维标量?
1个回答

1

回复晚了,但是这件事情很简单,只是不知道为什么错过了。

LSH将使用随机投影矢量将矢量或标量投影到不同维度的空间中,同时保持相似性。在这里检查一个好的答案https://dev59.com/1Wcs5IYBdhLWcg3wTyRl#12967538

所以我所要做的就是创建一个阶数为[n x 1]的随机投影矩阵,然后将其与标量[1 x 1]或一个标量向量[1 x m]相乘,以获得投影[n x 1]或[n x m]。之后阈值化以获得二进制向量即可。

尽管我认为这是正确的方法(之前也是这样做的),但目前我似乎无法获得好的二进制向量。当我更深入地研究问题时,可能会再发一篇文章。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接