我正在开发一个音频指纹系统,最近阅读了一些论文和研究,特别是这个页面:c# AudioFingerprinting and Locality Sensitive Hashing。
现在我已经得到了每32毫秒音频的一系列指纹。我想要做的是使用LSH或其他相似性保持方法对这些单独的指纹进行哈希(而不是将它们的序列一起哈希)。根据我对LSH的理解,它适用于多维向量,并产生二进制字符串,然后可以在汉明空间中进行比较。
我的问题在于,我拥有的指纹不是多维的,它们只是单个长整数。如何使用LSH对这些进行哈希?有没有一种方法可以以相似性保持的方式哈希单维标量?
现在我已经得到了每32毫秒音频的一系列指纹。我想要做的是使用LSH或其他相似性保持方法对这些单独的指纹进行哈希(而不是将它们的序列一起哈希)。根据我对LSH的理解,它适用于多维向量,并产生二进制字符串,然后可以在汉明空间中进行比较。
我的问题在于,我拥有的指纹不是多维的,它们只是单个长整数。如何使用LSH对这些进行哈希?有没有一种方法可以以相似性保持的方式哈希单维标量?