我正在尝试玩一些音乐聚类算法,想使用一个基本上由离散傅里叶变换(例如将频率离散化)组成的特征向量,作为良好的相似度度量。这种方法是否有用?人们知道一些好的音频相似性度量吗?
我正在尝试玩一些音乐聚类算法,想使用一个基本上由离散傅里叶变换(例如将频率离散化)组成的特征向量,作为良好的相似度度量。这种方法是否有用?人们知道一些好的音频相似性度量吗?
首先,您需要决定是否想要指纹识别(即除了一些扭曲之外的身份)或相似度(但不是身份!)测量。
还要看看MFCC、树皮刻度等等。有很多文献可供参考。去亚马逊,找一本专门讲这个主题的书。
在离散化之前,您可以使用分层聚类(如kd树或hilbert曲线)。聚类可以降低维度复杂性并改变输入的顺序,而fft只是将其转换为波形。