任何想法如何实现识别歌曲的算法,通过匹配歌曲片段、人声或旋律。我不希望有人在这里写出算法: ),我知道它涉及很多东西,但我想知道如何入手。做这样的事情需要考虑哪些技术?我正在寻找类似Shazaam或Midomi的东西。此外,是否有提供API的在线服务可以完成相同的任务?
哦,很简单。 将歌曲分成若干部分,对每一部分运行FFT,提取几个主要的振幅,并将它们与时间信息一起存储为哈希值。 然后对录制的音频做同样的处理,并根据时间匹配存储的数据。 简单吧?说实话,这个过程更加复杂,但思路是类似的。