我需要一些指导,了解应该研究哪些技术/算法来解决以下问题。我目前有一个使用声纹识别聚类相似mp3的算法。在每个聚类中,我有每个文件的所有不同元数据(歌曲/艺术家/专辑)。对于该聚类,我想挑选与现有数据库中的行最匹配的“最佳”歌曲/艺术家/专辑元数据,或者如果没有最佳匹配,则决定插入新行。
对于一个聚类,通常会有一些正确的元数据,但是单个文件可能存在许多问题:
谢谢!
对于一个聚类,通常会有一些正确的元数据,但是单个文件可能存在许多问题:
- 艺术家/歌曲名称完全错误,或者只是稍微拼错
- 艺术家/歌曲/专辑缺失,但其他信息都在
- 歌曲实际上是现场录音,但只有聚类中的某些文件被标记为这样。
- 可能有非常少的元数据,在某些情况下仅有文件名,该文件名可能是artist-song.mp3,或artist-album-song.mp3或其他变化
谢谢!