我熟悉计算机视觉(了解它),其中一个应用可以是图像识别,例如光学字符识别。然而,我更感兴趣的是“计算机听力”,我刚刚了解到这被认为是数字信号处理。
信号处理最吸引我的是在音乐中的潜在应用。我记得有一段时间前,我看过一个应用程序的预览(抱歉,忘记名字了),它可以听取录制的人弹吉他的声音,并自动将其绘制成时间轴上的实际音符/和弦。使用该程序,用户可以移动它们甚至编辑它们。现在,显然这要复杂得多,但它涉及相同的东西吗?信号处理?我还对音乐可视化器和智能灯光系统的可能应用感兴趣。
我的理解是,对于像MP3这样的压缩音频格式进行处理可能不会产生与包含单独轨道的MIDI相同的结果(也许我误解了)。一个无损格式,如PCM,是否比MP3更好?我对声音处理一无所知,这只是我从迄今为止阅读的内容中推断出来的。
我已经看过this question,其中有很好的答案和链接,涵盖了我很多问题。然而,我发现的大多数链接都是理论性的,虽然我对该主题很感兴趣并且值得一读,但我想知道是否有任何现有的库可以实现这个功能,或者是关于这个主题的文章针对计算机科学/编程,带有示例代码。即使是开源的声音/音乐可视化器或其他开源声音处理代码也很好。
如果我说得不清楚,对不起。就像我说的,我不知道自己在说什么。
信号处理最吸引我的是在音乐中的潜在应用。我记得有一段时间前,我看过一个应用程序的预览(抱歉,忘记名字了),它可以听取录制的人弹吉他的声音,并自动将其绘制成时间轴上的实际音符/和弦。使用该程序,用户可以移动它们甚至编辑它们。现在,显然这要复杂得多,但它涉及相同的东西吗?信号处理?我还对音乐可视化器和智能灯光系统的可能应用感兴趣。
我的理解是,对于像MP3这样的压缩音频格式进行处理可能不会产生与包含单独轨道的MIDI相同的结果(也许我误解了)。一个无损格式,如PCM,是否比MP3更好?我对声音处理一无所知,这只是我从迄今为止阅读的内容中推断出来的。
我已经看过this question,其中有很好的答案和链接,涵盖了我很多问题。然而,我发现的大多数链接都是理论性的,虽然我对该主题很感兴趣并且值得一读,但我想知道是否有任何现有的库可以实现这个功能,或者是关于这个主题的文章针对计算机科学/编程,带有示例代码。即使是开源的声音/音乐可视化器或其他开源声音处理代码也很好。
如果我说得不清楚,对不起。就像我说的,我不知道自己在说什么。