Mel频率倒谱系数是如何工作的?

9

我已经实时从麦克风输入计算出FFT和音高+绝对频率。现在我想计算音色。

我看到了Mel频率倒谱系数-MFCC,但我并没有很好地理解它。有人能给我一些提示吗?

1个回答

7
MFCC将考虑人类听觉方面(对数频率感知,梅尔刻度)和乐器物理学方面(这些系统通常具有定义明确的泛音,是谐波的原因--这就是为什么MFCC使用FFT的FFT),以给出乐器音色的简化表示(其中基频和响度被分解出来)。关于这个主题可以写无数页,网络上也有很多相关内容,因此更具体的问题会更有帮助。计算MFCC的算法在wikipedia页面的顶部列出。

谢谢你的回答。所以,如果我想获得音色,MFCC 是正确的选择,对吗? - André
1
是的,我认为这是一个很好的选择,特别是作为解决问题的第一步。它易于实现,有很多相关文献支持,而且它是其他方法的标准比较对象(通常在这些比较中表现良好),因此它是一个不错的选择。 - tom10
在维基百科中,该算法如下:
  1. 对(信号的窗口部分)进行傅里叶变换。
  2. 使用三角形重叠窗口将上述光谱的功率映射到 Mel 刻度上。
  3. 取每个 Mel 频率处的功率的对数。
  4. 对 Mel 对数功率列表执行离散余弦变换,就像它是一个信号一样。
  5. MFCC 是所得到光谱的振幅。
我理解所有步骤,但第二步不清楚:使用三角形重叠窗口?我应该做什么,将频率传递到 Mel 刻度,但这个三角形重叠窗口是什么?
- André

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接