我们能从MFCC系数中恢复音频吗?

3
可以从MFCC系数中获取音频信号吗?如果可以,MFCC系数的值范围是多少?如果不行,应该如何将其归一化到0到1之间。我尝试使用以下MATLAB代码:http://labrosa.ee.columbia.edu/matlab/rastamat/,但恢复的音频与原始信号完全不同。
1个回答

3
这个问题更适合在dsp stackexchange上讨论。
从MFCC中无法准确恢复信号,因为在处理过程中会丢失一些信息,所以信号必须类似但不完全相同。通常品质较低,可在http://www.research.ibm.com/haifa/projects/multimedia/recovc/demo/index.html找到示例。
您可以始终将任何实值数据集归一化到0..1范围内。一种方法是通过实验数据标准差/方差的标准化。如果您的数据是x = {x1, x2, x3,....},则可以考虑(x_i - mean(x))/std(x)。第二种方法是应用任何映射函数,如arctan。通常不需要进行这样的归一化。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接