iOS FFT绘制频谱图

Question

iOS FFT绘制频谱图

ioscore-audiofftspectrumvdsp

11

我已经阅读了以下问题：

如何使用苹果FFT和Accelerate Framework？

使用加速框架进行FFT时，我该如何设置缓冲区？

iOS FFT Accerelate.framework如何在播放过程中绘制频谱图？

它们都介绍了如何在加速框架中设置FFT。在他们的帮助下，我能够设置FFT并获得基本的频谱分析器。目前，我正在显示从FFT获得的所有值。然而，我只想显示10-15个或可变数量的条形图，分别代表某些频率。就像iTunes或WinAmp Level Meter一样。 1. 我需要平均一定范围内的幅度值吗？还是它们只为特定频率条提供幅度？ 2. 此外，我需要将幅度值转换为db吗？ 3. 如何将我的数据映射到特定的范围？针对声音位深度的最大db范围进行映射？获取一个bin的最大值将导致最大映射值跳跃。

我的RenderCallback：

static OSStatus PlaybackCallback(void *inRefCon,
                                 AudioUnitRenderActionFlags *ioActionFlags,
                                 const AudioTimeStamp *inTimeStamp,
                                 UInt32 inBusNumber,
                                 UInt32 inNumberFrames,
                                 AudioBufferList *ioData)
{
    UInt32 maxSamples = kAudioBufferNumFrames;

    UInt32 log2n = log2f(maxSamples); //bins
    UInt32 n = 1 << log2n;

    UInt32 stride = 1;
    UInt32 nOver2 = n/2;

    COMPLEX_SPLIT   A;
    float          *originalReal, *obtainedReal, *frequencyArray, *window, *in_real;

    in_real = (float *) malloc(maxSamples * sizeof(float));

    A.realp = (float *) malloc(nOver2 * sizeof(float));
    A.imagp = (float *) malloc(nOver2 * sizeof(float));
    memset(A.imagp, 0, nOver2 * sizeof(float));

    obtainedReal = (float *) malloc(n * sizeof(float));
    originalReal = (float *) malloc(n * sizeof(float));
    frequencyArray = (float *) malloc(n * sizeof(float));

    //-- window

    UInt32 windowSize = maxSamples;
    window = (float *) malloc(windowSize * sizeof(float));

    memset(window, 0, windowSize * sizeof(float));
    //    vDSP_hann_window(window, windowSize, vDSP_HANN_DENORM);

    vDSP_blkman_window(window, windowSize, 0);

    vDSP_vmul(ioBuffer, 1, window, 1, in_real, 1, maxSamples);

    //-- window

    vDSP_ctoz((COMPLEX*)in_real, 2, &A, 1, maxSamples/2);

    vDSP_fft_zrip(fftSetup, &A, stride, log2n, FFT_FORWARD);
    vDSP_fft_zrip(fftSetup, &A, stride, log2n, FFT_INVERSE);

    float scale = (float) 1.0 / (2 * n);

    vDSP_vsmul(A.realp, 1, &scale, A.realp, 1, nOver2);
    vDSP_vsmul(A.imagp, 1, &scale, A.imagp, 1, nOver2);

    vDSP_ztoc(&A, 1, (COMPLEX *) obtainedReal, 2, nOver2);
    vDSP_zvmags(&A, 1, obtainedReal, 1, nOver2);

    Float32 one = 1;
    vDSP_vdbcon(obtainedReal, 1, &one, obtainedReal, 1, nOver2, 0);

    for (int i = 0; i < nOver2; i++) {
        frequencyArray[i] = obtainedReal[i];
    }


    // Extract the maximum value
    double fftMax = 0.0;
    vDSP_maxmgvD((double *)obtainedReal, 1, &fftMax, nOver2);

    float max = sqrt(fftMax);
}

播放一些音乐，我得到从-96db到0db的值。在此绘制一个点:

CGPointMake(i, kMaxSpectrumHeight * (1 - frequencyArray[i]/-96.));

我的曲线看起来相当圆滑：

图1

如果我不把它转换为分贝，我可以通过将数组值乘以10000来绘制出漂亮的峰值。

图2

我是不是做错了什么？如何显示可变数量的条形图？

- user2173177

只是想知道：你有最终呈现条形图的代码吗？我很难从下面的答案中知道该去哪里。 - keji

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- buildsucceeded · Accepted Answer

我需要对一系列频率的幅度值进行平均吗？还是它们只显示特定频率条的幅度？

是的，您绝对需要平均定义的频段上的值。仅显示一个FFT bin是不合理的。

另外，我需要将幅度值转换为db吗？

是的：dB是对数刻度。不巧的是，人类听觉也（粗略地）在对数刻度上工作。因此，在绘制它们之前，如果您对值取log2()，则该值将对人类更自然。

如何将我的数据映射到某个范围？我是否要根据声音位深度的最大db范围映射？获取bin的最大值将导致最大映射值跳动。

我发现最简单的做法（至少在概念上）是将您的值从任何格式转换为0..1，即“标准化和缩放”的浮点值。然后，从那里，您可以根据需要将其转换为您需要绘制的内容。例如：

SInt16 rawValue = fft[0]; // let's say this comes back as 12990

float scaledValue = rawValue/32767.; // This is MAX_INT for 16-bit;
        // dividing we get .396435438 which is much easier for most people
        // to see conceptually as 39% of our max possible value

float displayValue = log2(scaledValue);

my_fft[0] = displayValue;