有人能解释一下如何使用加速框架将音量转换为分贝的代码吗?

12

我正在使用EZAudio构建iOS应用程序。它的代理返回一个float **缓冲区,其中包含指示检测到的音量的浮点值。此代理会不断地调用,并在不同的线程中完成其工作。

我试图做的是将EZAudio中的浮点值转换为分贝。


EZAudioDelegate

这是我简化过的获取麦克风数据的EZAudio代理

- (void)microphone:(EZMicrophone *)microphone hasAudioReceived:(float **)buffer withBufferSize:(UInt32)bufferSize withNumberOfChannels:(UInt32)numberOfChannels {
    /*
     *  Returns a float array called buffer that contains the stereo signal data
     *  buffer[0] is the left audio channel
     *  buffer[1] is the right audio channel
     */

    // Using a separate audio thread to not block the main UI thread
    dispatch_async(dispatch_get_main_queue(), ^{

        float decibels = [self getDecibelsFromVolume:buffer withBufferSize:bufferSize];

        NSLog(@"Decibels: %f", decibels);

    });

}

问题

问题在于我在实施以下链接中的解决方案后,我不理解它是如何工作的。如果有人能够解释一下如何将音量转换为分贝,我会非常感激。


代码

该解决方案使用Accelerate Framework中的以下方法将音量转换为分贝:

以下是从EZAudio委托调用的方法getDecibelsFromVolume。它接收来自委托的float** bufferbufferSize参数。

- (float)getDecibelsFromVolume:(float**)buffer withBufferSize:(UInt32)bufferSize {

    // Decibel Calculation.

    float one = 1.0;
    float meanVal = 0.0;
    float tiny = 0.1;
    float lastdbValue = 0.0;

    vDSP_vsq(buffer[0], 1, buffer[0], 1, bufferSize);

    vDSP_meanv(buffer[0], 1, &meanVal, bufferSize);

    vDSP_vdbcon(&meanVal, 1, &one, &meanVal, 1, 1, 0);


    // Exponential moving average to dB level to only get continous sounds.

    float currentdb = 1.0 - (fabs(meanVal) / 100);

    if (lastdbValue == INFINITY || lastdbValue == -INFINITY || isnan(lastdbValue)) {
        lastdbValue = 0.0;
    }

    float dbValue = ((1.0 - tiny) * lastdbValue) + tiny * currentdb;

    lastdbValue = dbValue;

    return dbValue;
}

你有查看过 Accelerate/vDSP.h 文件了解 vDSP 函数的作用吗? - Ian Ollmann
1个回答

15

我将解释如何使用代码计算信号的分贝值,然后展示它与vDSP示例的关系。

首先,计算一段数据的均方根总和

double sumSquared = 0;
for (int i = 0 ; i < numSamples ; i++)
{
   sumSquared += samples[i]*samples[i];
}
double rms = sumSquared/numSamples;

有关RMS的更多信息,请参阅

接下来将RMS值转换为dB

double dBvalue = 20*log10(rms);

这与示例代码的关系

vDSP_vsq(buffer[0], 1, buffer[0], 1, bufferSize);

这行代码循环遍历缓冲区并计算缓冲区中所有元素的平方。如果在调用之前缓冲区包含值[1,2,3,4],那么调用之后它将包含值[1,4,9,16]

vDSP_meanv(buffer[0], 1, &meanVal, bufferSize);

这一行循环遍历缓冲区,在缓冲区中对值求和,然后返回总和除以元素数量的结果。因此,对于输入缓冲区[1,4,9,16],它计算出总和为30,除以4并返回结果7.5

vDSP_vdbcon(&meanVal, 1, &one, &meanVal, 1, 1, 0);

这行代码将meanVal转换为分贝。在这里调用向量化函数实际上没有意义,因为它只对单个元素进行操作。但它所做的是将参数插入以下公式:

meanVal = n*log10(meanVal/one)

其中n是根据最后一个参数为1020二选一。在这种情况下,它是10。对于功率测量,使用10;对于振幅,则使用20。我认为你应该使用20

代码的最后一小部分似乎在对结果进行简单平滑处理,以使仪表稍微平缓一些。


非常感谢,@jacket!你能解释一下你所说的意思吗:“在这里调用向量化函数实际上没有任何意义,因为它只对单个元素进行操作。”当你说“向量化函数”时,你是指vDSP_vdbcon吗?那么改变会是什么呢? - Jamie
2
我的意思是 vDSP_vdbcon 优化为将值数组转换为 dB,但您的代码仅使用单个浮点数 meanVal 调用它。这并不是毫无意义的,只是像 meanVal = 20*log10(meanVal); 这样编写代码不会带来任何性能上的好处。 - jaket
哦天啊..苹果真的喜欢把事情搞复杂。非常感谢您的解释。 - denisb411

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接