使用AudioRecord实现Android音频FFT以检测特定频率的幅度值

Question

使用AudioRecord实现Android音频FFT以检测特定频率的幅度值

39

我目前正在尝试使用Android来检测通过手机麦克风播放的特定音频频率范围。我已经使用AudioRecord类设置了该类：

int channel_config = AudioFormat.CHANNEL_CONFIGURATION_MONO;
int format = AudioFormat.ENCODING_PCM_16BIT;
int sampleSize = 8000;
int bufferSize = AudioRecord.getMinBufferSize(sampleSize, channel_config, format);
AudioRecord audioInput = new AudioRecord(AudioSource.MIC, sampleSize, channel_config, format, bufferSize);

随后，音频被读取：

short[] audioBuffer = new short[bufferSize];
audioInput.startRecording();
audioInput.read(audioBuffer, 0, bufferSize);

由于我在这个领域几乎没有经验，所以我在执行FFT时遇到了问题。我一直在尝试使用这个类：

Java中的FFT和相应的复数类

然后我发送以下值：

Complex[] fftTempArray = new Complex[bufferSize];
for (int i=0; i<bufferSize; i++)
{
    fftTempArray[i] = new Complex(audio[i], 0);
}
Complex[] fftArray = fft(fftTempArray);

我可能误解了这个类的工作方式，但返回的值跳来跳去，即使在静音状态下也不代表一致的频率。有人知道如何执行此任务吗？或者我是不是过于复杂化了问题，试图仅获取少量的频率范围而不是将其绘制为图形表示？

- user723060

11

嘿，如果你想通了，能否请你发布最终版本的代码？谢谢。 - Stefan Alexandru

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- shams · Accepted Answer

首先，您需要确保所得到的结果已正确转换为float/double类型。我不确定short[]版本如何工作，但byte[]版本仅返回原始字节版本。然后，该字节数组需要被正确地转换为浮点数。用于转换的代码应该类似于以下内容：

    double[] micBufferData = new double[<insert-proper-size>];
    final int bytesPerSample = 2; // As it is 16bit PCM
    final double amplification = 100.0; // choose a number as you like
    for (int index = 0, floatIndex = 0; index < bytesRecorded - bytesPerSample + 1; index += bytesPerSample, floatIndex++) {
        double sample = 0;
        for (int b = 0; b < bytesPerSample; b++) {
            int v = bufferData[index + b];
            if (b < bytesPerSample - 1 || bytesPerSample == 1) {
                v &= 0xFF;
            }
            sample += v << (b * 8);
        }
        double sample32 = amplification * (sample / 32768.0);
        micBufferData[floatIndex] = sample32;
    }

使用 micBufferData[] 函数创建输入的复数数组。

获得结果后，使用结果中复数的幅值。大多数幅值应该接近于零，除了具有实际值的频率。

你需要采样频率将数组索引转换为这些幅值对应的频率：

private double ComputeFrequency(int arrayIndex) {
    return ((1.0 * sampleRate) / (1.0 * fftOutWindowSize)) * arrayIndex;
}