我知道这个问题已经被问了很多次...但是我对我的结果感到沮丧,所以我想再次询问。在深入研究fft之前,我需要解决这个简单的任务。
我需要检测音频文件中的20赫兹音调。我像图片中那样自己插入了20赫兹音调。(它可以是任何频率,只要听众听不到,所以我认为我应该选择一个大约在20赫兹至50赫兹左右的频率)
关于音频文件的信息。
我跟着这三个教程,编写了一个可以读取音频缓冲区并给出fft doubles的工作代码。 http://blog.bjornroche.com/2012/07/frequency-detection-using-fft-aka-pitch.html
https://github.com/alexbw/iPhoneFFT
如何获取FFT中每个值的频率? 我按照以下方式读取数据:
而我的输出日志则类似于:
我需要检测音频文件中的20赫兹音调。我像图片中那样自己插入了20赫兹音调。(它可以是任何频率,只要听众听不到,所以我认为我应该选择一个大约在20赫兹至50赫兹左右的频率)
关于音频文件的信息。
afinfo 1.m4a
File: 1.m4a
File type ID: adts
Num Tracks: 1
----
Data format: 1 ch, 22050 Hz, 'aac ' (0x00000000) 0 bits/channel, 0 bytes/packet, 1024 frames/packet, 0 bytes/frame
Channel layout: Mono
estimated duration: 8.634043 sec
audio bytes: 42416
audio packets: 219
bit rate: 33364 bits per second
packet size upper bound: 768
maximum packet size: 319
audio data file offset: 0
optimized
format list:
[ 0] format: 1 ch, 22050 Hz, 'aac ' (0x00000000) 0 bits/channel, 0 bytes/packet, 1024 frames/packet, 0 bytes/frame
Channel layout: Mono
----
我跟着这三个教程,编写了一个可以读取音频缓冲区并给出fft doubles的工作代码。 http://blog.bjornroche.com/2012/07/frequency-detection-using-fft-aka-pitch.html
https://github.com/alexbw/iPhoneFFT
如何获取FFT中每个值的频率? 我按照以下方式读取数据:
// If there's more packets, read them
inCompleteAQBuffer->mAudioDataByteSize = numBytes;
CheckError(AudioQueueEnqueueBuffer(inAQ,
inCompleteAQBuffer,
(sound->packetDescs?nPackets:0),
sound->packetDescs),
"couldn't enqueue buffer");
sound->packetPosition += nPackets;
int numFrequencies=2048;
int kNumFFTWindows=10;
SInt16 *testBuffer = (SInt16*)inCompleteAQBuffer->mAudioData; //Read data from buffer...!
OouraFFT *myFFT = [[OouraFFT alloc] initForSignalsOfLength:numFrequencies*2 andNumWindows:kNumFFTWindows];
for(long i=0; i<myFFT.dataLength; i++)
{
myFFT.inputData[i] = (double)testBuffer[i];
}
[myFFT calculateWelchPeriodogramWithNewSignalSegment];
for (int i=0;i<myFFT.dataLength/2;i++) {
NSLog(@"the spectrum data %d is %f ",i,myFFT.spectrumData[i]);
}
而我的输出日志则类似于:
Everything checks out for 4096 samples of data
Set up all values, about to init window type 2
the spectrum data 0 is 42449.823771
the spectrum data 1 is 39561.024361
.
.
.
.
the spectrum data 2047 is -42859933071799162597786649755206634193030992632381393031503716729604050285238471034480950745056828418192654328314899253768124076782117157451993697900895932215179138987660717342012863875797337184571512678648234639360.000000
我知道我还没有计算幅度,但是如何检测声音中是否有20 Hz?我需要学习Goertzel算法吗?