从wav文件中提取频率Python

Question

从wav文件中提取频率Python

pythonnumpyaudio

3

我熟悉Python，但对NumPy不太了解，如果我有错，请谅解。

我正在尝试读取一个包含多个频率（由静音分隔）的.wav文件。到目前为止，我已经能够读取值并找到文件中存在声音的各个部分。然后，我正在尝试找到离散余弦变换并从中计算频率（参考：如何在Python中提取与FFT值相关联的频率）

但是，我遇到了一个错误：

索引46392超出了大小为25的轴0的范围

这是我的代码：

import wave
import struct
import numpy as np

def isSilence(windowPosition):
    sumVal = sum( [ x*x for x in sound[windowPosition:windowPosition+windowSize+1] ] )
    avg = sumVal/(windowSize)
    if avg <= 0.0001:
        return True
    else:
        return False

#read from wav file
sound_file = wave.open('test.wav', 'r')
file_length = sound_file.getnframes()
data = sound_file.readframes(file_length)
sound_file.close()
#data = struct.unpack("<h", data)
data = struct.unpack('{n}h'.format(n=file_length), data)
sound = np.array(data)
#sound is now a list of values

#detect silence and notes
i=0
windowSize = 2205
windowPosition = 0
listOfLists = []
listOfLists.append([])
maxVal = len(sound) - windowSize
while True:
    if windowPosition >= maxVal:
        break
    if not isSilence(windowPosition):
        while not isSilence(windowPosition):
            listOfLists[i].append(sound[windowPosition:windowPosition+ windowSize+1])
            windowPosition += windowSize
        listOfLists.append([]) #empty list
        i += 1
    windowPosition += windowSize

frequencies = []
#Calculating the frequency of each detected note by using DFT
for signal in listOfLists:
    if not signal:
        break
    w = np.fft.fft(signal)
    freqs = np.fft.fftfreq(len(w))
    l = len(signal)

    #imax = index of first peak in w
    imax = np.argmax(np.abs(w))
    fs = freqs[imax]

    freq = imax*fs/l
    frequencies.append(freq)

print frequencies

编辑：以下是错误回溯信息：

Traceback (most recent call last):
  File "final.py", line 61, in <module>
    fs = freqs[imax]
IndexError: index 46392 is out of bounds for axis 0 with size 21

- Nikhil Sardana

2

我遇到了一个错误：...请在你的问题中包含完整的错误信息（即完整的回溯）。回溯显示哪一行触发了错误。 - Warren Weckesser

@WarrenWeckesser 好的。引起错误的是 fs = freqs[imax] 这行代码。在我提供的链接中，傅里叶变换是一维的。但我的测试文件给出了一个多维的列表。 - Nikhil Sardana

可能是多声道（立体声）？如果是的话，通过取两个通道的平均值来将其降为单声道。 - Ahmed Fasih

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nikhil Sardana · Answer 1

问题在于我假设listOfLists实际上是一个列表的列表，但实际上它是一个列表的列表的列表。这一行代码：

        listOfLists[i].append(sound[windowPosition:windowPosition+ windowSize+1])

每次都在追加一个列表，但我以为它是在将元素追加到现有列表中。

例如，如果listOfLists是：

[ [1,2,3] ]

然后，listOfLists [0] .append（[4,5,6]）将给出：

[ [ [1,2,3],[4,5,6] ] ]

但我原本期望的是：

[ [1,2,3,4,5,6] ]

用下面的代码替换有问题的那一行对我起了作用：

for v in sound[windowPosition:windowPosition+windowSize+1]:
            listOfLists[i].append(v)