我正在尝试用 Python 创建一个图形频谱分析器。
目前,我正在读取 16 位双声道 44,100 Hz 采样率音频流的 1024 字节,并将两个通道的振幅平均值相加。现在我有了一个由 256 个带符号短整数组成的数组。接下来,我想使用类似 numpy 的模块对该数组执行 fft 并使用结果创建图形频谱分析器,首先只会包含 32 条条形图。
我已阅读过快速傅里叶变换(FFT)和离散傅里叶变换(DFT)的维基百科文章,但仍不清楚结果数组代表什么。使用 numpy 对我的数组执行 fft 后,数组看起来像这样:
[ -3.37260500e+05 +0.00000000e+00j 7.11787022e+05 +1.70667403e+04j
4.10040193e+05 +3.28653370e+05j 9.90933073e+04 +1.60555003e+05j
2.28787050e+05 +3.24141951e+05j 2.09781047e+04 +2.31063376e+05j
-2.15941453e+05 +1.63773851e+05j -7.07833051e+04 +1.52467334e+05j
-1.37440802e+05 +6.28107674e+04j -7.07536614e+03 +5.55634993e+03j
-4.31009964e+04 -1.74891657e+05j 1.39384348e+05 +1.95956947e+04j
1.73613033e+05 +1.16883207e+05j 1.15610357e+05 -2.62619884e+04j
-2.05469722e+05 +1.71343186e+05j -1.56779748e+04 +1.51258101e+05j
-2.08639913e+05 +6.07372799e+04j -2.90623668e+05 -2.79550838e+05j
-1.68112214e+05 +4.47877871e+04j -1.21289916e+03 +1.18397979e+05j
-1.55779104e+05 +5.06852464e+04j 1.95309737e+05 +1.93876325e+04j
-2.80400414e+05 +6.90079265e+04j 1.25892113e+04 -1.39293422e+05j
3.10709174e+04 -1.35248953e+05j 1.31003438e+05 +1.90799303e+05j...
我想知道这些数字具体代表什么,以及如何将这些数字转换为32个条形图每个条形的高度的百分比。另外,我是否应该将2个通道平均起来?