如何使用Python将.mp3文件转换为频率和振幅数组?

9

我想设计一个神经网络,经过训练后,可以将.mp3文件作为输入,并根据训练结果,在1-10的范围内决定音乐的好坏。但是为了做到这一点,我需要将音频文件转换为波长、频率、振幅以及定义音乐所需的所有其他参数的数组,然后将这些数组用作神经网络的输入。我应该如何解决这个问题?

1个回答

9

如果您将.mp3文件转换为.wav文件,您可以做到以下操作:

from scipy.io import wavfile as wav
from scipy.fftpack import fft
import numpy as np
rate, data = wav.read('music.wav')
fft_out = fft(data)

来源:http://www.dummies.com/programming/python/performing-a-fast-fourier-transform-fft-on-a-sound-file/

本文将介绍如何使用 Python 进行音频文件的快速傅里叶变换(FFT)。FFT 是一种用于分析信号的技术,可以将一个信号分解成其组成频率的幅度和相位。在音频处理中,FFT 可以帮助我们了解音频信号的频率特征,例如音高和谐波。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接