这可能是一个非常愚蠢的问题,但我无法在任何地方找到详细信息。
我有一个持续3秒钟的音频录音(wav文件)。这是我的样本,需要将其分类为[class_A]或[class_B]。
按照MFCC教程的指导,我将样本分成了帧(确切地说是291帧),并从每个帧中获取了MFCC。
现在我有了291个特征向量,每个向量的长度为13。
我的问题是:您如何使用分类器(例如k-NN)来使用这些向量?我有291个代表1个样本的向量。我知道如何处理1个向量的1个样本,但如果我有291个向量,我不知道该怎么办。我真的找不到任何解释。
我有一个持续3秒钟的音频录音(wav文件)。这是我的样本,需要将其分类为[class_A]或[class_B]。
按照MFCC教程的指导,我将样本分成了帧(确切地说是291帧),并从每个帧中获取了MFCC。
现在我有了291个特征向量,每个向量的长度为13。
我的问题是:您如何使用分类器(例如k-NN)来使用这些向量?我有291个代表1个样本的向量。我知道如何处理1个向量的1个样本,但如果我有291个向量,我不知道该怎么办。我真的找不到任何解释。