在任何机器学习应用中,过程都很简单:收集样本,设计特征,训练分类器。对于样本,您可以使用嘈杂的录音,或者您可以在网络声音收藏(如freesound.org)中找到许多噪声。对于特征,您可以使用均值归一化的Mel频率系数,您可以在CMUSphinx语音识别工具包中找到实现。对于分类器,您可以选择GMM或SVM。如果您有足够的数据,它将运行得相当不错。为了提高准确性,您可以添加假设,即噪声和语音是连续的,因此您可以使用挂起方案(基本上是HMM)分析检测历史记录以检测语音块,而不是对每个帧进行分析。