从MFCC训练GMM的库

Question

从MFCC训练GMM的库

4

我正在尝试使用MFCC、它们的delta和delta-delta来从语音中构建基本情感检测器。许多论文都提到通过对这些特征进行GMMs训练可以获得良好的准确性。

我似乎找不到一个现成的软件包来完成同样的事情。我在Python中使用了scilearn，在Matlab中使用了Voicebox和类似的工具包，以及在R中使用了rmixmod、stochmod、mclust、mixtools和其他一些软件包来进行实验。哪个库是从训练数据中计算GMMs的最佳选择？

- Dony George

你所说的“最好”是什么意思？你已经指出了一些在R中进行高斯混合建模的包，还有其他的在这里http://cran.r-project.org/web/views/Cluster.html（下次请在使用首字母缩写时先定义它们！！） - dickoa

2个回答

0

如果您想使用Python，则可以使用著名的语音识别工具包Sphinx中的代码。

http://sourceforge.net/p/cmusphinx/code/HEAD/tree/trunk/sphinxtrain/python/cmusphinx/gmm.py

- emesday

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Lalin · Accepted Answer

挑战性问题在于训练数据中嵌入了情感信息，这些信息被封装在特征集中。测试信号中应使用封装情感的相同特征。使用GMM进行测试的效果取决于通用背景模型的好坏。根据我的经验，通常情况下，使用GMM只能区分男女和少数独特的说话者。仅仅将MFCC输入到GMM中是不够的，因为GMM不包含时间变化的信息。由于情感语音包含时间变化的参数，如音高和一段时间内的音高变化以及频率变化的MFCC参数，所以需要更多的处理。我并不是说现有技术不可能，但是这是一个具有挑战性的好问题。