从MFCC训练GMM的库

4
我正在尝试使用MFCC、它们的delta和delta-delta来从语音中构建基本情感检测器。许多论文都提到通过对这些特征进行GMMs训练可以获得良好的准确性。
我似乎找不到一个现成的软件包来完成同样的事情。我在Python中使用了scilearn,在Matlab中使用了Voicebox和类似的工具包,以及在R中使用了rmixmod、stochmod、mclust、mixtools和其他一些软件包来进行实验。哪个库是从训练数据中计算GMMs的最佳选择?

你所说的“最好”是什么意思?你已经指出了一些在R中进行高斯混合建模的包,还有其他的在这里http://cran.r-project.org/web/views/Cluster.html(下次请在使用首字母缩写时先定义它们!!) - dickoa
2个回答

2
挑战性问题在于训练数据中嵌入了情感信息,这些信息被封装在特征集中。测试信号中应使用封装情感的相同特征。使用GMM进行测试的效果取决于通用背景模型的好坏。根据我的经验,通常情况下,使用GMM只能区分男女和少数独特的说话者。仅仅将MFCC输入到GMM中是不够的,因为GMM不包含时间变化的信息。由于情感语音包含时间变化的参数,如音高和一段时间内的音高变化以及频率变化的MFCC参数,所以需要更多的处理。我并不是说现有技术不可能,但是这是一个具有挑战性的好问题。

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接