我正在尝试使用Theano进行二进制LSTM分类。我已经查看了示例代码,但我想要构建自己的模型。
我有一小组“Hello”和“Goodbye”录音文件。我通过提取它们的MFCC特征并将这些特征保存在文本文件中进行预处理。我有20个语音文件(每个10个),并为每个单词生成一个文本文件,因此有20个包含MFCC特征的文本文件。每个文件都是一个13x56矩阵。
我的问题是:如何使用这个文本文件来训练LSTM?
我相对较新于此。我已经阅读了一些相关文献,但没有真正理解其概念。欢迎任何使用LSTM的更简单方法。
我有一小组“Hello”和“Goodbye”录音文件。我通过提取它们的MFCC特征并将这些特征保存在文本文件中进行预处理。我有20个语音文件(每个10个),并为每个单词生成一个文本文件,因此有20个包含MFCC特征的文本文件。每个文件都是一个13x56矩阵。
我的问题是:如何使用这个文本文件来训练LSTM?
我相对较新于此。我已经阅读了一些相关文献,但没有真正理解其概念。欢迎任何使用LSTM的更简单方法。