我有一大批文件,想使用CMU Sphinx 4进行识别。 Sphinx需要以下格式:
现在我正在尝试使用ffmpeg。命令
有人能告诉我如何将音频文件转换为CMU Sphinx 4所需的格式吗?
- 16 khz
- 16 bit
- 单声道
- 小端
AudioSystem.getAudioInputStream(File)
抛出一个UnsupportedAudioFileException
,而且我无法找出原因,所以我就放弃了。现在我正在尝试使用ffmpeg。命令
ffmpeg -i input.mp3 -ac 1 -ab 16 -ar 16000 output.wav
似乎可以完成任务(除了小端),但是当我用Audacity检查输出时,它仍然标记为“32位浮点数”。我在this site上找到的命令也使用-acodec pcm_s16le
,从其名称中看来,它输出16位小端;但是,Audacity仍然告诉我输出是32位浮点数
。有人能告诉我如何将音频文件转换为CMU Sphinx 4所需的格式吗?