我有很多干净音频文件,只包含普通话口语。我需要估算每个文件中说了多少个音节。是否有适用于OS X、Windows或Linux的工具可以估算这些音节数?
sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18
由于有很多文件,因此最好使用命令行或批处理软件,例如:
$ application sample01.wav
15
- 使用语音转文字技术,然后统计字符数量的解决方案是合适的。
我有很多干净音频文件,只包含普通话口语。我需要估算每个文件中说了多少个音节。是否有适用于OS X、Windows或Linux的工具可以估算这些音节数?
sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18
由于有很多文件,因此最好使用命令行或批处理软件,例如:
$ application sample01.wav
15
语音自动分割是一个活跃的科学领域,这意味着没有一种方法能够完美地运作。
2009年,de Jong和Wempe提出了一种使用Praat自动检测人类语音信号中音节的方法。该方法与人工分割相比效果良好,并已被应用于许多第三方科学研究。您可以在他们的科学文章(pdf)中找到该方法的详细描述,以及对先前提出的方法的历史背景。Praat脚本本身和几个教程可以在专门的网站上找到(www - speechrate)。
您还可能对由Harma开发的另一种分割算法感兴趣,该算法已在Matlab中实现(Harma Syllable Segmentation)。
http://www.annosoft.com/lipsync-sdks
这个库也可以用于SDK评估...