CMUdict适用于英语,但如果我想要计算其他语言中内容的音节数呢?
nltk
周围搜索并查找您能找到的内容。你肯定不能以一般的方式处理所有语言,因为不同的语言将声音呈现为文本的方式是不同的。
例如,匈牙利语单词“vagy”对于英语说话者来说看起来像两个音节,但实际上只有一个音节。而英语单词“bike”在许多其他语言的说话者看来自然会被读作两个音节。
此外,对于英语,即使有字典,你也很难做到非常准确,因为英语的拼写变化非常奇怪。例如,我们发音“poet”中的“oe”为两个不同的音节,但在“does”中只有一个音节。这在其他一些语言中也可能是正确的。
eq-ual
还是e-qual
?这似乎很明显,但实际上并不是。当然,这还没有触及英语正字法的问题,比如单词huge
——2个“元音”字母,但只有1个音节。 - jdotjdot