在Python中是否有一种方法可以不使用字典来计算音节？

Question

3

CMUdict适用于英语，但如果我想要计算其他语言中内容的音节数呢？

- godzilla3000

3个回答

2

通常来说，不行。对于某些语言，可能会有词典，但如果您没有词典，就需要了解这些语言的语言结构。单词如何分成音节因语言而异。

- BrenBarn

0

你肯定不能以一般的方式处理所有语言，因为不同的语言将声音呈现为文本的方式是不同的。

例如，匈牙利语单词“vagy”对于英语说话者来说看起来像两个音节，但实际上只有一个音节。而英语单词“bike”在许多其他语言的说话者看来自然会被读作两个音节。

此外，对于英语，即使有字典，你也很难做到非常准确，因为英语的拼写变化非常奇怪。例如，我们发音“poet”中的“oe”为两个不同的音节，但在“does”中只有一个音节。这在其他一些语言中也可能是正确的。

- Ben

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jdotjdot · Accepted Answer

这取决于语言。这可能听起来是一个显而易见的答案，但它最终取决于拼写方式的设计。在英语中，音节与单词的书写方式基本独立，因此需要使用字典。许多其他语言也是如此。

然而，某些其他语言（例如（南）韩语，日语平假名和片假名（但不包括汉字））的书写方式使字符本身明显与一个音节或特定数量的音节匹配。在这种情况下，如果您知道这些语言的工作原理，您理论上可以使用Python将书写分解为音节。

否则，您需要使用字典或其他处理此项工作的编译平台。请在nltk周围搜索并查找您能找到的内容。