假设你想要使用CMU音素数据集,其输入格式如下:
ABERRATION AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS AE2 B ER0 EY1 SH AH0 N Z
ABERT AE1 B ER0 T
ABET AH0 B EH1 T
ABETTED AH0 B EH1 T IH0 D
ABETTING AH0 B EH1 T IH0 NG
ABEX EY1 B EH0 K S
ABEYANCE AH0 B EY1 AH0 N S
左边是单词,右边是一系列音素,点击这里。
你想将它作为训练数据,用于机器学习系统中,猜测新单词在英语中的发音。
至少对我来说,并不明显,因为没有固定的字母令牌大小可以与音素相对应。我有一种感觉,马尔科夫链可能是正确的方法。
您会如何处理这个问题?