寻找一个实现或库(最好是Java),可以将Unicode文本(例如下面的文本)转换为相应的ASCII英文字符:
最终目标是进行音标/模糊匹配,然而我认为一旦字符变成实际的ASCII英语,这将变得容易。
下面应该转换成:ʀᴇɢɪꜱᴛʀᴀᴛɪᴏɴ
请注意,还有其他可能要转换的字符,例如“cσdє”。REGISTRATION
最终目标是进行音标/模糊匹配,然而我认为一旦字符变成实际的ASCII英语,这将变得容易。
replaceAll
函数即可。 - Ben