我正在寻找一种方法,可以将任何语言的Unicode字母字符转换为带有重音的拉丁字母。目的是使外国人能够了解任何非拉丁文字写成的名称和单词的发音。
示例:
希腊语:Romanize("Αλφαβητικός")
返回 "Alphabētikós"
(或 "Alfavi̱tikós")
日语:Romanize("しんばし")
返回 "shimbashi"
(或 "sinbasi")
俄语:Romanize("яйца Фаберже")
返回 "yaytsa Faberzhe"
(或 "jajca Faberže")
它应该支持以下脚本中的字符:CJK、Indic、Cyrillic、Semitic 和 Greek。它应该是数据驱动和可扩展的,使用来自 Unicode Consortium、美国、欧盟或联合国的数据。代码应该是开源的,用 .NET 或 Java 编写。
是否存在这样的库?