91得票12回答
从Unicode字符中删除变音符号(ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ)。

我正在研究一种算法,能够将带有变音符号(波浪符,抑扬符,插入符,分音符,舌音符)和它们的“简单”字符相互映射。 例如:ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n á --> a ä --> a ấ --> a ṏ -...

55得票6回答
字符翻译使用Python(类似于tr命令)

有没有办法使用Python进行字符翻译/音译(类似于tr命令)? 一些Perl的例子如下: my $string = "some fields"; $string =~ tr/dies/eaid/; print $string; # domi failed $string = 'the...

47得票11回答
如何在Javascript中进行字符映射替换,类似于Perl中的'tr'函数?

我一直在尝试找出如何将字符串中一组字符映射到另一组类似于Perl中tr函数的设置。我发现了这个网站,它展示了JS和Perl中等效的函数,但可惜没有类似的tr函数。Perl中的tr(转换)函数一对一地映射字符,因此 data =~ tr|\-_|+/|; would map - ...

37得票15回答
PHP中的西里尔字母转写

如何将 Cyrillic 字符转换为拉丁字母?E.g. Главная страница -> Glavnaja stranica 这个Transliteration PHP Extension可以非常好地解决这个问题,但我无法在我的服务器上安装它。 最好有一个相同的PHP实现。

27得票10回答
如何将西里尔字母转换为拉丁文本

我有一个方法,可以将任何拉丁文本(例如英语、法语、德语、波兰语)转换成slug形式, 例如:Alpha Bravo Charlie => alpha-bravo-charlie 但它无法处理西里尔文本(例如俄语),因此我想要做的是将西里尔文本转写为拉丁字符,然后再进行slug化。 是否有...

26得票5回答
Unicode文本的罗马化

我正在寻找一种方法,可以将任何语言的Unicode字母字符转换为带有重音的拉丁字母。目的是使外国人能够了解任何非拉丁文字写成的名称和单词的发音。 示例: 希腊语:Romanize("Αλφαβητικός") 返回 "Alphabētikós"(或 "Alfavi̱tikós") 日语:...

25得票2回答
将带重音符号的字符转换为ASCII字符

什么是从1600万个字符串变量向量中删除德语(或法语)口音的最佳方法? 例如:'Sjögren's syndrome' 变成 'Sjogren's syndrome'。 将单个字符转换为单个字符比使用音译更好,如: ä => ae,ö => oe,ü => ue。 例如:使用正则表达...

24得票6回答
将任何可转换为utf8字符的字符转换为ascii等效字符

有没有一个好的解决方案可以以良好的方式进行这种转译? 我尝试使用iconv(),但它非常烦人,并且它的行为不像人们所期望的那样。 使用//TRANSLIT将尝试替换它能够替换的内容,将所有无法转换的内容替换为“?” 使用//IGNORE将不会在文本中留下“?” ,但也不会进行转译,并且在...

23得票4回答
在Python中使用string.translate进行西里尔字母转换?

我在使用Python中的string.maketrans时遇到了UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-51: ordinal not in range(128)异常。我对以下代码(gist...

22得票8回答
使用JavaScript函数将西里尔字母转换为拉丁字母

我写了这个函数: function transliterate(word){ var answer = ""; A = new Array(); A["Ё"]="YO";A["Й"]="I";A["Ц"]="TS";A["У"]="U";A["К"]="K";A[...