一些字符,例如Unicode字符'LATIN SMALL LETTER C WITH CARON'可以编码为
更多信息请参见:http://www.fileformat.info/info/unicode/char/10d/index.htm 我想知道是否有一个库可以将'LATIN SMALL LETTER C'+'COMBINING CARON'转换为'LATIN SMALL LETTER C WITH CARON'。或者是否有一个包含这些转换的表格?
0xC4 0x8D
,但也可以用'LATIN SMALL LETTER C'和'COMBINING CARON'的两个码点来表示,即0x63 0xcc 0x8c
。更多信息请参见:http://www.fileformat.info/info/unicode/char/10d/index.htm 我想知道是否有一个库可以将'LATIN SMALL LETTER C'+'COMBINING CARON'转换为'LATIN SMALL LETTER C WITH CARON'。或者是否有一个包含这些转换的表格?
unicode_utils
将其转换为NFC形式,但这并不能实现您想要的,因为您想要的是不可能的。 - tchrist