我正在尝试在Java中解码一些UTF-8字符串。 这些字符串包含一些组合Unicode字符,例如CC 88(组合分音符)。 根据http://www.fileformat.info/info/unicode/char/0308/index.htm,字符序列似乎没问题。
但是转换为字符串后输出无效。 有什么想法吗?
byte[] utf8 = { 105, -52, -120 };
System.out.print("{{");
for(int i = 0; i < utf8.length; ++i)
{
int value = utf8[i] & 0xFF;
System.out.print(Integer.toHexString(value));
}
System.out.println("}}");
System.out.println(">" + new String(utf8, "UTF-8"));
Output:
{{69cc88}} >i?