Eclipse详细格式化程序字符串未显示所有Unicode字符。

Question

Eclipse详细格式化程序字符串未显示所有Unicode字符。

javaeclipsejdb

6

我希望在调试器中看到剪贴板符号：(U+1F4CB)。

我理解这两个码点。

其中：

\ud83d 是 ߓ
\u8dccb 是

我希望对其进行详细格式化，以便在Unicode的调试提示中查看。

我的当前详细格式化程序（首选项->Java-Debug->详细格式化程序）如下：

new String(this.getBytes("utf8"), java.nio.charset.Charset.forName("utf8")).concat(" <---")

以上代码仅在详细视图中添加了<---，没有其他效果。

问题1：

我需要哪种格式化程序才能正确显示黄色提示框中的字符？

源代码

import java.nio.charset.Charset;

public class Test {
    public static void main(String[] args) {
        byte[] db = new byte[] { -16, -97, -109, -117 };
        String x = new String(db, Charset.forName("utf8"));
        System.out.println(x);
        return;
    }
}

- Grim

2个回答

0

你的代码和剪贴板表情符在 IntelliJ 2018.1 中运行良好。调试器的变量视图和控制台输出都正常工作。

这不太可能是代码的问题。也许是你在 Eclipse 中使用的字体无法打印出 UTF 表情符号？我想象 Eclipse 在显示工具提示时理解码点的概念。

我在 IntelliJ 中执行的代码：

byte[] db = new byte[] { -16, -97, -109, -117 };
String x = new String(db, Charset.forName("utf8"));
System.out.println(x);
String f = new String(x.getBytes("utf8"), Charset.forName("utf8")).concat(" <---");
System.out.println(f);

并在调试器中观察到以下内容：

- Karol Dowbecki

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Holger · Accepted Answer

“”字符已在Unicode字符集中定义，由于String实例是Unicode字符序列，因此它们可以包含该字符。但它位于基本多文种平面之外，因此处理该字符的软件必须更加小心谨慎。最值得注意的是，它不能尝试将其处理为单个char值，这些值是UTF-16单位，需要将这样的字符处理为代理字符对。

您指定的详细格式化程序为

new String(this.getBytes("utf8"), java.nio.charset.Charset.forName("utf8")) …

这里的问题并不在于this.getBytes("utf8")，它将Unicode String实例转换为使用UTF-8编码的byte[]数组，然后传递给new String(…, Charset.forName("utf8"))构造函数，将字节数组转换回相同的String实例。如果Eclipse的调试器未能呈现原始字符串，则它不会在执行冗余操作后正确地呈现相同的字符串。

通常，如果Eclipse的调试器不能正确呈现包含基本多语言平面之外字符的字符串，则在详细格式化程序中无法修复此问题，因为您在那里执行的所有处理最终都将以String形式呈现，可能需要应用一系列详细格式化程序。因此，最终结果只能是两种选择之一，即删除具有问题字符的String或Eclipse的调试器无法正确呈现的String。

换句话说，这是只能在Eclipse方面解决的错误。