public static void main(String[] args) {
String s = "";
for(int i=0 ; i<10000 ; i++) {
s += "really ";
}
s += "long string.";
}
(是的,我知道更好的实现方法应该使用
StringBuilder
,但请忍耐一下。)微不足道的是,我们可能期望生成的字节码类似于以下内容:
public static void main(java.lang.String[]);
Code:
0: ldc #2 // String
2: astore_1
3: iconst_0
4: istore_2
5: iload_2
6: sipush 10000
9: if_icmpge 25
12: aload_1
13: ldc #3 // String really
15: invokevirtual #4 // Method java/lang/String.concat:(Ljava/lang/String;)Ljava/lang/String;
18: astore_1
19: iinc 2, 1
22: goto 5
25: aload_1
26: ldc #5 // String long string.
28: invokevirtual #4 // Method java/lang/String.concat:(Ljava/lang/String;)Ljava/lang/String;
31: astore_1
32: return
然而,编译器会尝试变得更加智能 - 它不使用 concat 方法,而是内置了优化来使用 StringBuilder
对象,因此我们得到以下结果:
public static void main(java.lang.String[]);
Code:
0: ldc #2 // String
2: astore_1
3: iconst_0
4: istore_2
5: iload_2
6: sipush 10000
9: if_icmpge 38
12: new #3 // class java/lang/StringBuilder
15: dup
16: invokespecial #4 // Method java/lang/StringBuilder."<init>":()V
19: aload_1
20: invokevirtual #5 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
23: ldc #6 // String really
25: invokevirtual #5 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
28: invokevirtual #7 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
31: astore_1
32: iinc 2, 1
35: goto 5
38: new #3 // class java/lang/StringBuilder
41: dup
42: invokespecial #4 // Method java/lang/StringBuilder."<init>":()V
45: aload_1
46: invokevirtual #5 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
49: ldc #8 // String long string.
51: invokevirtual #5 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
54: invokevirtual #7 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
57: astore_1
58: return
然而,这对我来说似乎相当低效 - 而不是为整个循环使用一个字符串构建器,每个单独的连接操作都会创建一个字符串构建器,使其等同于以下内容:
public static void main(String[] args) {
String s = "";
for(int i=0 ; i<10000 ; i++) {
s = new StringBuilder().append(s).append("really ").toString();
}
s = new StringBuilder().append(s).append("long string.").toString();
}
现在,编译器不再使用原来简单的方法创建大量字符串对象并将它们丢弃,而是采用了更差的方法创建了大量的String对象、StringBuilder对象,调用了更多的方法,并仍然将它们全部丢弃以生成与没有进行此优化相同的输出。
那么问题就是——为什么?我理解在像这样的情况下:
String s = getString1() + getString2() + getString3();
...编译器将为所有三个字符串创建一个 StringBuilder
对象,因此在某些情况下,优化是有用的。然而,检查字节码会发现即使将上述情况分开为以下情况:
String s = getString1();
s += getString2();
s += getString3();
这意味着我们回到了三个StringBuilder
对象各自创建的情况。如果这些是奇怪的边角案例,我会理解的,但在循环中以这种方式附加字符串确实是非常常见的操作。
毫无疑问,在编译时确定由编译器生成的StringBuilder
是否仅附加一个值是微不足道的,如果是这种情况,则使用简单的连接操作即可?
这全部都是在8u5中(然而,它至少可以追溯到Java 5,可能更早)。对于我的基准测试(不出所料),手动concat()
方法比使用带有10,000个元素的循环的+=
方法快2x3倍。当然,使用手动StringBuilder
始终是首选方法,但是编译器肯定不应该对+=
方法的性能产生不利影响吧?