奇怪的分支性能

Question

奇怪的分支性能

21

我的基准测试结果表明，在分支概率为15%（或85%）时性能最差，而非50%。

有任何解释吗？

这段代码太长了，但相关部分在这里：

private int diff(char c) {
    return TABLE[(145538857 * c) >>> 27] - c;
}

@Benchmark int timeBranching(int reps) {
    int result = 0;
    while (reps-->0) {
        for (final char c : queries) {
            if (diff(c) == 0) {
                ++result;
            }
        }
    }
    return result;
}

它计算给定字符串中BREAKING_WHITESPACE字符的数量。当分支概率达到约0.20时，结果显示了突然的时间下降（性能增加）。

有关下降的详细信息。改变种子显示更多奇怪的事情发生。请注意，表示最小和最大值的黑线非常短，除了靠近悬崖的地方。

cliff

- maaartinus

10

我感觉有个连续踩问题的人，甚至可能有两个。如果你有意见，请在评论中说明问题所在，不要讲解释。 - maaartinus

2

我认为我喜欢这个问题。我对答案很感兴趣。 - Pankaj

1

请给出下投票者的原因解释..!! - akki0996

3

可能是因为代码是链接而不是直接发布，并且没有任何上下文信息。这只是我的猜测。 - Durandal

@Vivin Paliath：你能重现我的结果吗？我已经尝试了不同的种子和一切……看起来JIT做错了，你能确认一下吗？ - maaartinus

显示剩余21条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- maaartinus · Accepted Answer

看起来像是一个小的JIT错误。对于一个小的分支概率，它会生成类似下面这样的东西，由于展开而变得更加复杂（我简化了很多）：

movzwl 0x16(%r8,%r10,2),%r9d

获取字符：int r9d = queries[r10]

imul   $0x8acbf29,%r9d,%ebx

乘法： ebx = 145538857 * r9d

shr    $0x1b,%ebx

移位操作：ebx >>>= 27

cmp    %edx,%ebx
jae    somewhere

检查边界：if (ebx>edx || ebx<0) goto somewhere（并在那里抛出IndexOutOfBoundsException异常）。

cmp    %r9d,%ebx
jne    back

如果不相等则跳转回循环开头： if (r9d != ebx) goto back

inc    %eax

增加结果： eax++

jne    back

简单地说，goto back

我们可以看到一件聪明的事情和一件愚蠢的事情：

通过单个无符号比较，可以最优地完成边界检查。
这完全是多余的，因为x >>> 27始终为正且小于表长度（32）。

对于分支概率高于20％的情况，这三条指令

cmp    %r9d,%ebx
jne    back
inc    %eax

被类似于某物所取代

mov    %eax,%ecx   // ecx = result
inc    %ecx        // ecx++
cmp    %r9d,%ebx   // if (r9b == index)
cmoveq %ecx,%ebx   //    result = ecx

使用条件移动指令。这是一条额外的指令，但没有分支，因此没有分支预测错误的惩罚。

这解释了20-80%范围内非常恒定的时间。20%以下的斜坡明显是由于分支预测错误造成的。

因此，看起来JIT未能使用正确的阈值，约为0.04而不是0.18。

thr