大量长整型映射的最快方法

Question

大量长整型映射的最快方法

4

我正在编写一个将数字（long）转换为一小组结果对象的Java应用程序。这个映射过程对于应用程序的性能非常关键，因为它经常需要使用。

public static Object computeResult(long input) {
    Object result;
    // ... calculate
    return result;
}

大约有1.5亿个不同的键对象和约3,000个不同的值。

从输入数字（长整型）到输出（不可变对象）的转换可以使用我的算法计算，每秒可以进行4,000,000次转换。（使用4个线程）

我想缓存这150M个可能输入的映射，以使翻译速度更快，但我发现创建这样的缓存存在一些困难：

public class Cache {
    private static long[] sortedInputs; // 150M length
    private static Object[] results; // 150M length

    public static Object lookupCachedResult(long input) {
        int index = Arrays.binarySearch(sortedInputs, input);
        return results[index];
    }
}

我试图创建两个长度为150M的数组。第一个数组包含所有可能的输入long型数据，并且按数字顺序排列。第二个数组则在对应于第一个数组输入的索引处持有对3000个不同、预先计算的结果对象之一的引用。

为了获取缓存结果，我在第一个数组上进行二分搜索以获取输入数字。然后在第二个数组中的同一索引处查找缓存结果。

遗憾的是，这种缓存方法并没有比计算结果更快。即使使用了4个线程，每秒只能进行约1.5M次查找。

有人能想到一种在这种情况下更快的缓存结果的方法吗？

我怀疑，在平均工作站上，没有数据库引擎能够每秒处理超过4,000,000次查询。

- andre.r

1

你尝试过使用 TreeMap<Long, Object> 吗？而且你的缓存几乎是只读的，对吧？ - Jason Hu

3

我认为使用HashMap比TreeMap更合适——因为没有必要对键进行排序。查找应该是O(1)，所以理论上不受大小的影响。 - Boris the Spider

4M/sec是一个相当大的数字，我怀疑你的算法不够复杂，以至于成为了瓶颈。想一想，每个对象500个时钟周期并不算多。你的程序之所以慢，是因为数据集很大。如果你想让你的应用程序看起来响应迅速，还有其他技术可以使用。 - Jason Hu

@BoristheSpider：与普遍观念相反，HashMap的最坏时间复杂度为*O(n)，但平均复杂度为O(1)*。 - Willem Van Onsem

1

我会选择HashMap而不是TreeMap来获得更快的速度，因为TreeMap本质上与在数组上使用二分查找相同。 - neuronaut

显示剩余4条评论

2个回答

1

大约有150,000,000个不同的关键对象，以及大约3,000个不同的值。

由于只有少量的值，您应该确保它们得到重复使用（除非它们是相当小的对象）。为此，Interner非常适合（尽管您可以运行自己的）。

我尝试了哈希映射和树映射，但两者都遇到了OutOfMemoryError。

它们都有巨大的内存开销。而且使用TreeMap没有太多意义，因为它使用了一种二进制搜索，而您已经尝试过了。

至少有三种长整型到对象映射的实现可用，可以在Google上搜索“primitive collections”。这应该比您的两个数组稍微使用更多的内存。由于哈希通常为O（1）（让我们忽略最坏情况，因为没有理由发生，是吗？）并且具有更好的内存局部性，它将以20倍的速度打败(*)二分查找。您的二分查找需要log2（150e6），即大约27个步骤，并且哈希可能平均需要两个步骤。这取决于您如何紧密地打包哈希表；这通常是在创建时给出的参数。

如果您运行自己的哈希表（您很可能不应该这样做），我建议使用大小为1 << 28的数组，即268435456个条目，以便您可以使用位操作进行索引。

(*) 这样的预测很困难，但我相信值得一试。

- maaartinus

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- stewori · Accepted Answer

这里需要使用哈希算法，但我建议避免使用HashMap，因为它只能处理对象，即每次插入long时必须构建一个Long对象，这可能会导致速度变慢。也许由于JIT的缘故，性能问题不是很明显，但我建议至少尝试以下方法，并将其与HashMap变体的性能进行比较：

将长整型保存在长度大于3000的长整型数组中，并通过一个非常简单（因此高效）的哈希函数手动进行哈希，例如index = key % n。由于您事先知道了3000个可能的值，因此可以经验性地找到一个数组长度n，使得这个简单的哈希函数不会引起冲突。因此，您可以避免重新哈希等操作，并获得真正的O(1)性能。

其次，我建议您查看Java数值库，例如

两者都由本地Lapack和BLAS实现支持，通常由非常聪明的人高度优化。也许您可以通过矩阵/向量代数的术语来制定算法，以便一次性（或分块）计算整个长数组。