_radixSort_0 = [0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
/*
RADIX SORT
Use 256 bins
Use shadow array
- Get counts
- Transform counts to pointers
- Sort from LSB - MSB
*/
function radixSort(intArr) {
var cpy = new Int32Array(intArr.length);
var c4 = [].concat(_radixSort_0);
var c3 = [].concat(_radixSort_0);
var c2 = [].concat(_radixSort_0);
var c1 = [].concat(_radixSort_0);
var o4 = 0; var t4;
var o3 = 0; var t3;
var o2 = 0; var t2;
var o1 = 0; var t1;
var x;
for(x=0; x<intArr.length; x++) {
t4 = intArr[x] & 0xFF;
t3 = (intArr[x] >> 8) & 0xFF;
t2 = (intArr[x] >> 16) & 0xFF;
t1 = (intArr[x] >> 24) & 0xFF ^ 0x80;
c4[t4]++;
c3[t3]++;
c2[t2]++;
c1[t1]++;
}
for (x=0; x<256; x++) {
t4 = o4 + c4[x];
t3 = o3 + c3[x];
t2 = o2 + c2[x];
t1 = o1 + c1[x];
c4[x] = o4;
c3[x] = o3;
c2[x] = o2;
c1[x] = o1;
o4 = t4;
o3 = t3;
o2 = t2;
o1 = t1;
}
for(x=0; x<intArr.length; x++) {
t4 = intArr[x] & 0xFF;
cpy[c4[t4]] = intArr[x];
c4[t4]++;
}
for(x=0; x<intArr.length; x++) {
t3 = (cpy[x] >> 8) & 0xFF;
intArr[c3[t3]] = cpy[x];
c3[t3]++;
}
for(x=0; x<intArr.length; x++) {
t2 = (intArr[x] >> 16) & 0xFF;
cpy[c2[t2]] = intArr[x];
c2[t2]++;
}
for(x=0; x<intArr.length; x++) {
t1 = (cpy[x] >> 24) & 0xFF ^ 0x80;
intArr[c1[t1]] = cpy[x];
c1[t1]++;
}
return intArr;
}
编辑:
迄今为止,揭示出来的最佳/唯一主要优化是JavaScript类型数组。 使用类型数组作为正常基数排序的阴影数组产生了最佳结果。 我还能够通过使用JS内置的堆栈push / pop轻微地挤出额外的内容。
Intel i7 870, 4GB, FireFox 8.0
2mil
radixSort(intArr): 172 ms
radixSortIP(intArr): 1738 ms
quickSortIP(arr): 661 ms
200k
radixSort(intArr): 18 ms
radixSortIP(intArr): 26 ms
quickSortIP(arr): 58 ms
看起来标准基数排序确实是这种工作流程的王者。如果有人有时间尝试循环展开或其他修改,我会很感激。
我有一个特定的用例,需要JavaScript中最快的排序实现。客户端脚本将访问大型(50,000 - 2百万)、未排序(基本上是随机的)、整数(32位有符号)数组,然后需要对数据进行排序并呈现。
我已经实现了一个相当快速的原地基数排序和原地快速排序 jsfiddle基准测试 ,但对于我的上限数组长度,它们仍然相对较慢。在我的上限数组大小上,快速排序表现更好,而在我的下限数组大小上,基数排序表现更好。
defaultSort is the built-in JavaScript array.sort with an integer compare function
Intel C2Q 9650, 4GB, FireFox 3.6
2mil
radixSortIP(intArr): 5554 ms
quickSortIP(arr): 1796 ms
200k
radixSortIP(intArr): 139 ms
quickSortIP(arr): 190 ms
defaultSort(intArr): 354 ms
Intel i7 870, 4GB, FireFox 8.0
2mil
radixSortIP(intArr): 990 ms
quickSortIP(arr): 882 ms
defaultSort(intArr): 3632 ms
200k
radixSortIP(intArr): 28 ms
quickSortIP(arr): 68 ms
defaultSort(intArr): 306 ms
问题
- 是否有更好的排序算法实现可以满足我的用例/需求?
- 在原地基数/快速排序实现中,是否有任何优化可以提高性能?
- 有没有一种有效的方法将我的原地基数排序从递归函数转换为迭代函数?内存和执行速度。
目标
- 我希望这些答案能够帮助我在基准测试中获得20-30%的性能提升。
澄清/注释
- "定义快速" 我希望它在所有现代浏览器上都能良好运行,但如果有特定于浏览器的优化可以显著改善,那可能是可以接受的。
- 排序可以在服务器端完成,但我希望避免这样做,因为JS应用程序可能成为一个独立的应用程序(与某些现成的专有应用程序配对,该应用程序将传感器数据流式传输到文件中)。
- JavaScript可能不是最适合这个问题的语言,但这是一个要求。
- 我已经在https://stackoverflow.com/questions/7111525/fastest-way-to-sort-integer-arrays-in-javascript上提出了这个问题,但一个错误的答案被投票,并且该问题被关闭。
- 我尝试使用多个浏览器窗口实例作为临时多线程; 但它并没有成功。 我会对有关生成多个窗口以进行并发的有用信息感兴趣。