我正在编写一个程序,将生成大量数据。我想找到这些数据的各种百分位数。
显然的方法是将数据存储在某种排序容器中。有没有Haskell库提供自动排序并提供快速随机访问任意索引的容器?
另一种选择是使用无序容器,在最后进行排序。我不知道那样会不会更快。无论哪种方式,我们仍然需要一个能够快速随机访问的容器。(也许是数组...)
有什么建议吗?
(另一种选择是构建直方图,而不是将整个数据集保留在内存中。但由于目标是非常精确地计算百分位数,我不愿意走这条路。我也不知道我的数据范围,直到我生成它...)
显然的方法是将数据存储在某种排序容器中。有没有Haskell库提供自动排序并提供快速随机访问任意索引的容器?
另一种选择是使用无序容器,在最后进行排序。我不知道那样会不会更快。无论哪种方式,我们仍然需要一个能够快速随机访问的容器。(也许是数组...)
有什么建议吗?
(另一种选择是构建直方图,而不是将整个数据集保留在内存中。但由于目标是非常精确地计算百分位数,我不愿意走这条路。我也不知道我的数据范围,直到我生成它...)