11得票5回答
如何计算百分位数?

我有访问日志,如下所示,存储在一个MongoDB实例中:Time Service Latency [27/08/2013:11:19:22 +0000] "POST Service A HTTP...

8得票2回答
如何使用dplyr按id分组,在数据框中筛选出某一列的前10%?

I have the following data frame: id total_transfered_amount day 1 1000 2 1 2000 3 1 3000 ...

38得票2回答
PostgreSQL 中的 nth 百分位数计算

我惊讶地发现postgresql中没有一个nth百分位函数。 由于我是通过mondrian olap工具使用它,所以我只需要一个返回95th百分位的聚合函数。 我找到了这个链接: http://www.postgresql.org/message-id/16286779090710233...

7得票1回答
在使用numpy.median之前先对数据进行排序

我正在使用Python对数据样本进行中位数和百分位数的测量。 import numpy as np xmedian=np.median(data) x25=np.percentile(data, 25) x75=np.percentile(data, 75) 在测量中位数之前,我是否需要...

20得票10回答
快速算法计算百分位数以去除异常值

我有一个程序需要重复计算数据集的近似百分位数(顺序统计量),以便在进一步处理之前去除异常值。目前的做法是通过对值数组进行排序并选择适当的元素来实现;虽然这是可行的,但它占用了程序中相当小的一部分,但在性能分析中是明显的短板。 更多信息: - 数据集包含大约高达100000个浮点数,并且假定...

24得票8回答
在MySQL中计算百分位排名

我在MySQL中有一个非常大的测量数据表,需要为每个值计算百分位排名。Oracle似乎有一个称为percent_rank的函数,但是我在MySQL中找不到类似的东西。当然,我可以在Python中使用蛮力方法来完成这个任务,因为我已经在使用Python来填充表格,但我怀疑这样做会非常低效,因为一...

8得票5回答
将数组转换为百分位数

我有一个数组,想将其转换为百分位数。例如,假设我有一个正态分布的数组: import numpy as np import matplotlib.pyplot as plt arr = np.random.normal(0, 1, 1000) plt.hist(arr) 对于数组中...

41得票10回答
将每个列表值映射到其相应的百分位数

我想创建一个函数,它将一个(排序过的)列表作为参数,并输出一个包含每个元素相应百分位数的列表。 例如,fn([1,2,3,4,17]) 返回 [0.0, 0.25, 0.50, 0.75, 1.00]。 请问有谁可以: 帮我纠正以下代码?或者 提供比我的代码更好的方法,将列表中的值映射...

38得票6回答
重复计算百分位数的快速算法?

在一个算法中,我需要每次添加一个值时计算数据集的 75th 百分位数。目前我正在这样做: 获取值 x 将 x 插入到已经排序好的数组的末尾 将 x 向下交换,直到数组排序完成 读取位置为 array[array.size * 3/4] 的元素 第3步的时间复杂度为 O(n),其余时间复...

29得票4回答
能否根据百分位数值而不是原始输入绘制箱线图?

从我所看到的,boxplot()方法期望输入一系列原始值(数字),然后计算百分位数以绘制箱线图。 我想要一个方法,可以传入百分位数并获得相应的boxplot。 例如: 假设我运行了几个基准测试,并为每个基准测试测量了延迟(浮点值)。现在另外,我已经预先计算了这些值的百分位数。 因此,对...