20得票10回答
快速算法计算百分位数以去除异常值

我有一个程序需要重复计算数据集的近似百分位数(顺序统计量),以便在进一步处理之前去除异常值。目前的做法是通过对值数组进行排序并选择适当的元素来实现;虽然这是可行的,但它占用了程序中相当小的一部分,但在性能分析中是明显的短板。 更多信息: - 数据集包含大约高达100000个浮点数,并且假定...

24得票5回答
基于Prometheus中的速率理解histogram_quantile

根据Prometheus文档,要使用直方图指标获得95分位数,可以使用以下查询: histogram_quantile(0.95, sum(rate(http_request_duration_seconds_bucket[5m])) by (le)) 来源:https://promet...

11得票2回答
如何在jmeter聚合报告命令行中打印95和99百分位数?

我正在尝试从命令行中打印出JMeter聚合报告中的95百分位和99百分位响应时间。为此,我尝试了这里提到的解决方案: Jmeter: Generating aggregate report through commnd line is not including 95% and 99% lin...

8得票2回答
如何使用dplyr按id分组,在数据框中筛选出某一列的前10%?

I have the following data frame: id total_transfered_amount day 1 1000 2 1 2000 3 1 3000 ...

7得票1回答
Google BigQuery APPROX_QUANTILES和获取真正的四分位数

根据文档: 该函数返回一个表达式值组的近似边界,其中 number 表示要创建的分位数数量。此函数返回一个由 number + 1 个元素组成的数组,其中第一个元素是近似最小值,最后一个元素是近似最大值。 看起来,如果我想要真正的四分位数,我需要使用 APPROX_QUANTILES(va...

7得票1回答
普罗米修斯延迟图表中的直方图和百分位计算

我需要在prometheus上通过直方图时间序列绘制延迟图,但我一直无法在grafana中显示直方图。 我的期望是能够展示: Y轴是延迟,X轴是时间序列。 每条线代表p50,p75,p90,p100 - 聚合于给定的时间窗口内。 一个示例指标可能是nginx的请求时间。 假设我有这样一个...

35得票4回答
如何在JavaScript(或PHP)中获取数组的中位数、四分位数/百分位数?

这个问题变成了一个问答,因为我曾经苦苦寻找答案,并认为它对其他人有用。 我有一个JavaScript值数组,需要在JavaScript中计算它的Q2(第50个百分位数,即中位数),Q1(第25个百分位数)和Q3(第75个百分位数)值。

8得票5回答
将数组转换为百分位数

我有一个数组,想将其转换为百分位数。例如,假设我有一个正态分布的数组: import numpy as np import matplotlib.pyplot as plt arr = np.random.normal(0, 1, 1000) plt.hist(arr) 对于数组中...

8得票3回答
在Python中应如何计算四分位距?

我有一个数字列表[1, 2, 3, 4, 5, 6, 7],我希望有一个函数返回这个数字列表的四分位距。四分位距是上下四分位数之间的差异。我尝试使用NumPy函数和Wolfram Alpha来计算四分位距,但是我发现所有的答案,无论是手动计算、NumPy还是Wolfram Alpha,都不同。...

12得票2回答
可靠地检索分位函数的反函数

我已经阅读了其他帖子(例如这里),关于如何获取“反向”分位数——也就是在一系列值中获取与某个值相对应的百分位数。 然而,这些答案并没有给出与同一数据系列的分位数相同的值。 我还研究了分位数提供9种不同的算法来计算百分位数。 因此,我的问题是:是否有可靠的方法来获取分位函数的反转?Ecd...