300得票12回答
如何使用Python/Numpy计算百分位数?

有没有一种方便的方法来计算序列或单维度的numpy数组的百分位数? 我正在寻找类似于Excel的百分位函数的方法。

130得票6回答
查找给定列的百分位统计数据

我有一个名为my_df的pandas数据框,我可以找到给定列的均值(mean)、中位数(median)和众数(mode)。 my_df['field_A'].mean() my_df['field_A'].median() my_df['field_A'].mode() 我想知道是否有可...

72得票3回答
消除给定百分位数以上的所有数据

我有一个名为data的pandas DataFrame,其中有一列名为ms。我想消除所有data.ms高于95%分位数的行。目前,我正在执行以下操作:limit = data.ms.describe(90)['95%'] valid_data = data[data['ms'] < li...

53得票12回答
使用numpy计算加权百分位数

有没有一种方法可以使用numpy.percentile函数计算加权百分位数?或者是否有其他的Python函数可用于计算加权百分位数? 谢谢!

53得票5回答
计算数据集列的百分位数

亲爱的R语言专家们,我有一个简短的问题:我正在做一项作业,在这个练习中,我被要求从内置的infert数据集中获取基本统计信息,特别是其中的一列infert$age。对于任何不熟悉该数据集的人:> table_ages # Which is just subset(infert, ...

51得票8回答
实时数据捕获的百分位数

我正在寻找一个算法,用于确定实时数据捕获的百分位数。 例如,考虑开发服务器应用程序。 服务器可能具有以下响应时间: 17毫秒 33毫秒 52毫秒 60毫秒 55毫秒 等等。 报告90th百分位响应时间,80th百分位响应时间等很有用。 天真的算法是将每个响应时间插入到列表中。当请求统计...

45得票5回答
matplotlib: 绘图时如何忽略异常值

我正在绘制来自各种测试的一些数据。有时在一个测试中,我会有一个异常值(比如0.1),而其他所有值都小三个数量级。 使用matplotlib,我将绘图范围设为[0,max_data_value] 如何仅缩放我的数据并不显示异常值,这将破坏我的绘图x轴? 我是否应该简单地取95个百分位数,...

41得票10回答
将每个列表值映射到其相应的百分位数

我想创建一个函数,它将一个(排序过的)列表作为参数,并输出一个包含每个元素相应百分位数的列表。 例如,fn([1,2,3,4,17]) 返回 [0.0, 0.25, 0.50, 0.75, 1.00]。 请问有谁可以: 帮我纠正以下代码?或者 提供比我的代码更好的方法,将列表中的值映射...

38得票6回答
重复计算百分位数的快速算法?

在一个算法中,我需要每次添加一个值时计算数据集的 75th 百分位数。目前我正在这样做: 获取值 x 将 x 插入到已经排序好的数组的末尾 将 x 向下交换,直到数组排序完成 读取位置为 array[array.size * 3/4] 的元素 第3步的时间复杂度为 O(n),其余时间复...

38得票2回答
PostgreSQL 中的 nth 百分位数计算

我惊讶地发现postgresql中没有一个nth百分位函数。 由于我是通过mondrian olap工具使用它,所以我只需要一个返回95th百分位的聚合函数。 我找到了这个链接: http://www.postgresql.org/message-id/16286779090710233...