128得票13回答
C语言中的滚动中位数算法

我目前正在编写一个用于在 C 中实现滚动中位数滤波器(类似于滚动平均滤波器)的算法。通过查阅文献,似乎有两种比较有效的方法来实现它。第一种方法是对初始值窗口进行排序,然后执行二分搜索以在每次迭代时插入新值并删除现有值。 第二种方法(来自 Hardle 和 Steiger,在 1995 年的 ...

124得票10回答
如何在已知均值和标准差的正态分布中计算概率?

如何在Python中给定均值和标准差计算正态分布概率?我可以根据定义显式编写自己的函数,就像这个问题中的OP所做的那样:使用Python计算分布中随机变量的概率。 只是想知道是否有一个库函数调用可以让您完成这个任务。在我的想象中,它应该是这样的:nd = NormalDistribution...

121得票18回答
如何在Python中绘制ROC曲线

我正在尝试使用逻辑回归软件包在Python中开发的预测模型来绘制ROC曲线以评估模型的准确性。我已经计算出真正例率和假正例率,但是我无法弄清如何使用matplotlib正确绘制这些并计算AUC值。我该怎么做?

120得票5回答
如何使用“sweep”函数?(关于it技术的问题)

当我查看 R Packages 的源代码时,我经常看到使用 sweep 函数。有时候它被用在一个更简单的函数可以胜任的地方(例如 apply),而有时候,如果不花费相当长的时间来逐步执行它所在的代码块,就无法准确知道它在做什么。 事实上,我可以使用更简单的函数来复制 sweep 的效果,这表...

119得票9回答
几何平均数:有内置功能吗?

我试图找到一个内置的几何平均值函数,但是没有找到。 (显然,在shell中使用内置函数不会节省时间,而且我也不认为精度有任何区别;对于脚本,我尽可能经常使用内置函数,可以获得累计性能提升。) 如果没有内置函数(我怀疑这种情况),这是我的实现。gm_mean = function(a){pr...

116得票4回答
如何为单个Series计算直方图(频率表)?

我该如何为单个Series生成频率表(或直方图)?例如,如果我有my_series = pandas.Series([1,2,2,3,3,3]),那么如何获得类似于{1: 1, 2: 2, 3: 3}的结果-即每个值出现的次数计数在 Series中?

111得票9回答
使用SciPy制作分位数-分位数图

如何使用Python创建QQ图? 假定您有一组大量的测量数据并使用某个绘图函数将XY值作为输入。该函数应该将测量的分位数与某个分布(正态、均匀分布等)对应的分位数进行绘制。 生成的图形可以让我们评估测量结果是否符合所假设的分布。 http://en.wikipedia.org/wiki/...

110得票3回答
Python Scipy 中的双样本 Kolmogorov-Smirnov 检验

我无法弄清楚如何在Scipy中进行双样本KS检验。 阅读了scipy kstest的文档后,我可以看到如何测试一个分布是否与标准正态分布相同。 from scipy.stats import kstest import numpy as np x = np.random.normal(0...

108得票6回答
浏览器对禁用JavaScript的统计数据

我正在努力收集公开可得的有关禁用JavaScript的网页用户比例的统计数据。 Yahoo于2010年公布了数据,而R. Reid则在2009年公布了他可以访问的网站上的数据。 当时Yahoo的发现非常有趣: 我们结合了访问日志和信标数据(之前包含在页面中),并过滤掉所有自动请求,...

105得票10回答
使用Boost在C++中计算样本向量的平均值和标准差

有没有一种方法可以使用Boost计算包含样本的向量的平均值和标准差? 还是我必须创建一个累加器并将向量馈入其中?