62得票2回答
R刻数据:将日期和时间合并为一个对象

我目前在使用R处理tick数据,想要将日期和时间合并成一个对象,以便获取精确的时间对象来计算数据统计信息。以下是我的数据样式: date time price flag exchange 2 XXH10 2010-02-02 ...

62得票9回答
Python中的方差膨胀因子

我正在尝试在Python中为简单数据集中的每个列计算方差膨胀因子(VIF):a b c d 1 2 4 4 1 2 6 3 2 3 7 4 3 2 8 5 4 1 9 4 我已经使用来自usdm库中的vif函数,在R中完成了这项任务,它给出了以下结果:a <- c(1, 1, 2, 3,...

61得票1回答
使用R绘制带有等高线图层的3D表面图。

我有一个三元组数据集(X、Y、Z点),想用R绘制它。 我想从数据中创建一个表面图,并在表面图上叠加等高线地图,以便给人以等高线地图是表面图的“阴影”或投影的印象。 等高线地图应出现在表面图下方。 我的数据集看起来有点像这样:Axis | Data Type --------------...

60得票9回答
在R中定义线性模型时对比度出错

当我试图在R中定义我的线性模型时,代码如下:lm1 <- lm(predictorvariable ~ x1+x2+x3, data=dataframe.df) 我收到了以下错误信息:Error in `contrasts<-`(`*tmp*`, value = contr.fun...

60得票1回答
如何在R中计算线性回归模型中斜率的95%置信区间

这是Introductory Statistics with R中的一道练习: 使用rmr数据集,绘制代谢率与体重之间的关系图。拟合一个线性回归模型来描述它们之间的关系。根据拟合的模型,当体重为70公斤时,预测的代谢率是多少?给出直线斜率的95%置信区间。 rmr数据集在'ISwR'包中。...

59得票7回答
Git查找臃肿提交

是否可以获取有关每个提交中更改浪费了多少空间的信息,以便我可以找到添加了大文件或许多文件的提交。这一切都是为了尝试减少git仓库的大小(通过变基和可能的过滤提交)。

59得票8回答
在C/C++中的累积正态分布函数

我想知道标准C++库(例如cmath)中是否内置了统计函数。如果没有,你们能否推荐一个好的统计库,其中包括累积正态分布函数? 更具体地说,我正在寻找使用/创建累积分布函数。

58得票10回答
拟合多项式到数据

给定一组值(x,f(x)),是否有一种方法可以找到最适合数据的给定次数的多项式?我知道多项式插值,它是为了找到一个给定n+1个数据点的n次多项式,但这里有大量的值,我们想要找到低次多项式(最佳线性拟合、最佳二次曲线拟合、最佳三次曲线拟合等)。它可能与最小二乘法有关... 更一般地,当我们有一...

55得票18回答
当所有值的总和超过双精度限制时,如何计算平均值的好方法是什么?

我有一个需求,需要计算一个非常大的double集合(10^9个值)的平均值。该值的总和超过了double类型的上限,所以有没有人知道任何巧妙的小技巧来计算平均值而不需要计算总和呢? 我正在使用Java 1.5。

54得票2回答
scipy.stats中所有可用的分布长什么样?

可视化 scipy.stats 分布 可以制作scipy.stats正态随机变量的直方图来查看分布情况。% matplotlib inline import pandas as pd import scipy.stats as stats d = stats.norm() rv = d.rv...