133得票6回答
使用Pandas数据框进行OLS回归分析

我有一个 pandas 数据框,我想要能够从列B和列C的值预测列A的值。这是一个玩具示例:import pandas as pd df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40...

119得票7回答
NumPy中的加权标准差

numpy.average()函数有一个权重选项,但是numpy.std()没有。是否有人有解决方法?

89得票13回答
数值错误:numpy.dtype的大小不正确,请尝试重新编译。

我刚刚在Python 2.7上安装了pandas和statsmodels包。当我尝试使用"import pandas as pd"时,出现了这个错误信息。有人能帮忙吗?谢谢!numpy.dtype has the wrong size, try recompiling Traceback (m...

88得票10回答
Python中与auto.arima()相当的函数

我正在尝试使用ARIMA模型预测每周销售额。在statsmodels中,我找不到调整(p,d,q)顺序的函数。目前,R语言有一个名为forecast::auto.arima()的函数可以调整(p,d,q)参数。 我该如何选择合适的模型顺序?是否有Python库可供此目的使用?

64得票5回答
在一维观测数据中检测异常值的Pythonic方式

针对给定的数据,我想将离群值(由95%置信水平或95%分位函数或其他所需方法定义)设置为NaN值。以下是我现在正在使用的数据和代码。如果有人能进一步解释一下,我会很高兴。import numpy as np, matplotlib.pyplot as plt data = np.random...

62得票7回答
StatsModels中的置信区间和预测区间

我使用 StatsModels 进行这个 线性回归 :import numpy as np import statsmodels.api as sm from statsmodels.sandbox.regression.predstd import wls_prediction_std n...

62得票9回答
Python中的方差膨胀因子

我正在尝试在Python中为简单数据集中的每个列计算方差膨胀因子(VIF):a b c d 1 2 4 4 1 2 6 3 2 3 7 4 3 2 8 5 4 1 9 4 我已经使用来自usdm库中的vif函数,在R中完成了这项任务,它给出了以下结果:a <- c(1, 1, 2, 3,...

55得票6回答
为什么我从statsmodels OLS拟合中只得到一个参数

这是我在做的事情:$ python Python 2.7.6 (v2.7.6:3a1db0d2747e, Nov 10 2013, 00:42:54) [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin >>> imp...

46得票4回答
建立多元回归模型出现错误:`Pandas数据转换为numpy对象时出错。请使用np.asarray(data)检查输入数据。`

我有一个带有一些分类预测变量(即变量)为0和1的Pandas数据框,还有一些数字变量。当我将其拟合到类似于stasmodel的模型中时:est = sm.OLS(y, X).fit() 它抛出:Pandas data cast to numpy dtype of object. Check i...

46得票5回答
从statsmodels OLS结果中打印'std err'值

很抱歉我要问一下,http://statsmodels.sourceforge.net/ 目前无法访问,我无法查看文档。 我正在使用 statsmodels 进行线性回归,基本上是这样的: import statsmodels.api as sm model = sm.OLS(y,x) r...