我很难理解p值的概念以及adfuller测试的其他结果。我正在使用以下代码:(我在Stack Overflow上找到了这段代码)import numpy as np import os import pandas as pd import statsmodels.api as sm impor...
假设我有一些经验获得的数据:from scipy import stats size = 10000 x = 10 * stats.expon.rvs(size=size) + 0.2 * np.random.uniform(size=size) 它是指数分布(带有一些噪音),我想使用卡方适合...
我想评估残差: (y-hat y)。 我知道如何做:df = pd.read_csv('myFile', delim_whitespace = True, header = None) df.columns = ['column1', 'column2'] y, X = ps.dmatric...
我试图使用循环找到最佳的参数顺序:d = 1 for p in range(3): for q in range(3): try: order = (p, 0, q) params = (p, d, q) ...
我想使用statsmodels和pandas数据框运行多个OLS回归。不同的行有不同列中的缺失值,但是我一直收到以下错误消息: ValueError:数组不得包含无穷大或NaN 我看到了这个与问题类似的SO问题,但并没有完全回答我的问题:statsmodel.api.Logit: valuee...
从这样的数据集开始:import pandas as pd import numpy as np import statsmodels.api as sm # A dataframe with two variables np.random.seed(123) rows = 12 rng =...
在使用statsmodels时,我遇到了一个奇怪的错误:ValueError:endog必须在单位间隔内。有人能给我更多关于这个错误的信息吗?谷歌没有帮助。 产生错误的代码: """ Multiple regression with dummy variables. """ impor...
我正在尝试分析星星的数据。我有星星的光时间序列,并希望预测它们属于4种不同类型中的哪一类。 我有这些星星的光时间序列,并希望通过去季节性、频率分析和其他可能相关的研究来分析这些时间序列。 对象time_series是一个panda DataFrame,包括10列:time_points_b...
我有两个numpy数组light_points 和time_points,希望在这些数据上使用一些时间序列分析方法。 然后我尝试了这个:import statsmodels.api as sm import pandas as pd tdf = pd.DataFrame({'time':tim...
我尝试使用add_constant()函数处理数据集的数组。在索引59时,它可以正常工作(创建了新列),但是在索引60时没有创建新列。最初,testmat[59]返回(24, 54)的形状,而testmat[60]返回(9, 54)的形状。运行add_constant函数后,我得到以下结果:I...