21得票5回答
如何在散点图中添加最佳拟合线

我目前正在使用Pandas和matplotlib进行一些数据可视化工作,我想在散点图上添加一条最佳拟合线。 这是我的代码: import matplotlib import matplotlib.pyplot as plt import pandas as panda import num...

21得票3回答
Python pandas线性回归groupby

我正在尝试在按组分组的pandas python数据框上使用线性回归: 这是数据框df: group date value A 01-02-2016 16 A 01-03-2016 15 A 01-04...

21得票1回答
Pandas DataFrame - 当使用ols/线性回归时,'无法将[datetime64 [ns]] astype为[float64]'。

我有一个如下的DataFrame: Ticker Date Close 0 ADBE 2016-02-16 78.88 1 ADBE 2016-02-17 81.85 2 ADBE 2016-02-18 80.53 3 ADBE 2016-02-19 80.87 ...

20得票2回答
如何使用R在散点图上绘制R平方值?

这似乎是一个简单的问题,所以我希望它有一个简单的答案。我正在绘制我的点并拟合线性模型,这个我可以做得很好。然后我想在图上绘制一些汇总统计数据,例如R平方值。但我只能在命令行中获得R平方值。有什么建议吗?我需要查看ggplot或其他东西吗?提前感谢。#Does the plot plot(df$...

20得票3回答
使用“statsmodels”指定要作为基础的类别

我知道当我在模型中使用一个类别变量并将其传递给statsmodels的fit函数时,会自动生成针对类别的虚拟变量。例如,如果我有一个变量'Location',它的值为'IndianOcean','Thailand','China'和'Mars',那么我的模型中将会生成形式如下的变量: Loc...

19得票2回答
使用虚拟/分类变量的线性回归

我有一组数据。我已经使用pandas将它们分别转换为虚拟变量和分类变量。现在,我想知道如何在Python中运行多元线性回归(我正在使用statsmodels)。是否有一些考虑因素或者我必须在代码中指出这些变量是虚拟/分类变量?或者,变量的转换已足够,我只需要运行回归模型model = sm.O...

18得票2回答
有没有一个Java库可以提供更好的线性回归?(例如,迭代重新加权最小二乘法)

我正在努力寻找更好的线性回归方法。 我一直在使用Moore-Penrose伪逆和QR分解与JAMA库,但结果并不令人满意。 ojAlgo是否有用? 我已经达到了应该不存在的准确度极限。 算法应该能够将输入变量的影响降低到零。 也许这需要迭代重新加权最小二乘法,但我不知道这个算法,也找不到一个可...

18得票3回答
如何检查连续和分类变量之间的相关性?

我有一个包含二元分类变量和连续变量的数据集。我正尝试应用线性回归模型来预测一个连续变量。请问如何检查分类变量和连续目标变量之间的相关性? 当前代码:import pandas as pd df_hosp = pd.read_csv('C:\Users\LAPPY-2\Desktop\Leng...

18得票2回答
如何在Python中计算线性回归模型的AIC?

我想计算线性模型的AIC以比较它们的复杂性。 我是这样做的:regr = linear_model.LinearRegression() regr.fit(X, y) aic_intercept_slope = aic(y, regr.coef_[0] * X.as_matrix() + r...

18得票3回答
如果您的数据只有一个特征,则可以使用array.reshape(-1,1)来调整其形状,如果数据包含单个样本,则可以使用array.reshape(1,-1)。

当我从我的数据中预测一个样本时,它会出现重塑错误,但是我的模型具有相等数量的行。这是我的代码: import pandas as pd from sklearn.linear_model import LinearRegression import numpy as np x = np.ar...