245得票11回答
在scikit-learn LinearRegression中寻找p值(显著性)。

我怎样找到每个系数的p值(显著性)?lm = sklearn.linear_model.LinearRegression() lm.fit(x,y)

189得票6回答
在ggplot上添加回归线

我正在努力在ggplot上添加一个回归线。 我先尝试使用abline,但无法使其正常工作。 然后我尝试了这个...data = data.frame(x.plot=rep(seq(1,5),10),y.plot=rnorm(50)) ggplot(data,aes(x.plot,y.plot)...

163得票6回答
如何强制R在回归中使用指定的因子水平作为参考?

如何在回归中使用二元解释变量时,告诉 R 使用特定的水平作为参考值? R 默认会使用某个水平作为参考值。 lm(x ~ y + as.factor(b)) 使用b {0, 1, 2, 3, 4}。假设我想要使用3代替R中使用的零。

133得票10回答
在R中的线性回归和按组分组

我想使用lm()函数在R中进行线性回归。我的数据是一个年度时间序列,其中一列是年份(22年),另一列是州名(50个州)。我希望为每个州都拟合一个回归模型,以便最终得到一个lm响应向量。我可以想象为每个州使用for循环,然后在循环内部进行回归,并将每个回归的结果添加到一个向量中。但这似乎不太像R...

133得票6回答
使用Pandas数据框进行OLS回归分析

我有一个 pandas 数据框,我想要能够从列B和列C的值预测列A的值。这是一个玩具示例:import pandas as pd df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40...

86得票4回答
提取回归系数值

我有一个用于研究药物利用的时间序列数据回归模型。目的是将样条拟合到时间序列上,并计算95% CI等参数。该模型如下: id <- ts(1:length(drug$Date)) a1 <- ts(drug$Rate) a2 <- lag(a1-1) tg <- ts....

77得票4回答
带有字符串/分类特征(变量)的线性回归分析?

回归算法似乎只适用于以数字表示的特征。例如: 这个数据集不包含分类特征/变量。如何对这些数据进行回归分析并预测价格是非常清楚的。 但现在我想对包含分类特征的数据进行回归分析: 有5个特征:District,Condition,Material,Security,Type ...

71得票3回答
Scikit-learn交叉验证,均方误差中的负值

当我使用以下代码与大小为(952, 144)的数据矩阵X和大小为(952)的输出向量y时,mean_squared_error指标返回负值,这是不可预期的。你有什么想法吗?from sklearn.svm import SVR from sklearn import cross_validat...

64得票5回答
在回归模型中筛选(多重)共线性

我希望这不是一个“问答”问题...以下是内容: (多)共线性是指回归模型中预测变量之间的相关性非常高。如何“治愈”呢……有时候你不需要“治愈”共线性,因为它并不影响回归模型本身,但会影响各个预测变量的效果解释。 发现共线性的一种方法是将每个预测变量作为因变量,其他预测变量作为自变量,确定R...

62得票3回答
如何调试“对具有2个或更多级别的因子才能应用对比”的错误?

这是我正在使用的所有变量:str(ad.train) $ Date : Factor w/ 427 levels "2012-03-24","2012-03-29",..: 4 7 12 14 19 21 24 29 31 ...