33得票2回答
predict.lm()如何计算置信区间和预测区间?

我进行了回归分析:CopierDataRegression <- lm(V1~V2, data=CopierData1) 我的任务是获得给定 V2=6 的平均响应的90%置信区间和90%预测区间。 我使用了以下代码:X6 <- data.frame(V2=6) predict(C...

33得票1回答
区分过拟合和良好预测

这些是有关如何计算和减少机器学习中过拟合的问题。我认为很多刚接触机器学习的人都会有相同的问题,因此我尝试用我的例子和问题来阐明,并希望这里的答案可以帮助其他人。 我有一个非常小的文本样本,我正在尝试预测与它们相关联的值。我使用sklearn计算tf-idf,并将其插入回归模型进行预测。这给我...

33得票7回答
sklearn LogisticRegression和更改分类的默认阈值

我正在使用sklearn软件包中的LogisticRegression,与分类相关的问题需要请教。我为我的分类器构建了一个ROC曲线,结果显示训练数据的最佳阈值约为0.25。我假设创建预测时默认阈值为0.5。如何更改此默认设置以找出在进行10折交叉验证时模型的准确性如何?基本上,我希望我的模型...

32得票3回答
如何在Python的sklearn中添加交互项

如果我有自变量[x1, x2, x3], 如果我在sklearn中进行线性回归拟合, 它会给我这样的结果:y = a*x1 + b*x2 + c*x3 + intercept 使用2次多项式回归会给我类似于以下内容:y = a*x1^2 + b*x1*x2 ...... 我不想使用类似 x1^...

32得票3回答
Python中LOWESS的置信区间

我该如何在Python中计算LOWESS回归的置信区间?我想将这些置信区间作为阴影区域添加到使用以下代码创建的LOESS图中(除了statsmodels之外的其他软件包也可以)。import numpy as np import pylab as plt import statsmodels....

32得票2回答
TensorFlow深度神经网络用于回归,在一个批次中总是预测相同的结果。

我使用TensorFlow实现了一个简单的多层感知器进行回归。代码是从标准的mnist分类器修改而来,我仅将输出成本更改为MSE(使用tf.reduce_mean(tf.square(pred-y))),并修改了一些输入、输出大小设置。然而,如果我使用回归训练网络,在几个时期后,输出批次完全相...

32得票7回答
Python中的逐步回归

如何在 Python 中执行逐步回归? SCIPY 中有OLS方法,但我无法进行逐步回归。在这方面的任何帮助都将是巨大的帮助。谢谢。编辑:我正在尝试构建一个线性回归模型。 我有5个自变量,并使用前向逐步回归来选择变量,以便我的模型具有最低的 p值。 以下链接解释了该目标:https://www...

31得票7回答
使用p值逐步回归以删除具有非显著性p值的变量

我想要使用p值作为选择标准来执行逐步线性回归,例如:在每个步骤中,删除具有最高或最不显著的p值的变量,直到所有值都达到某个阈值α定义的显著水平。 我完全意识到应该使用AIC(例如命令step或stepAIC)或其他标准来代替,但我的老板对统计学一无所知,并坚持使用p值。 如果必要的话,我可...

31得票2回答
Python sci-kit learn(度量):r2_score和explained_variance_score之间的区别是什么?

我注意到 r2_score 和 explained_variance_score 都是用于回归问题的内置方法,存放在sklearn.metrics中。 我一直认为r2_score是模型解释方差的百分比。请问它与explained_variance_score有何不同? 你何时会选择其中一个...

30得票2回答
lme4::lmer报告“固定效应模型矩阵秩不足”,我需要修复吗?如何修复?

我正尝试使用混合效应模型,将其余的列作为预测变量来预测F2_difference,但是我收到了一个错误信息: fixed-effect model matrix is rank deficient so dropping 7 columns / coefficients. 根据这个...