41得票4回答
如何在R中使用Box-Cox幂变换

我需要将一些数据转换为“正常形状”,而我读到 Box-Cox 可以确定用于转换数据的指数。 据我所了解car::boxCoxVariable(y) 在线性模型中,被用作响应变量。MASS::boxcox(object) 对于公式或拟合模型对象。由于我的数据是数据框的变量,我发现唯一可以使用的...

40得票4回答
单变量最小二乘回归中的多重R平方和调整后的R平方有什么区别?

有没有人能向统计学小白解释一下多重R平方与调整后R平方的区别是什么?我正在进行单变量回归分析,如下所示: v.lm <- lm(epm ~ n_days, data=v) print(summary(v.lm)) 结果: Call: lm(formula = epm ~ n_...

39得票7回答
在测试数据中使用未知因子水平的predict.lm()函数

我正在对因子数据进行模型拟合和预测。如果predict.lm()中的newdata包含一个模型未知的单个因子水平,所有predict.lm()方法都会失败并返回错误。 有没有什么好方法可以使predict.lm()方法仅针对模型已知的因子水平返回预测结果,并对未知的因子水平返回NA值,而不是...

37得票3回答
cross_val_score和cross_val_predict的区别

我想使用交叉验证评估使用scikitlearn构建的回归模型,但却感到困惑,不知道应该使用哪个函数cross_val_score和cross_val_predict 。 其中一个选项是:cvs = DecisionTreeRegressor(max_depth = depth) scores ...

37得票3回答
网格搜索交叉验证 - XGBoost - 提前停止

我正在尝试使用Scikit-Learn的GridSearchCV在XGBoost上进行超参数搜索。在网格搜索期间,我希望能够进行早停以便大幅减少搜索时间,并期望在我的预测/回归任务上获得更好的结果。我使用Scikit-Learn API调用XGBoost。 model = xgb.XGB...

36得票13回答
数值错误:特征名称不匹配:在xgboost的predict()函数中。

我已经训练了一个XGBoostRegressor模型。但是当我用这个训练好的模型来预测新的输入时,predict()函数会抛出feature_names mismatch错误,尽管输入特征向量与训练数据具有相同的结构。 此外,为了以与训练数据相同的结构构建特征向量,我需要进行大量低效的处理,...

36得票4回答
xgb.train和xgb.XGBRegressor(或xgb.XGBClassifier)有什么区别?

我已经知道"xgboost.XGBRegressor是XGBoost的Scikit-Learn包装器接口。" 但它们有其他的区别吗?

35得票4回答
在散点图中显示置信区间和预测区间。

我有两个数据数组,一个是身高,一个是体重:import numpy as np, matplotlib.pyplot as plt heights = np.array([50,52,53,54,58,60,62,64,66,67,68,70,72,74,76,55,50,45,65]) w...

35得票5回答
从lm对象中提取标准误差

我们从中获得了一个lm对象,并希望提取标准误差。lm_aaa <- lm(aaa ~ x + y + z) 我知道函数的摘要、名称和系数。 然而,似乎仅有通过摘要才能手动获取标准误差。 你有任何想法如何只输出se吗?

35得票3回答
Scikit-learn交叉验证评分用于回归

如何在回归问题中使用cross_val_score?默认的评分似乎是准确度,这对于回归问题来说意义不大。如果我想要使用均方误差,是否可以在cross_val_score中指定? 尝试了以下两种方法但都不起作用:scores = cross_validation.cross_val_score...