9得票1回答
在sklearn管道中,使用GridSearchCV、缩放、主成分分析和提前停止的XGBoost。

我希望将XGBoost模型与输入缩放和PCA特征空间缩减相结合。此外,应使用交叉验证来调整模型的超参数以及PCA中使用的组件数。为防止模型过度拟合,需要添加早期停止。 为了将各个步骤组合起来,我决定使用sklearn的Pipeline功能。 一开始,我遇到了一些问题,无法确保PCA也应用于...

9得票2回答
在Scikit-learn中,KNN分类器中的网格搜索参数和交叉验证数据集

我正在尝试使用SciKit-Learn执行我的第一个KNN分类器。我一直在遵循用户指南和其他在线示例,但有几件事我不确定。在此帖子中,让我们使用以下内容: X = 数据,Y = 目标 在我阅读的大多数机器学习入门页面中,似乎都说您需要训练集、验证集和测试集。从我的理解来看,交叉验证允许您...

9得票1回答
在scikit-learn中结合递归特征消除和网格搜索的应用

我想结合递归特征消除和网格搜索使用scikit-learn。 从下面的代码中可以看出(它是有效的),我能够从网格搜索中获得最佳估计器,然后将该估计器传递给RFECV。 然而,我宁愿先执行RFECV,然后进行网格搜索。 问题在于,当我将来自RFECV的选择器传递给网格搜索时,它不起作用:Valu...

9得票3回答
如何在sklearn中获取随机森林的决策函数

我正在使用以下代码通过gridsearchcv获取randomforest的优化参数。 x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0) rfc = RandomForestClassifier...

9得票1回答
Scikit - 结合比例和网格搜索

我是新手,希望了解scikit,并且在数据缩放和网格搜索方面有两个小问题。 高效缩放器 考虑到使用Kfolds进行交叉验证,每次我们在K-1个折叠上训练模型时,数据缩放器(例如使用preprocessing.StandardScaler())仅适合于K-1个折叠,然后应用于剩余的折叠。...

9得票1回答
GridSearchCV - 每次迭代保存结果

我正在使用GridSearchCV,在每次迭代后,我想将clf.cv_results_属性保存到文件中(以防进程在中途崩溃)。 我试图寻找解决方案,但是我无法弄清楚。 任何帮助都将不胜感激。

9得票1回答
Keras中的损失、指标和评分

在构建一个keras模型时,损失(loss)、指标(metrics)和评分(scoring)有什么区别?它们应该是不同的还是相同的?在典型模型中,我们使用这三个参数进行GridSearchCV。 下面是一个典型回归模型的快照,其中使用了这三个参数。 def create_model(): ...

9得票1回答
网格搜索最佳模型: 保存和加载参数

我喜欢运行以下工作流程: 选择用于文本向量化的模型 定义参数列表 使用LogisticRegression()作为基准,应用管道和GridSearchCV在参数上,以找到最佳模型参数 保存最佳模型(参数) 加载最佳模型参数,以便我们可以在此定义的模型上应用一系列其他分类器。 这里是您可...

8得票2回答
在Gridsearch CV中进行评分

我刚开始使用Python中的GridSearchCV,但是我对其中的scoring参数感到困惑。我在某些地方看到过这个参数, scorers = { 'precision_score': make_scorer(precision_score), 'recall_score'...

8得票1回答
当使用“accuracy”作为评分标准和交叉验证时,GridSearchCV.best_score_代表什么意思?

我正在尝试寻找最佳的神经网络模型,应用于著名的威斯康星癌症数据集(569个样本,31个特征+目标)的乳腺癌样本分类。我使用sklearn 0.18.1。目前我没有使用归一化,但我会在解决这个问题后添加它。 # some init code omitted X_train, X_test, y...