57得票6回答
交叉验证和网格搜索有什么区别?

简单来说,交叉验证和网格搜索有什么区别?网格搜索是如何工作的?我应该先做交叉验证还是先做网格搜索?

56得票2回答
如何使用Joblib或Pickle保存通过Pipeline和GridSearchCV创建的模型?

在使用pipeline和GridSearchCV确定最佳参数后,我如何使用pickle/joblib将此过程保存以便以后重复使用?当它是单个分类器时,我知道如何做到这一点...from sklearn.externals import joblib joblib.dump(clf, 'file...

44得票4回答
Scikit-learn估算器管道的参数无效。

我正在实现 O'Reilly 书籍《Python 机器学习基础教程》中的一个例子,使用 Python 2.7 和 sklearn 0.16。我正在使用以下代码:pipe = make_pipeline(TfidfVectorizer(), LogisticRegression()) param...

42得票10回答
如何从GridSearchCV中绘制网格分数图?

我希望找到一种方法来绘制来自Sklearn中GridSearchCV的grid_scores_。在这个例子中,我试图为SVR算法寻找最佳的gamma和C参数。我的代码如下: C_range = 10.0 ** np.arange(-4, 4) gamma_range = 10.0...

40得票4回答
使用sklearn的GridSearchCV与管道一起,只需预处理一次。

我正在使用scikit-learn来调整模型的超参数。我使用管道将预处理和估计器连接在一起。我的问题的简单版本如下:import numpy as np from sklearn.model_selection import GridSearchCV from sklearn.pipeline...

35得票1回答
在Scikit-learn中使用Smote和Gridsearchcv

我处理的数据集不平衡,想用scikit的gridsearchcv进行网格搜索来调整模型参数。为了平衡数据,我想使用SMOTE,并且我知道我可以将其包含在管道的阶段中并将其传递给gridsearchcv。 我的担忧是,我认为smote将被应用于训练和验证折叠,这不是您应该做的。 验证集不应进行过...

34得票3回答
使用Keras和sklearn GridSearchCV进行早停法和交叉验证

我希望使用Keras和sklearn的GridSearchCV实现早停功能。下面的工作代码示例是修改自How to Grid Search Hyperparameters for Deep Learning Models in Python With Keras。可以从这里下载数据集。添加了K...

34得票5回答
在Python中,有没有一种简单的方法可以进行网格搜索而不需要交叉验证?

在scikit-learn中有一个名为GridSearchCV的非常有用的类,可以进行网格搜索和交叉验证,但我不想做交叉验证。我希望在网格搜索时不进行交叉验证,并使用整个数据集进行训练。 更具体地说,我需要在网格搜索期间使用“oob分数”评估由RandomForestClassifier创建...

32得票2回答
使用GridSearchCV和AdaBoost以及DecisionTreeClassifier

我正在尝试使用DecisionTreeClassifier(“DTC”)作为基础估算器来调整AdaBoost分类器(“ABT”)。我想同时调整ABT和DTC参数,但不确定如何实现-流水线不应该工作,因为我没有将DTC的输出“连接”到ABT。我的想法是在GridSearchCV估计器中迭代ABT...

30得票3回答
随机森林与GridSearchCV - param_grid出现错误

我试图使用GridSearchCV创建一个Random Forest模型,但出现了与param_grid有关的错误:"ValueError: Invalid parameter max_features for estimator Pipeline. Check the list of ava...