19得票3回答
Pipeline: 多个分类器?

我在Python中阅读了有关管道和GridSearchCV的以下示例: http://www.davidsbatista.net/blog/2017/04/01/document_classification/ 逻辑回归: pipeline = Pipeline([ ('tfidf...

18得票2回答
在GridSearchCV中避免特定参数组合

我正在使用scikit-learn的GridSearchCV来迭代一个参数空间,以调整模型。具体来说,我正在使用它来测试神经网络中的不同超参数。网格如下: params = {'num_hidden_layers': [0,1,2], 'hidden_layer_size...

18得票1回答
GridSearchCV(sklearn)中有多个估计器

我在查看sklearn文档网页关于GridSearchCV的内容。 GridSearchCV对象的一个属性是best_estimator_。 那么问题来了,如何将多个评估器传递给GSCV对象? 使用类似字典的方式: {'SVC()':{'C':10, 'gamma':0.01}, 'DecT...

17得票3回答
从GridSearchCV获取特征重要性

从sklearn的GridSearchCV中获取特征重要性的方法是什么? 例如:from sklearn.model_selection import GridSearchCV print("starting grid search ......") optimized_GBM = Grid...

17得票3回答
如何在Python的sklearn中使用GridSearchCV进行特征选择

我正在使用带有交叉验证的递归特征消除(rfecv)作为 randomforest classifier 的特征选择器,如下所示。 X = df[[my_features]] #all my features y = df['gold_standard'] #labels clf = Ran...

17得票3回答
如何保存GridSearchCV对象?

最近,我一直在使用Grid Search交叉验证(sklearn GridSearchCV)对Keras和Tensorflow后端的超参数进行调整。当我的模型完成调整后,我尝试保存GridSearchCV对象以供日后使用,但没有成功。 超参数调整步骤如下: x_train, x_val, ...

17得票3回答
在SciKit-Learn中使用交叉验证和XGBoost进行网格搜索和早期停止

我对sci-kit learn相当新,并一直尝试进行XGBoost的超参数调整。我的目标是使用早停和网格搜索来调整模型参数,使用早停来控制树的数量并避免过拟合。因为我在网格搜索中使用交叉验证,所以希望在早停标准中也使用交叉验证。到目前为止,我编写的代码如下:import numpy as np...

16得票3回答
在GridSearchCV中明确指定测试/训练集

我有一个关于sklearn的GridSearchCV的cv参数的问题。 我正在处理具有时间组件的数据,因此我认为在KFold交叉验证中进行随机洗牌似乎不明智。 相反,我想在GridSearchCV中明确指定训练、验证和测试数据的截止点。我可以这样做吗? 为了更好地阐明这个问题,这是我手动...

16得票5回答
Scikit-learn在DecisionTreeClassifier上使用GridSearchCV

我试图在DecisionTreeClassifier上使用GridSearchCV,但遇到以下错误: TypeError: unbound method get_params() must be called with DecisionTreeClassifier instance as fi...

16得票1回答
在使用GridSearchCV时,我是否需要拆分数据?

GridSearchCV使用StratifiedKFold或KFold。所以我的问题是,在使用GridSearch之前,是否应该将数据分成训练集和测试集,然后仅对测试数据进行拟合?我不确定是否有必要这样做,因为cv方法已经分割了数据,但我看到一些例子事先切分了数据。 谢谢。