30得票5回答
在网格搜索中尝试多个估算器

在Sklearn或任何其他库中,有没有一种方法可以同时对多个估算器进行网格搜索(grid-search)。例如,我们可以在一个网格搜索中传递SVM和随机森林(Random Forest)吗?

29得票3回答
使用gridsearchcv出现内存泄漏问题

问题:运行gridsearchcv时似乎存在内存泄漏问题。当我使用1或32个并发工作器(n_jobs=-1)运行时会出现这种情况。之前在ubuntu 16.04上多次运行没有任何问题,但最近升级到18.04并进行了内存升级。import os import pickle from xgboos...

27得票2回答
如何优雅地将Sklearn的GridseachCV最佳参数传递给另一个模型?

我已经通过网格搜索交叉验证找到了最佳的超参数集合,适用于我的KNN估算器:>>> knn_gridsearch_model.best_params_ {'algorithm': 'auto', 'metric': 'manhattan', 'n_neighbors': 3} ...

25得票2回答
GridSearchCV是否执行交叉验证?

我目前正在解决一个问题,比较三种不同的机器学习算法在相同数据集上的表现。我将数据集分为70/30的训练/测试集,然后使用GridSearchCV和X_train, y_train寻找每个算法的最佳参数。 第一个问题是,我应该在训练集上执行网格搜索,还是整个数据集上执行? 第二个问题是,我知...

23得票1回答
ImportError: 找不到 grid_search 模块, learning_curve

使用Scikit learn时,我无法使用Sklearn的learning_curve和sklearn.grid_search功能。 当我尝试进行import sklearn(它可以工作)和from sklearn.cluster import bicluster(它也可以工作)时,我仍然遇...

22得票3回答
有没有更快的方法运行GridsearchCV?

我正在优化sklearn中SVC的一些参数,最大的问题是在尝试其他参数范围之前要等待30分钟。更糟糕的是,我想在同一范围内尝试更多c和gamma值(这样我可以创建更平滑的表面图),但我知道这只会需要越来越长的时间...今天我将cache_size从200更改为600(不知道它具体做什么),以查...

22得票2回答
属性错误:'GridSearchCV'对象没有'best_params_'属性。

网格搜索是一种寻找我们指定的组合中任何模型的最佳参数的方法。我已经按照以下方式对我的模型进行了网格搜索,并希望找到使用此网格搜索确定的最佳参数。 from sklearn.model_selection import GridSearchCV # Create the parameter g...

21得票2回答
scikit-learn多次重复的网格搜索交叉验证(GridSearchCV)

我正在尝试为SVR模型获取最佳参数集。 我想利用GridSearchCV在不同的C值上进行测试。 然而,从之前的测试中,我注意到将训练/测试集划分会极大地影响整体性能(在这种情况下为r2)。 为了解决这个问题,我想实现重复5倍交叉验证(10 x 5CV)。是否有一种内置的方法可以使用GridS...

20得票2回答
如何使用GridSearchCV输出来进行scikit预测?

在以下代码中:# Load dataset iris = datasets.load_iris() X, y = iris.data, iris.target rf_feature_imp = RandomForestClassifier(100) feat_selection = Sele...

20得票2回答
使用GridSearchCV时跳过禁止的参数组合

我想使用GridSearchCV来贪婪地搜索支持向量分类器的整个参数空间,但是某些参数组合被LinearSVC所禁止,并且会抛出异常。特别地,dual、penalty和loss参数存在互斥的组合: 例如,以下代码:from sklearn import svm, datasets from ...