8得票3回答
在cv_result中,“mean_test_score”的含义是什么?

你好,我正在使用scikit learn库的.cv_results_函数进行GridSearchCV,并打印结果。 我的问题是,当我手动计算所有测试分数拆分的平均值时,与'mean_test_score'中写的数字不同。这与标准的np.mean()有何不同? 我在此附上代码和结果: n_...

8得票2回答
Python - LightGBM with GridSearchCV,一直运行不停

最近,我正在进行多个实验来比较Python的XgBoost和LightGBM。似乎这个LightGBM是一种新的算法,人们说它在速度和准确性方面比XGBoost表现更好。 这是LightGBM GitHub。 这是LightGBM python API documents,这里你会找到可以调...

8得票1回答
GridSearchCV.best_score与cross_val_score(GridSearchCV.best_estimator_)不同

考虑以下的网格搜索: grid = GridSearchCV(clf, parameters, n_jobs=-1, iid=True, cv=5) grid_fit = grid.fit(X_train1, y_train1) 根据Sklearn的资源,grid_fit.best_scor...

8得票1回答
使用GridSearchCV得到的最佳参数

我不知道这个问题是否适合在这里提问,但我还是会问一下。如果不允许,请告诉我。 我已经使用 GridSearchCV 来调整参数以找到最佳准确性。这是我所做的: from sklearn.grid_search import GridSearchCV parameters = {'min_s...

8得票2回答
我该怎样使用GridSearchCV的结果绘制验证曲线?

我正在使用GridSearchCV训练模型,以找到最佳参数。 代码: grid_params = { 'n_estimators': [100, 200, 300, 400], 'criterion': ['gini', 'entropy'], 'max_features...

8得票1回答
为什么GridSearchCV模型的结果与我手动调整的模型不同?

这是我在这里的第一个问题,希望我做得没错。 我正在处理kaggle上流行的泰坦尼克号数据集,如果您想查看的话,这是教程“一个数据科学框架:实现99%的准确性”。 其中的5.2部分介绍了如何使用网格搜索和调整超参数。在我提出具体问题之前,让我与您分享相关代码; 这是使用GridSearch...

8得票1回答
如何在GridSearchCV中访问ColumnTransformer元素

我想了解在param_grid中针对ColumnTransformer(管道的一部分)中单个预处理器时所采用的正确命名规范,以进行网格搜索。 环境和样本数据: import seaborn as sns from sklearn.model_selection import train_t...

7得票1回答
使用管道和网格搜索来进行Doc2Vec的处理

我目前有以下脚本,可以帮助查找最佳的doc2vec模型。它的工作方式是:首先根据给定的参数训练几个模型,然后针对分类器进行测试。最后,它会输出最佳的模型和分类器(希望如此)。 数据 示例数据(data.csv)可在此处下载:https://pastebin.com/takYp6T8请注意,...

7得票1回答
网格搜索交叉验证(GridsearchCV):当尝试在参数中传递lambda函数时出现无法储存(pickle)函数的错误。

我在stackoverflow和其他地方广泛查找,但好像找不到下面问题的答案。 我正在尝试修改一个函数参数,该参数本身是sklearn中GridSearchCV函数内部的参数。 更具体地说,我想更改传递给CountVectorizer函数的tokenizer参数中的参数(在此处为preser...

7得票2回答
投票分类器中的超参数。

所以,我有一个分类器,它看起来像这样 clf = VotingClassifier(estimators=[ ('nn', MLPClassifier()), ('gboost', GradientBoostingClassifier()), ...