11得票2回答
如何在交叉验证和网格搜索中实现SMOTE

我对Python比较陌生,您能帮我把SMOTE的实现改进成正式的管道吗?我想要在每个k-fold迭代的训练集上应用过采样和欠采样,以便模型在平衡数据集上进行训练,并在不平衡的剩余部分上进行评估。问题是这样做时,我无法使用熟悉的sklearn接口进行评估和网格搜索。 是否有可能制作类似于mod...

11得票1回答
Python/Scikit-learn中的无交叉验证随机搜索

如果你想在sklearn中进行网格搜索,但是不需要交叉验证(GridSearchCV的功能),似乎可以使用ParameterGrid类(请参见此处:Is there easy way to grid search without cross validation in python?)。是否有...

11得票4回答
GridSearchCV: "TypeError: 'StratifiedKFold' object is not iterable" 网格搜索交叉验证: "TypeError: 'StratifiedKFold'对象不可迭代"

我想在一个RandomForestClassifier中执行GridSearchCV,但是数据不平衡,所以我使用了StratifiedKFold:from sklearn.model_selection import StratifiedKFold from sklearn.grid_sear...

11得票2回答
网格搜索与LightGBM示例

我正在尝试使用 GridSearchCV 从 sklearn.model_selection 寻找适用于 lightgbm 模型的最佳参数。 我还没有找到真正有效的解决方案。 我已经设法设置了部分可工作的代码:import numpy as np import pandas as pd im...

11得票1回答
为什么scikit-learn中的GridSearchCV会产生这么多线程

这是我的当前运行的GridSearch的pstree输出,我很好奇正在进行什么进程,还有一些我尚不能解释的东西。 ├─bash─┬─perl───20*[bash───python─┬─5*[python───31*[{python}]]] │ │ ...

11得票1回答
在管道(Pipeline)中分类器后使用度量指标(metric)

我继续研究管道。我的目标是只使用管道来执行机器学习的每一步。这样将更加灵活,更易于适应其他用例。所以我做了以下几个步骤: 步骤1:填充NaN值 步骤2:将分类值转换为数字 步骤3:分类器 步骤4:GridSearch 步骤5:添加度量标准(失败) 这是我的代码:import panda...

10得票2回答
随机森林回归器和特征重要性错误

我正在努力从我的RandomForestRegressor中提取特征重要性,但是我遇到了: AttributeError: 'GridSearchCV'对象没有属性'feature_importances_'。 有人知道为什么会没有这个属性吗?根据文档,应该存在这个属性? 完整的...

10得票1回答
使用具有多个输入的网络进行Hyperas网格搜索

我目前在使用hyperas优化器时遇到了多输入网络的问题。 以下是我的实现方式:def data(): X_train, Y_train = next(train_generator()) X_test, Y_test = next(test_generator()) ...

9得票1回答
使用GridSearchCV调整scikit-learn中的随机森林超参数

我正在尝试使用随机森林解决我的问题(以下是波士顿数据集的示例代码,不是我的数据)。我计划使用GridSearchCV进行超参数调整,但不同参数的值范围应该是多少?如何确定我选择的范围是正确的? 我在网上阅读了相关内容,有人建议尝试在第二次网格搜索中“放大”最佳值(例如,如果它是10,则尝试[...

9得票2回答
解读sklearn的GridSearchCV最佳分数

我想了解GridSearchCV返回的分数和以下计算的R2评估指标之间的区别。在其他情况下,我收到的网格搜索得分非常低(cross_val_score也是如此),希望您能解释一下这是什么意思。 from sklearn import datasets from sklearn.model_s...