得票数最多 'imbalanced-data' 问题

关联标签

114得票6回答

scikit-learn .predict() 默认阈值

我正在处理一个具有不平衡类别（5％为1的类）的分类问题。我想要预测类别而不是概率。在二元分类问题中，scikit的classifier.predict()默认使用0.5吗？如果没有，默认方法是什么？如果是，如何更改？在scikit中，一些分类器具有class_weight = 'auto'...

pythonmachine-learningscikit-learnclassificationimbalanced-data

18得票7回答

属性错误：'SMOTE'对象没有'_validate_data'属性。

我正在使用SMOTE对我的数据（多类）进行重新采样。sm = SMOTE(random_state=1) X_res, Y_res = sm.fit_resample(X_train, Y_train) 然而，我遇到了这个属性错误。有人可以帮忙吗？

pythonscikit-learnimbalanced-dataimblearn

15得票4回答

没有名为'sklearn.neighbors._base'的模块。

我最近在jupyter中使用命令安装了imblearn包!pip show imbalanced-learn 但我无法导入这个包。from tensorflow.keras import backend from imblearn.over_sampling import SMOTE 我收到了...

pythonscikit-learnimbalanced-dataimblearn

14得票2回答

XGBoost用于多分类和不平衡数据的处理

我正在处理一个包含3个类别[0,1,2]的分类问题，类别分布不平衡，如下所示。我想使用Python中的XGBClassifier来解决这个分类问题，但是模型不响应class_weight的调整，而是偏向于多数类0，而忽略少数类1,2。除了class_weight以外，还有哪些超参数可以帮助...

pythonxgboostmulticlass-classificationimbalanced-dataxgbclassifier

7得票3回答

使用sklearn.train_test_split处理不平衡数据

我有一个非常不平衡的数据集。我使用了sklearn.train_test_split函数提取训练集。现在我想对训练集进行过采样，所以我计算了类型1的数量（我的数据集有两个类别和类型（type1和type2），但几乎所有的训练数据都是type1）。因此，我无法进行过采样。之前，我使用自己编写...

python-3.xscikit-learntraining-dataimbalanced-dataoversampling