114得票6回答
scikit-learn .predict() 默认阈值

我正在处理一个具有不平衡类别(5%为1的类)的分类问题。我想要预测类别而不是概率。 在二元分类问题中,scikit的classifier.predict()默认使用0.5吗?如果没有,默认方法是什么?如果是,如何更改? 在scikit中,一些分类器具有class_weight = 'auto'...

18得票7回答
属性错误:'SMOTE'对象没有'_validate_data'属性。

我正在使用SMOTE对我的数据(多类)进行重新采样。sm = SMOTE(random_state=1) X_res, Y_res = sm.fit_resample(X_train, Y_train) 然而,我遇到了这个属性错误。有人可以帮忙吗?

15得票4回答
没有名为'sklearn.neighbors._base'的模块。

我最近在jupyter中使用命令安装了imblearn包!pip show imbalanced-learn 但我无法导入这个包。from tensorflow.keras import backend from imblearn.over_sampling import SMOTE 我收到了...

14得票2回答
XGBoost用于多分类和不平衡数据的处理

我正在处理一个包含3个类别[0,1,2]的分类问题,类别分布不平衡,如下所示。 我想使用Python中的XGBClassifier来解决这个分类问题,但是模型不响应class_weight的调整,而是偏向于多数类0,而忽略少数类1,2。除了class_weight以外,还有哪些超参数可以帮助...

7得票3回答
使用sklearn.train_test_split处理不平衡数据

我有一个非常不平衡的数据集。我使用了sklearn.train_test_split函数提取训练集。现在我想对训练集进行过采样,所以我计算了类型1的数量(我的数据集有两个类别和类型(type1和type2),但几乎所有的训练数据都是type1)。因此,我无法进行过采样。 之前,我使用自己编写...