我正在尝试使用XGBoost算法解决多分类问题,但是我不知道predict_proba
函数的确切工作原理。实际上,predict_proba
会生成一个概率列表,但我不知道每个概率与哪个类别相关。
以下是一个简单的示例:
这是我的训练数据:
+------------+----------+-------+
| feature1 | feature2 | label |
+------------+----------+-------+
| x | z | 3 |
+------------+----------+-------+
| y | u | 0 |
+------------+----------+-------+
| x | u | 2 |
+------------+----------+-------+
然后当我试图为一个新的例子预测概率时,
model.predict_proba(['x','u'])
这将返回类似于以下内容的结果:
[0.2, 0.3, 0.5]
我的问题是:哪个类别的概率为0.5?是类别2、3还是0?