LightGBM的多分类或多标签分类

6

我正在从事一个分类项目,其中一个结果可能属于多个类。例如,结果可能属于A类、B类和/或C类;例如,A、B、A&B、A&C、B&C等。然而,我想预测一种类的概率。例如,P(A)=包含A类的结果的概率;例如,Pr(A)+Pr(A&B)+Pr(A&C)+Pr(A&B&C)。

我更喜欢使用LightGBM。我的问题如下:

  1. 对于LightGBM,结果类必须是互斥的吗?
  2. 对于LightGBM,multiclass和multiclassova有什么区别?
  3. 如果我将其建模为多标签分类(例如,N类)问题,是否相当于2^N多类分类,每个类都是N类的one-hot编码?
1个回答

0
这主要取决于你如何处理给定多类分类的概率。
例如,LGBM的.predict()方法返回在给定观测中可能发生的类别(最高概率),但如果你调用.predict_proba()方法,它将返回N个值(N为类别数)。
所以,如果你想实现非互斥的预测,我建议将每个预测与某个值进行比较,比如0.33,如果预测大于或等于该值,则分配相应的类别。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接