假设我有一个多类别、层级化的分类问题,例如“可食用”、“营养丰富”和“不营养丰富”,可以表示为:
├── edible
│ ├── nutritious
│ └── ~nutritious
└── ~edible
虽然支持多类分类的分类器或使用一对一/全方案的分类器可以获得合理的性能,但单独训练每个级别的分类器并将它们连接起来,以便将被分类为“可食用”的实例分类为
营养的
或不是可能也会有益处。我想使用
scikit-lean
估计器作为构建块,我想知道是否可以使Pipeline
支持此功能,或者是否需要编写自己的估计器来实现基本估计器和可能的BaseEnsemble
。@ogrisel曾在邮件列表中提到过这一点http://sourceforge.net/mailarchive/message.php?msg_id=31417048,我想知道是否有人对如何做出这样的尝试有见解或建议。