如果我有一个训练好的随机森林,有没有办法让我得到森林在测试样本上获得的每个类别的票数?更好的是能得到百分比。
类似于CVRTrees::predict,但同时获得原始输出和预测类别。
谢谢
编辑:为了进一步解释我的目标,这样我就可以潜在地得到解决我的问题而不是我的问题的答案。
回答我知道多少,很少。
这是一个现实世界的应用程序,我正在尽快使自己了解所有这些内容。
基本上,我正在研究判别分类器,并要求我能够比较2(或更多)独立分类器之间的输出。我指的是它们可能或可能不知道整个类别集合的意义,但是存在一个类别集合,其中所有分类器都包含此类别的子集。
我的最初想法是从每个分类器收集关于分类的元信息,理想情况下,这些信息将包含某种形式的(有15%的可能性是A,有78%的可能性是B)[我知道“可能性”是一个不好的词,但我会留下它]。如果我能得到那个输出,我就能根据分配给每个分类器的动态性能权重进行最终分类。
这个想法是我可以使用非常简单的基于规则的分类器来进行初始分类,而更奇特的分类器有时间进行训练。理想情况下,学习分类器可能支持比规则分类器更多的类别,并且随着时间的推移,它主要用于分类。
类似于CVRTrees::predict,但同时获得原始输出和预测类别。
谢谢
编辑:为了进一步解释我的目标,这样我就可以潜在地得到解决我的问题而不是我的问题的答案。
回答我知道多少,很少。
这是一个现实世界的应用程序,我正在尽快使自己了解所有这些内容。
基本上,我正在研究判别分类器,并要求我能够比较2(或更多)独立分类器之间的输出。我指的是它们可能或可能不知道整个类别集合的意义,但是存在一个类别集合,其中所有分类器都包含此类别的子集。
我的最初想法是从每个分类器收集关于分类的元信息,理想情况下,这些信息将包含某种形式的(有15%的可能性是A,有78%的可能性是B)[我知道“可能性”是一个不好的词,但我会留下它]。如果我能得到那个输出,我就能根据分配给每个分类器的动态性能权重进行最终分类。
这个想法是我可以使用非常简单的基于规则的分类器来进行初始分类,而更奇特的分类器有时间进行训练。理想情况下,学习分类器可能支持比规则分类器更多的类别,并且随着时间的推移,它主要用于分类。