随机森林中sampsize和classwt的区别

3
有人能解释一下R包中随机森林部分的sampsize和classwt之间的区别吗?假设问题是分类问题,这两个参数之间是否有关系?
谢谢。
1个回答

1

sampsize代表抽取的样本大小。因此,sampsize = 10表示抽取了10个样本。classwt是类别的加权。这可以用于加权随机森林。例如,您可以使用它来对更近期的数据进行加权处理,而不是旧数据(请参见here)。话虽如此,降采样(即减少样本大小)似乎与对类别进行加权一样有效(请参见here),因此您可以使用其中一个,也可以两者都不用。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接