随机森林摘要 - 如何阅读?

3

以下是我的代码:

library(randomforest)
fit <- randomforest(var_1~.,data = mydf, ntree=100, importance =TRUE)
summary(fit)

以下是输出内容的样例:

                Length Class  Mode     
call                 5 -none- call     
type                 1 -none- character
predicted       322479 factor numeric  
err.rate           300 -none- numeric  
confusion            6 -none- numeric  
votes           644958 matrix numeric  
oob.times       322479 -none- numeric  
classes              2 -none- character
importance          24 -none- numeric  
importanceSD        18 -none- numeric  
localImportance      0 -none- NULL     
proximity            0 -none- NULL     
ntree                1 -none- numeric  
mtry                 1 -none- numeric  
forest              14 -none- list     
y               322479 factor numeric  
test                 0 -none- NULL     
inbag                0 -none- NULL     
terms                3 terms  call 

我在哪里可以找到“summary”的解释?


我猜你是指随机森林。 - Michael R. Chernick
1个回答

3
randomForest函数中的summary功能实现不好/与其他模型的概述不一致。它只是打印一些内部变量、它们的类型和长度。可以在这里找到内部变量的详细信息。
我们可以通过print(fit)获取一些(最少量的)信息,通过使用fit$forest获取更多细节。原始代码由Leo用Fortran编写,当前实现由Andy使用C++编写。一些讨论可以在这里找到。

非常感谢。在Leo Breiman的页面上,我似乎找不到call是什么(摘要的第一行)。你的意思是说“没有实现好”吗? - user1700890
1
@user1700890 是的。我的意思是,RF模型的摘要不如其他模型的摘要好,或者它不符合R的“摘要标准”。 - hxd1011

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接