我无法使用rpart获得太多信息。
我有一个数据框:
a = structure(list(V1 = c(2, 3, 4, 2, 3, 2, 3, 3, 5, 3), V2 = c(15,
26, 94, 15, 26, 33, 33, 33, 5, 15), V3 = structure(c(1L, 1L,
1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L), .Label = c("f", "t"), class = "factor")), .Names = c("V1",
"V2", "V3"), row.names = c(NA, -10L), class = "data.frame")
> a
V1 V2 V3
1 2 15 f
2 3 26 f
3 4 94 f
4 2 15 f
5 3 26 f
6 2 33 f
7 3 33 f
8 3 33 t
9 5 5 t
10 3 15 t
> rpart(V3 ~ ., data=a)
n= 10
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 10 3 f (0.7000000 0.3000000) *
为什么rpart没有提供更多信息,例如(V1 == 2)有三个案例都导致响应为"f" (第1,4,6行)的事实?
本质上,我想找出:
- rpart在给出上述输出之前运行了哪些测试? - rpart是否包括了一个测试(V2 == 2) -> 响应统计数据,如果没有,我如何使其包括这样的测试和结果?
我已经阅读了rpart vignette,但是没有找到答案。