如果因子变量为"Climate",有4个可能的值:热带(Tropical)、干旱(Arid)、温带(Temperate)和雪(Snow),并且我
rpart
树中的一个节点标记为"Climate:ab",那么这个分割点是什么?rpart
树中的一个节点标记为"Climate:ab",那么这个分割点是什么?我假设您使用的是绘制树形结构的标准方法,即
plot(f)
text(f)
根据text.rpart
的帮助文档,参数pretty
在默认情况下将因子变量表示为字母,因此a
表示levels(Climate)[1]
,这意味着左节点上的观察值具有Climate==levels(Climate)[1]
,右节点上则是其他观察值。你可以直接打印出水平层次(levels)。plot(f)
text(f, pretty=1)
但我建议使用maptree package中的draw.tree
:
require(maptree)
draw.tree(f)
我使用了虚假数据来制作绘图:
X <- data.frame(
y=rep(1:4,25),
Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25)
)
f <- rpart(y~Climate, X)