用太阳图形式绘制rpart决策树模型

3
我找到了一种使用sunburstR包从rpart绘制决策树解决方案的方法。要绘制太阳图,需要一个代表序列的数据框。我将决策树结果修改为以下序列形式。
决策树的结果如下:
rpart(Species~.,data=iris)

n= 150 

node), split, n, loss, yval, (yprob)
      * denotes terminal node

1) root 150 100 setosa (0.33333333 0.33333333 0.33333333)  
  2) Petal.Length< 2.45 50   0 setosa (1.00000000 0.00000000 0.00000000) *
  3) Petal.Length>=2.45 100  50 versicolor (0.00000000 0.50000000 0.50000000)  
    6) Petal.Width< 1.75 54   5 versicolor (0.00000000 0.90740741 0.09259259) *
    7) Petal.Width>=1.75 46   1 virginica (0.00000000 0.02173913 0.97826087) * 

太阳花的序列:

sequences_1<-1
sequences_1<-data.frame(sequences_1)
sequences_1[1:3,]<-1
sequences_1$V1[1]<-"Petal.Length<_2.45-setosa"
sequences_1$V1[2]<-"Petal.Length>=2.45-Petal.Width<_1.75_54_5-versicolor"
sequences_1$V1[3]<-"Petal.Length>=2.45-Petal.Width>=1.75_46_1-virginica"
sequences_1$V2[1]<-50
sequences_1$V2[2]<-54
sequences_1$V2[3]<-46
sequences_1$sequences_1<-NULL

绘制旭日图:
library(sunburstR)
sunburst(sequences_1,count=TRUE)

关于太阳爆炸图的序列,我是手动设置的。有人知道如何从rpart决策树的结果自动构建类似上述的序列吗?

1个回答

2

d3r提供了一个函数d3_party,可以将rpart/partykit转换为d3层次结构。只需对"rule"进行一次小修改,sunburst就可以使用d3_party的结果,并将其变为"name"。虽然这种方法并不完美,但在大多数情况下都能完美运作。

library(rpart)
library(d3r)
# d3_party requires partykit
# install.packages("partykit")
library(sunburstR)

rp <- rpart(Species~.,data=iris)
rp_d3 <- d3_party(rp)

# one trick/hack required since sunburst expects
#   name but d3_party gives rule
#   this is ugly but let's replace all "rule" with "name"
#   with gsub
rp_d3 <- gsub(
  x = rp_d3,
  pattern = '"rule":',
  replacement = '"name":'
)

sunburst(
  rp_d3,
  valueField = "n",
  sumNodes = FALSE,
  count = TRUE,
  legend = FALSE
)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接