9得票1回答
为什么使用caret::train(..., method = "rpart")得到的结果与rpart::rpart(...)不同?

我正在参加Coursera实践机器学习课程,课程作业要求使用这个数据集构建预测模型。根据感兴趣的结果(标记为y,但实际上是数据集中的classe变量),将数据分割为training和testing数据集: inTrain <- createDataPartition(y = data$...

20得票4回答
R:绘制决策树标签时,叶子节点文本被截断

(我仍在学习如何在R中处理图像;这是对rpart package: Save Decision Tree to PNG 的延续)我试图将rpart生成的决策树图以PNG格式保存,而不是提供的Postscript。我的代码看起来像这样:png("tree.png", width=1000, he...

8得票3回答
R中caret rpart返回错误:“在`[.data.frame`(m, labs)中选择未定义的列”。

我将要为rpart运行一个分类任务。因为需要在多个模型中运行它,所以我需要将数据准备成稀疏格式。 当我使用以下指令运行rpart方法: control <- trainControl(method="repeatedcv", number=10, repeats=3) #Metric...

10得票1回答
在R中使用rpart/ctree包预测数据集后,获取每行的决策树规则/路径模式。

我已经使用rpart和ctree在R中构建了一个决策树模型。 我还使用构建的模型预测了一个新数据集,并得到了预测的概率和类别。 然而,我想要提取规则/路径,以单个字符串的形式呈现每个观察值(在预测的数据集中)所遵循的路径。通过将这些数据以表格形式存储,我可以在不打开R的情况下自动化地解释预...

9得票2回答
使用连续变量的决策树

我有一个关于使用连续变量的决策树的问题。 我听说当输出变量是连续的而输入变量是分类的时候,分割标准是降低方差之类的东西。但如果输入变量是连续的,我不知道它是如何工作的。 对于以下两种情况,我们如何获得像基尼指数或信息增益这样的分割标准? 1. 输入变量:连续 / 输出变量:分类 2. 输...

7得票4回答
获取rpart模型节点的id/name

如何获取每行模型的终端节点的ID(或名称)?predict.rpart只能返回分类树的预测类别(数字或因子)、类别概率或某些组合(使用type="matrix")。 我想做如下操作: fit <- rpart(Kyphosis ~ Age + Number + Start, data ...

9得票2回答
rpart中CP表给出的树大小

在R包rpart中,决策树CP表中呈现的树的大小取决于什么?在下面的示例中,CP表默认仅呈现具有1、2和5个节点的树(分别为nsplit = 0、1和4)。 library(rpart) fit <- rpart(Kyphosis ~ Age + Number + Start, ...

19得票4回答
在评估表达式时出现错误:未找到对象。

我不理解这里出了什么问题。 data.train <- read.table("Assign2.WineComplete.csv",sep=",",header=T) # Building decision tree Train <- data.frame(residual.su...

32得票1回答
如何从决策树中计算错误率?

有人知道如何使用R计算决策树的错误率吗?我正在使用rpart()函数。

7得票3回答
使用Rpart软件生成的测试规则

我希望以编程的方式测试从树中生成的一条规则。在树中,从根到叶子节点(终端节点)的路径可以被解释为一条规则。 在R中,我们可以使用“rpart”包并执行以下操作: (在本文中,我将仅使用“鸢尾花”数据集作为示例目的) library(rpart) model <- rpart(Spec...