12得票1回答
rpart的结果是一个根节点,但数据显示信息增益

我的数据集中的事件发生率低于3%(即大约有700条记录属于类别1,而27000条记录属于类别0)。ID V1 V2 V3 V5 V6 Target SDataID3 161 ONE 1 FOUR 0 0 SDataID4 ...

11得票3回答
使用caret包应用k折交叉验证模型

首先,我要说我已经阅读了许多关于交叉验证的文章,似乎存在很多困惑。我理解的是: 进行k折交叉验证,例如10个fold,以了解在这10个fold中的平均误差。 如果可接受,则在完整数据集上训练模型。 我正尝试使用R中的rpart构建决策树,并利用caret包。以下是我使用的代码。# lo...

10得票1回答
使用rpart的决策树进行数据预测

我正在使用 R 对包含以下数据结构的数据帧“d”进行分类: 数据有 576666 行,“classLabel”列具有 3 级因子:ONE、TWO、THREE。 我正在使用 rpart 制作决策树。fitTree = rpart(d$classLabel ~ d$tripdurati...

10得票1回答
在R中使用rpart/ctree包预测数据集后,获取每行的决策树规则/路径模式。

我已经使用rpart和ctree在R中构建了一个决策树模型。 我还使用构建的模型预测了一个新数据集,并得到了预测的概率和类别。 然而,我想要提取规则/路径,以单个字符串的形式呈现每个观察值(在预测的数据集中)所遵循的路径。通过将这些数据以表格形式存储,我可以在不打开R的情况下自动化地解释预...

9得票1回答
为什么使用caret::train(..., method = "rpart")得到的结果与rpart::rpart(...)不同?

我正在参加Coursera实践机器学习课程,课程作业要求使用这个数据集构建预测模型。根据感兴趣的结果(标记为y,但实际上是数据集中的classe变量),将数据分割为training和testing数据集: inTrain <- createDataPartition(y = data$...

9得票2回答
rpart中CP表给出的树大小

在R包rpart中,决策树CP表中呈现的树的大小取决于什么?在下面的示例中,CP表默认仅呈现具有1、2和5个节点的树(分别为nsplit = 0、1和4)。 library(rpart) fit <- rpart(Kyphosis ~ Age + Number + Start, ...

9得票2回答
使用连续变量的决策树

我有一个关于使用连续变量的决策树的问题。 我听说当输出变量是连续的而输入变量是分类的时候,分割标准是降低方差之类的东西。但如果输入变量是连续的,我不知道它是如何工作的。 对于以下两种情况,我们如何获得像基尼指数或信息增益这样的分割标准? 1. 输入变量:连续 / 输出变量:分类 2. 输...

8得票4回答
使用rpart在回归树中搜索相应的节点

我很新于R语言,并卡在了一个相当愚蠢的问题上。 我正在使用rpart包来校准回归树,以进行分类和预测。 感谢R,校准部分易于完成且易于控制。 #the package rpart is needed library(rpart) # Loading of a big data file...

8得票3回答
r中的caret预测函数返回的输出比输入少。

我使用 caret 训练了下面的 rpart 模型。 trainIndex <- createDataPartition(d$Happiness, p=.8, list=FALSE) dtrain <- d[trainIndex, ] dtest <- d[-trainIn...

8得票6回答
获取rpart节点(即:CART)中的观测数据

我希望能够查看到达rpart决策树某个节点的所有观测数据。例如,在以下代码中: fit <- rpart(Kyphosis ~ Age + Start, data = kyphosis) fit n= 81 node), split, n, loss, yval, (yprob)...