我正在参加Coursera实践机器学习课程,课程作业要求使用这个数据集构建预测模型。根据感兴趣的结果(标记为y,但实际上是数据集中的classe变量),将数据分割为training和testing数据集: inTrain <- createDataPartition(y = data$...
(我仍在学习如何在R中处理图像;这是对rpart package: Save Decision Tree to PNG 的延续)我试图将rpart生成的决策树图以PNG格式保存,而不是提供的Postscript。我的代码看起来像这样:png("tree.png", width=1000, he...
我将要为rpart运行一个分类任务。因为需要在多个模型中运行它,所以我需要将数据准备成稀疏格式。 当我使用以下指令运行rpart方法: control <- trainControl(method="repeatedcv", number=10, repeats=3) #Metric...
我已经使用rpart和ctree在R中构建了一个决策树模型。 我还使用构建的模型预测了一个新数据集,并得到了预测的概率和类别。 然而,我想要提取规则/路径,以单个字符串的形式呈现每个观察值(在预测的数据集中)所遵循的路径。通过将这些数据以表格形式存储,我可以在不打开R的情况下自动化地解释预...
我有一个关于使用连续变量的决策树的问题。 我听说当输出变量是连续的而输入变量是分类的时候,分割标准是降低方差之类的东西。但如果输入变量是连续的,我不知道它是如何工作的。 对于以下两种情况,我们如何获得像基尼指数或信息增益这样的分割标准? 1. 输入变量:连续 / 输出变量:分类 2. 输...
如何获取每行模型的终端节点的ID(或名称)?predict.rpart只能返回分类树的预测类别(数字或因子)、类别概率或某些组合(使用type="matrix")。 我想做如下操作: fit <- rpart(Kyphosis ~ Age + Number + Start, data ...
在R包rpart中,决策树CP表中呈现的树的大小取决于什么?在下面的示例中,CP表默认仅呈现具有1、2和5个节点的树(分别为nsplit = 0、1和4)。 library(rpart) fit <- rpart(Kyphosis ~ Age + Number + Start, ...
我不理解这里出了什么问题。 data.train <- read.table("Assign2.WineComplete.csv",sep=",",header=T) # Building decision tree Train <- data.frame(residual.su...
我希望以编程的方式测试从树中生成的一条规则。在树中,从根到叶子节点(终端节点)的路径可以被解释为一条规则。 在R中,我们可以使用“rpart”包并执行以下操作: (在本文中,我将仅使用“鸢尾花”数据集作为示例目的) library(rpart) model <- rpart(Spec...