尝试使用 gbm 或 rpart 模型进行拟合时,我多次遇到此错误。最终,我使用公开可用的数据成功地重现了这个错误。我注意到,在使用CV(或重复cv)时会出现此错误。当我不使用任何拟合控制时,就不会出现此错误。有人能够解释一下为什么我始终都会遇到这个错误吗?fitControl= trainC...
我正在参加Coursera实践机器学习课程,课程作业要求使用这个数据集构建预测模型。根据感兴趣的结果(标记为y,但实际上是数据集中的classe变量),将数据分割为training和testing数据集: inTrain <- createDataPartition(y = data$...
我不理解这里出了什么问题。 data.train <- read.table("Assign2.WineComplete.csv",sep=",",header=T) # Building decision tree Train <- data.frame(residual.su...
我将要为rpart运行一个分类任务。因为需要在多个模型中运行它,所以我需要将数据准备成稀疏格式。 当我使用以下指令运行rpart方法: control <- trainControl(method="repeatedcv", number=10, repeats=3) #Metric...
我目前正在使用 rpart 包来拟合一个回归树,数据具有相对较少的观测值和数千个分类预测变量,这些变量只有两个可能的值。从在较小的数据上测试该包的结果来看,在这种情况下,无论我将回归变量声明为分类变量(即因子)还是保留它们(它们被编码为+/-1),都没有关系。 然而,我仍然想了解为什么将我的...
我可以使用Rpart在基础R中使用Kyphosis数据集创建一棵树: fit <- rpart(Kyphosis ~ Age + Number + Start, method="class", data=kyphosis) printcp(fit) plot(fit,...
我有一个数据集,其中包含14个特征,其中一些如下所示,性别和婚姻状况是分类变量。 height,sex,maritalStatus,age,edu,homeType SEX 1. Male 2. Female MARITAL STATUS ...
我正在使用 R 对包含以下数据结构的数据帧“d”进行分类: 数据有 576666 行,“classLabel”列具有 3 级因子:ONE、TWO、THREE。 我正在使用 rpart 制作决策树。fitTree = rpart(d$classLabel ~ d$tripdurati...
我希望能够查看到达rpart决策树某个节点的所有观测数据。例如,在以下代码中: fit <- rpart(Kyphosis ~ Age + Start, data = kyphosis) fit n= 81 node), split, n, loss, yval, (yprob)...
我希望以编程的方式测试从树中生成的一条规则。在树中,从根到叶子节点(终端节点)的路径可以被解释为一条规则。 在R中,我们可以使用“rpart”包并执行以下操作: (在本文中,我将仅使用“鸢尾花”数据集作为示例目的) library(rpart) model <- rpart(Spec...