我正在尝试将文本文档分类到多个类别中。 我的下面的代码运行良好。
matrix[[i]] <- create_matrix(trainingdata[[i]][,1], language="english",removeNumbers=FALSE,stemWords=FALSE,weighting=weightTf,minWordLength=3)
container[[i]] <- create_container(matrix[[i]],trainingdata[[i]][,2],trainSize=1:50,testSize=51:100) ,
models[[i]] <- train_models(container[[i]], algorithms=c("MAXENT","SVM"))
results[[i]] = classify_models(container[[i]],models[[i]])
当我尝试使用以下代码获取精确度、召回率和准确率值时:
analytic[[i]] <- create_analytics(container[[i]], results[[i]])
I get the following error:
Error in `row.names<-.data.frame`(`*tmp*`, value = c(NA_real_, NA_real_ :
duplicate 'row.names' are not allowed
我的分类
是以文本
格式呈现的。
如果我将这些分类
转换为数字
格式,那么上面的代码就可以正常工作。
是否有一种方法来保持分类
以文本
格式,并获得精度、召回率、准确率值。
我的目标是为多类分类器获取精度、召回率、准确率值和混淆矩阵。 是否有其他软件包可用于获取多类文本分类器(一对所有)的上述值。
factor(Categories)
吗? - Silence Dogood