我一直在使用Python进行数据分析,并且一直想用R来进行情感分析。对于Python,我可以使用朴素贝叶斯算法并将其保存为pickle文件以便重复使用和继续训练,但是我不确定如何在R中做到这一点。
目前我已经使用e1071库对数据集进行了清洗、训练和测试。
convert_count <- function(x) {
y <- ifelse(x > 0, 1,0)
y <- factor(y, levels=c(0,1), labels=c("No", "Yes"))
y
}
trainNB <- apply(dtm.train.nb, 2, convert_count)
testNB <- apply(dtm.test.nb, 2, convert_count)
system.time( classifier <- naiveBayes(trainNB, df.train$class, laplace = 1) )
system.time( pred <- predict(classifier, newdata=testNB) )
table("Predictions"= pred, "Actual" = df.test$class )
有人能够解释一下,在使用R时,Python的pickle等效物会是什么吗? 我还有一个问题是,使用tm清理语料库,然后使用文档术语矩阵可以实现词袋吗?
谢谢