用R保存朴素贝叶斯进行训练,与Python中的pickle相当。

4

我一直在使用Python进行数据分析,并且一直想用R来进行情感分析。对于Python,我可以使用朴素贝叶斯算法并将其保存为pickle文件以便重复使用和继续训练,但是我不确定如何在R中做到这一点。

目前我已经使用e1071库对数据集进行了清洗、训练和测试。

convert_count <- function(x) {
  y <- ifelse(x > 0, 1,0)
  y <- factor(y, levels=c(0,1), labels=c("No", "Yes"))
  y
}

trainNB <- apply(dtm.train.nb, 2, convert_count)
testNB <- apply(dtm.test.nb, 2, convert_count)

system.time( classifier <- naiveBayes(trainNB, df.train$class, laplace = 1) )

system.time( pred <- predict(classifier, newdata=testNB) )
table("Predictions"= pred,  "Actual" = df.test$class )

有人能够解释一下,在使用R时,Python的pickle等效物会是什么吗? 我还有一个问题是,使用tm清理语料库,然后使用文档术语矩阵可以实现词袋吗?

谢谢

1个回答

0

我在Python中没有使用过pickling,但是它似乎只是压缩和保存对象,对吗?

如果是这样的话 - 我会使用“fst”包中的“write.fst”。它可以序列化数据框。当您想要再次访问该对象时,您需要执行“read.fst”操作。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接