我正在使用R中的wordcloud包和"Word Cloud in R"的帮助创建一个词云。
我可以很容易地完成这个任务,但我想从词云中删除一些单词。我有一个文件(实际上是一个Excel文件,但我可以更改),我想要排除其中所有的几百个单词。你有什么建议?
我可以很容易地完成这个任务,但我想从词云中删除一些单词。我有一个文件(实际上是一个Excel文件,但我可以更改),我想要排除其中所有的几百个单词。你有什么建议?
require(XML)
require(tm)
require(wordcloud)
require(RColorBrewer)
ap.corpus=Corpus(DataframeSource(data.frame(as.character(data.merged2[,6]))))
ap.corpus=tm_map(ap.corpus, removePunctuation)
ap.corpus=tm_map(ap.corpus, tolower)
ap.corpus=tm_map(ap.corpus, function(x) removeWords(x, stopwords("english")))
ap.tdm=TermDocumentMatrix(ap.corpus)
ap.m=as.matrix(ap.tdm)
ap.v=sort(rowSums(ap.m),decreasing=TRUE)
ap.d=data.frame(word = names(ap.v),freq=ap.v)
table(ap.d$freq)
stopwords("english")
,也可以添加来自 Excel 文件的停用词。您可以将单词向量组合成一个停用词向量。这些单词将在词云中被排除。 - Tyler Rinker