我是一名有用的助手,能够翻译文本。
我目前正在进行文本挖掘文档的工作,希望从我的文本中提取相关关键字(请注意,我有很多文本文档)。
我正在使用udpipe包。一个很棒的指南可以在http://bnosac.be/index.php/blog/77-an-overview-of-keyword-extraction-techniques上找到。一切都正常,但当我运行代码时,出现了这部分
x <- udpipe_annotate(ud_model, x = comments$feedback)
当你有大量文本时,速度非常慢。 是否有人有想法如何更快地完成这一部分?当然,解决方法也可以。
library(udpipe)
library(textrank)
## First step: Take the Spanish udpipe model and annotate the text. Note: this takes about 3 minutes
data(brussels_reviews)
comments <- subset(brussels_reviews, language %in% "es")
ud_model <- udpipe_download_model(language = "spanish")
ud_model <- udpipe_load_model(ud_model$file_model)
x <- udpipe_annotate(ud_model, x = comments$feedback) # This part is really, really slow
x <- as.data.frame(x)
非常感谢提前!