我使用tm包来清理Twitter语料库。但是,该包无法清除表情符号。
以下是复制的代码:
以下是复制的代码:
July4th_clean <- tm_map(July4th_clean, content_transformer(tolower))
Error in FUN(content(x), ...) : invalid input 'RT ElleJohnson Love of country is encircling the globes ������������������ july4thweekend July4th FourthOfJuly IndependenceDay NotAvailableOnIn' in 'utf8towcs'
有人能指导我如何使用tm包删除表情符号吗?
谢谢,
Luis