我是一名新手,开始使用tidytext包。
我正在尝试使用参数传递到unnest_tokens
函数中,以便我可以进行多列分析。所以,不是这样:
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)
original_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup()
original_books
tidy_books <- original_books %>%
unnest_tokens(word, text)
最后一行代码应该是:
output<- 'word'
input<- 'text'
tidy_books <- original_books %>%
unnest_tokens(output, input)
但我得到了这个错误信息:
在检查输入(x)时出现错误: 输入必须是任意长度的字符向量或每个向量长度为1的字符向量列表。
我尝试使用as.character()
,但没有什么运气。
有什么想法可以解决这个问题吗?
austen_books
是一个在github上的包中的函数,https://github.com/juliasilge/janeaustenr/blob/master/R/austen_books.R -我自己也很惊讶... - Cyrus Mohammadian