24得票3回答
浏览 tibble 时只能查看10行以上的内容存在问题。

首先 - 我是一个编程和R的初学者,如果这是一个愚蠢的问题,请原谅我。我在查看从以下代码生成的tibble时遇到了麻烦,因为无法查看超过十行。 下面的代码旨在查找一本书中最常见的单词。我得到了我想要的结果,但是如何查看超过10行的数据呢?据我所知,它没有被保存为我可以调用的数据框。 lib...

18得票1回答
ggplot出现“非有限值”错误

我有一个R数据框(df),看起来像这样:blogger; word; n; total joe; dorothy; 17; 718 paul; sheriff; 10; 354 joe; gray; 9; 718 joe; toto; 9; 718 mick; robin; 9; 607 pa...

10得票2回答
unnest_tokens的相反操作

这可能是一个愚蠢的问题,但我已经谷歌了很久,但找不到解决方案。我认为这是因为我不知道用什么词语来搜索我的问题。 我有一个数据框,在R中将其转换为整洁文本格式以去除停止词。现在我想要将该数据框“还原”回其原始格式。 什么是unnest_tokens的相反/逆命令? 编辑:这是我正在处理的数...

8得票2回答
在R中的tidytext中使用unnest_tokens()保留标点符号

我在R中使用tidytext包进行n-gram分析。 由于我正在分析推文,我希望保留@和#以捕获提及、转发和标签。然而,unnest_tokens函数会自动删除所有标点符号并将文本转换为小写。 我发现unnest_tokens有一个选项可以使用正则表达式来清理文本,即token='rege...