7得票2回答
如何在r语言中处理包含超过500万条观测值的数据框时加快迭代速度?

我正试图在数百万个观测值上生成7个或多个变量的值,当我使用for循环实现时,它需要很长时间。以下是我尝试实现的示例。在这种情况下,由于只有几千个观测值,所以速度很快: # Load dplyr library(tidyverse) set.seed(50) df <- data_...

20得票4回答
如何获取最后一个非零元素的位置

我有一个二进制变量,表示事件是否发生: event <- c(0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0) 我需要获取一个变量,以指示上次事件发生的时间。预期输出应为:last_event <- c(0, 0, 0, 0, 5, ...

10得票1回答
dplyr::pull与purrr::pluck和magrittr::extract2有何不同?

过去,在使用数据框时,想要将单个列作为向量获取,我会像这样使用 magrittr::extract2(): mtcars %>% mutate(wt_to_hp = wt/hp) %>% extract2('wt_to_hp') 但我发现 dplyr::pull() ...

18得票1回答
ggplot出现“非有限值”错误

我有一个R数据框(df),看起来像这样:blogger; word; n; total joe; dorothy; 17; 718 paul; sheriff; 10; 354 joe; gray; 9; 718 joe; toto; 9; 718 mick; robin; 9; 607 pa...

10得票3回答
在pkgdown参考yaml中包含“所有其他函数”

我在pkgdown网站上将一些函数按类别分组放在参考.yml文件中。我想知道是否有一种方式可以将所有未分类的函数放入它们自己的分类中。我唯一的想法是使用matches函数,例如:reference: - title: "someCategory" contents: - myFunct...

8得票1回答
使用tidyverse在R中重新调整因子水平和排序因子。

我想在我的数据框中使用函数relevel()和reorder()。我知道relevel的工作原理,但我不明白为什么在我的数据框中看不到级别的变化。例如,假设我有鸢尾花数据集。 library(tidyverse) head(iris) #> Sepal.Length Sepal....

8得票4回答
使用 mutate(在管道中)替换字符串的一部分

我希望替换字符串的一部分(在第一个下划线之间,第一组始终为“i”),例如以下基本R示例: library(dplyr) library(stringr) d <- tibble(txt = c("i_0000_GES", "i_0000_OISO", "i_0000_ASE1333"...

15得票5回答
tidyverse未加载,显示“命名空间‘vctrs’0.2.0已加载,但需要>= 0.2.1”。

强调文本我一直在安装tidyverse包时遇到问题,这导致我无法执行许多文本处理任务。这个问题与2017年以来许多先前的线程中提到的问题相同,即当我输入library(tidyverse)或尝试打开其他相关包时,它们总是说需要0.2.1版本的vctrs。我已经尝试使用remote下载或下载其他...

8得票3回答
如何在R中为Voronoi树图添加多边形数据?

我有一个数据框,长这样。它包含每个国家的向日葵种子生产率。 我想在这个数据旁边添加多边形数据,以便我可以使用ggplot2绘图。 有人告诉我要使用此网站:https://observablehq.com/@ladataviz/wip-voronoi-data-generator,我想了解如何...

7得票1回答
只有在提供参数时才进行可选分组的dplyr函数

我需要编写一个dplyr函数来创建自定义的区域图。以下是我的尝试。 area_plot <- function(data, what, by){ by <- ensym(by) what <- ensym(what) data %>% filt...