138得票6回答
使用管道运算符%>%时的R条件评估

当使用管道操作符%>% 与诸如dplyr、ggvis、dycharts等包时,我如何有条件地执行一步操作?例如:step_1 %>% step_2 %>% if(condition) step_3 这些方法似乎不起作用:step_1 %>% step_2 if(co...

135得票6回答
使用dplyr按组计算行数

我正在使用mtcars数据集。 我想找到特定数据组合的记录数。 类似于SQL中count(*) group by子句的内容。 plyr中的ddply()对我有用。library(plyr) ddply(mtcars, .(cyl,gear),nrow) 有输出 cyl gear V1 1 ...

132得票10回答
R dplyr:删除多列

我有一个数据框和该数据框中的一些列,我想要删除这些列。让我们以iris数据集为例。我想删除Sepal.Length和Sepal.Width并仅使用其余的列。如何使用dplyr包中的select或select_实现这一点? 到目前为止,这是我尝试过的:drop.cols <- c('Sep...

130得票4回答
在dplyr::filter中将字符串作为变量名传递

我使用mtcars数据集来阐明我的问题。例如,我想将数据子集化为4缸汽车。我可以这样做: mtcars %>% filter(cyl == 4) 在我的工作中,我需要将一个字符串变量作为我的列名传递。例如: var <- 'cyl' mtcars %>% filter...

127得票7回答
使用dplyr过滤数据框的完整案例(逐案例删除)

有没有可能使用dplyr来过滤一个data.frame中的完整案例?当然可以使用complete.cases和所有变量的列表。但是当变量很多时,这种方法a)冗长,b)当变量名不知道时(例如在处理任何data.frame的函数中)是不可能的。 library(dplyr) df = data....

123得票7回答
dplyr中“rename”的替代方法

我喜欢plyr的重命名函数rename。我最近开始使用dplyr,想知道是否有一种像plyr的rename函数一样易于使用的dplyr函数来重命名变量?

122得票2回答
在dplyr中进行连接时如何指定x和y的列名?

我有两个数据框,想要使用dplyr进行合并。其中一个数据框包含名字。test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stri...

120得票3回答
dplyr使用条件值进行mutate

在一个包含四列的大型数据框("myfile")中,我需要添加第五列,该列的值基于前四列的条件而定。 首选使用和进行回答,主要是因为它在大型数据集中的速度快。 我的数据框看起来像这样: V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 3 1 4 1 ...

119得票9回答
使用dplyr查找重复元素

我尝试使用这里提供的代码来用dplyr查找所有重复元素,如下:library(dplyr) mtcars %>% mutate(cyl.dup = cyl[duplicated(cyl) | duplicated(cyl, from.last = TRUE)]) 我该如何将此处提供的代...

118得票6回答
按组获取最高值

这里是一个数据框的样例:d <- data.frame( x = runif(90), grp = gl(3, 30) ) 我想要包含每个grp值的前5个x值所在行的d子集。 使用基本R,我的方法大致如下:ordered <- d[order(d$x, decrea...