200得票6回答
如何解释dplyr消息`summarise()`通过“x”重新分组输出(使用`.groups`参数覆盖)?

我在更新到dplyr开发版本0.8.99.9003后,在运行group_by和summarise()时收到了一个新消息(请参见帖子标题)。这里有一个重新创建输出的示例:library(tidyverse) library(hablar) df <- read_csv("year, wee...

196得票6回答
使用dplyr去除重复的行

我有一个类似这样的数据框 - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3...

190得票5回答
使用dplyr对多列进行汇总?

我在使用dplyr语法方面有一些困难。我有一个数据框,其中包含不同的变量和一个分组变量。现在我想使用R中的dplyr计算每个组内每列的平均值。df <- data.frame( a = sample(1:5, n, replace = TRUE), b = sample...

183得票10回答
在dplyr中按多列分组,使用字符串向量输入

我正在尝试将对plyr的理解转化为dplyr,但我无法弄清如何按多个列分组。 # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx...

172得票9回答
使用dplyr在多列中求和

我的问题涉及跨多列数据框求和,并使用 dplyr 创建相应的新列来进行总和。列中的数据条目是二进制的(0、1)。我考虑使用 dplyr 的 summarise_each 或 mutate_each 函数的逐行模拟。下面是数据框的最简示例:library(dplyr) df=data.frame...

162得票6回答
如何使用dplyr选择每个组中具有最大值的行?

我希望用dplyr选择每个组中具有最大值的行。 首先,我生成了一些随机数据来说明我的问题。set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在ply...

155得票2回答
dplyr可以在多个列或组合键上进行连接吗?

我知道 dplyr v3.0 允许您在不同的变量上进行连接: left_join(x, y, by = c("a" = "b")) 将把 x.a 与 y.b 相匹配。 但是,是否可以在组合变量上进行连接,还是必须事先添加组合键? 类似这样: left_join(x, y, by = c...

147得票4回答
错误:找不到函数“%>%”。

我正在R中运行一个示例,按照步骤进行,到目前为止一切都正常,除了这段代码会产生一个错误: words <- dtm %>% as.matrix %>% colnames %>% (function(x) x[nchar(x) < 20]) 错误:无法找...

147得票2回答
使用dplyr更改变量的值

我经常需要根据另一个变量的值来更改变量的值,例如这样:mtcars$mpg[mtcars$cyl == 4] <- NA 我尝试使用 dplyr 做这件事,但是失败惨重:mtcars %>% mutate(mpg = mpg == NA[cyl == 4]) %>% as.d...

144得票8回答
使用dplyr将函数应用于表格的每一行?

在使用 plyr 时,我经常发现使用 adply 对每一行应用标量函数非常有用。 例如:data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)...