得票数最多 'dplyr' 问题 - 第2页

关联标签

200得票6回答

如何解释dplyr消息`summarise()`通过“x”重新分组输出（使用`.groups`参数覆盖）？

我在更新到dplyr开发版本0.8.99.9003后，在运行group_by和summarise()时收到了一个新消息（请参见帖子标题）。这里有一个重新创建输出的示例：library(tidyverse) library(hablar) df <- read_csv("year, wee...

rdplyrsummarize

196得票6回答

使用dplyr去除重复的行

我有一个类似这样的数据框 - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3...

rdplyr

190得票5回答

使用dplyr对多列进行汇总？

我在使用dplyr语法方面有一些困难。我有一个数据框，其中包含不同的变量和一个分组变量。现在我想使用R中的dplyr计算每个组内每列的平均值。df <- data.frame( a = sample(1:5, n, replace = TRUE), b = sample...

rdplyraggregate

183得票10回答

在dplyr中按多列分组，使用字符串向量输入

我正在尝试将对plyr的理解转化为dplyr，但我无法弄清如何按多个列分组。 # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx...

rdplyrr-faq

172得票9回答

使用dplyr在多列中求和

我的问题涉及跨多列数据框求和，并使用 dplyr 创建相应的新列来进行总和。列中的数据条目是二进制的（0、1）。我考虑使用 dplyr 的 summarise_each 或 mutate_each 函数的逐行模拟。下面是数据框的最简示例：library(dplyr) df=data.frame...

rdplyr

162得票6回答

如何使用dplyr选择每个组中具有最大值的行？

我希望用dplyr选择每个组中具有最大值的行。首先，我生成了一些随机数据来说明我的问题。set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在ply...

rdplyrplyrgreatest-n-per-group

155得票2回答

dplyr可以在多个列或组合键上进行连接吗？

我知道 dplyr v3.0 允许您在不同的变量上进行连接: left_join(x, y, by = c("a" = "b")) 将把 x.a 与 y.b 相匹配。但是，是否可以在组合变量上进行连接，还是必须事先添加组合键？类似这样: left_join(x, y, by = c...

rdplyr

147得票4回答

错误：找不到函数“%>％”。

我正在R中运行一个示例，按照步骤进行，到目前为止一切都正常，除了这段代码会产生一个错误： words <- dtm %>% as.matrix %>% colnames %>% (function(x) x[nchar(x) < 20]) 错误：无法找...

rdplyrmagrittr

147得票2回答

使用dplyr更改变量的值

我经常需要根据另一个变量的值来更改变量的值，例如这样：mtcars$mpg[mtcars$cyl == 4] <- NA 我尝试使用 dplyr 做这件事，但是失败惨重：mtcars %>% mutate(mpg = mpg == NA[cyl == 4]) %>% as.d...

rdataframedplyr

144得票8回答

使用dplyr将函数应用于表格的每一行？

在使用 plyr 时，我经常发现使用 adply 对每一行应用标量函数非常有用。例如：data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)...

rplyrdplyr