我在更新到dplyr开发版本0.8.99.9003后,在运行group_by和summarise()时收到了一个新消息(请参见帖子标题)。这里有一个重新创建输出的示例:library(tidyverse) library(hablar) df <- read_csv("year, wee...
我有一个类似这样的数据框 - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3...
我在使用dplyr语法方面有一些困难。我有一个数据框,其中包含不同的变量和一个分组变量。现在我想使用R中的dplyr计算每个组内每列的平均值。df <- data.frame( a = sample(1:5, n, replace = TRUE), b = sample...
我正在尝试将对plyr的理解转化为dplyr,但我无法弄清如何按多个列分组。 # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx...
我的问题涉及跨多列数据框求和,并使用 dplyr 创建相应的新列来进行总和。列中的数据条目是二进制的(0、1)。我考虑使用 dplyr 的 summarise_each 或 mutate_each 函数的逐行模拟。下面是数据框的最简示例:library(dplyr) df=data.frame...
我希望用dplyr选择每个组中具有最大值的行。 首先,我生成了一些随机数据来说明我的问题。set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在ply...
我知道 dplyr v3.0 允许您在不同的变量上进行连接: left_join(x, y, by = c("a" = "b")) 将把 x.a 与 y.b 相匹配。 但是,是否可以在组合变量上进行连接,还是必须事先添加组合键? 类似这样: left_join(x, y, by = c...
我正在R中运行一个示例,按照步骤进行,到目前为止一切都正常,除了这段代码会产生一个错误: words <- dtm %>% as.matrix %>% colnames %>% (function(x) x[nchar(x) < 20]) 错误:无法找...
我经常需要根据另一个变量的值来更改变量的值,例如这样:mtcars$mpg[mtcars$cyl == 4] <- NA 我尝试使用 dplyr 做这件事,但是失败惨重:mtcars %>% mutate(mpg = mpg == NA[cyl == 4]) %>% as.d...
在使用 plyr 时,我经常发现使用 adply 对每一行应用标量函数非常有用。 例如:data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)...