我希望用dplyr选择每个组中具有最大值的行。 首先,我生成了一些随机数据来说明我的问题。set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在ply...
在使用 plyr 时,我经常发现使用 adply 对每一行应用标量函数非常有用。 例如:data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)...
我正在使用mtcars数据集。 我想找到特定数据组合的记录数。 类似于SQL中count(*) group by子句的内容。 plyr中的ddply()对我有用。library(plyr) ddply(mtcars, .(cyl,gear),nrow) 有输出 cyl gear V1 1 ...
使用plyr中的ddply函数和summarise时,默认情况下会删除空类别。您可以通过添加.drop = FALSE来更改此行为。但是,当使用dplyr中的summarise时,这种方法不起作用。还有其他方法可以在结果中保留空类别吗? 以下是一个使用虚假数据的示例。library(dply...
我尝试在dplyr包中复现其中一个示例,但是遇到了这个错误信息。我期望看到一个名为n的新列,其中包含每种组合的频率。我漏掉了什么?我三次确认了已经加载了该包。 library(dplyr) # summarise peels off a single layer of grouping by_...
我(可能)并不是指“所有其他变量”这样的意思,比如var1~.。有一次,我被引导使用了plyr,然后研究了一下mlply,想知道为什么参数是这样定义的:function (.data, .fun = NULL, ..., .expand = TRUE, .progress = "none", ...
我有一个 data.table:require(data.table) set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "...
我有一个数据框,长得像这样:#df ID DRUG FED AUC0t Tmax Cmax 1 1 0 100 5 20 2 1 1 200 6 25 3 0 1 NA 2 ...
我认为我在错误使用plyr。 请问这段代码是否“高效”?require(plyr) plyr <- function(dd) ddply(dd, .(price), summarise, ss=sum(volume)) 一些背景信息:我有几个大型聚合问题,我注意到它们每个都需要一些时间...