200得票6回答
如何解释dplyr消息`summarise()`通过“x”重新分组输出(使用`.groups`参数覆盖)?

我在更新到dplyr开发版本0.8.99.9003后,在运行group_by和summarise()时收到了一个新消息(请参见帖子标题)。这里有一个重新创建输出的示例:library(tidyverse) library(hablar) df <- read_csv("year, wee...

105得票15回答
如何按组获取摘要统计信息

我正在尝试在R/S-PLUS中通过分类列一次性获取多个汇总统计信息。我找到了几个函数,但它们都是每次调用一个统计量,比如aggregate()。 data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 7...

60得票3回答
pandas中与dplyr的summarize/aggregate多函数等效的方法是什么?

我想将使用包的R代码转换为pandas,其中我进行分组并执行多个汇总操作。 这是我的当前代码: import pandas as pd data = pd.DataFrame( {'col1':[1,1,1,1,1,2,2,2,2,2], 'col2':[1,2,3,4,5...

47得票3回答
R - dplyr汇总并保留其他列

我正在对数据进行分组并进行汇总,但也希望保留另一列。我不需要对该列的内容进行任何评估,因为它始终与group_by列相同。我可以将其添加到group_by语句中,但那似乎不太合适。我想在按State分组后仍保留State.Full.Name。谢谢。TDAAtest <- data.fra...

35得票4回答
在数据框上定义和应用自定义区间

我使用Python创建了以下包含相似度值的数据框: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0...

18得票4回答
将列名作为字符串传递给group_by和summarize函数

从dplyr 0.7版本开始,以下划线结尾的方法(如summarize_ group_by_)已经被弃用,因为我们应该使用quosures。 参见: https://cran.r-project.org/web/packages/dplyr/vignettes/programming.htm...

11得票3回答
应用group_by和summarise(sum),但保留具有无关冲突数据的列?

我的问题与应用group_by和summarise在保留所有列信息的数据上非常相似,但我希望保留在分组后因冲突而被排除的列。Label <- c("203c","203c","204a","204a","204a","204a","204a","204a","204a","204a") ...

10得票2回答
如何使用dplyr计算两个分组变量的加权平均值

我知道这一定很简单,但我找不到正确的dplyr命令来完成这个任务。假设我想按两个变量对数据集进行分组,然后总结每行的计数。我们可以使用以下代码:mtcars %>% group_by(cyl, mpg) %>% summarize(Count = n()) 这将生成一个数据框,包含...

8得票1回答
使用R和dplyr进行总结 - 按组分组,计数,平均值,标准偏差

我对R和dplyr都比较新手。我的数据集只有两列:var1和var2。其中,var1包含数字值,而var2则包含3个级别的因子A、B和C。 var1 var2 1 1.4395244 A 2 1.7698225 A 3 3.5587083 A 4 2...

7得票1回答
整洁数据:在汇总时计算特定级别的数量

在分组汇总后,我希望计算另一个因素中特定层级的数量。 在下面的实例中,我想计算每个组中"male"层级的数量。我尝试了许多计数、统计等方法,但无法找到一种简单明了的方法来实现它。 df <- data.frame(Group=replicate(20, sample(c("A","B...