得票数最多 'summarize' 问题

关联标签

200得票6回答

我在更新到dplyr开发版本0.8.99.9003后，在运行group_by和summarise()时收到了一个新消息（请参见帖子标题）。这里有一个重新创建输出的示例：library(tidyverse) library(hablar) df <- read_csv("year, wee...

105得票15回答

我正在尝试在R/S-PLUS中通过分类列一次性获取多个汇总统计信息。我找到了几个函数，但它们都是每次调用一个统计量，比如aggregate()。 data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 7...

60得票3回答

我想将使用包的R代码转换为pandas，其中我进行分组并执行多个汇总操作。这是我的当前代码： import pandas as pd data = pd.DataFrame( {'col1':[1,1,1,1,1,2,2,2,2,2], 'col2':[1,2,3,4,5...

47得票3回答

我正在对数据进行分组并进行汇总，但也希望保留另一列。我不需要对该列的内容进行任何评估，因为它始终与group_by列相同。我可以将其添加到group_by语句中，但那似乎不太合适。我想在按State分组后仍保留State.Full.Name。谢谢。TDAAtest <- data.fra...

35得票4回答

我使用Python创建了以下包含相似度值的数据框： cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0...

18得票4回答

从dplyr 0.7版本开始，以下划线结尾的方法（如summarize_ group_by_）已经被弃用，因为我们应该使用quosures。参见： https://cran.r-project.org/web/packages/dplyr/vignettes/programming.htm...

11得票3回答

我的问题与应用group_by和summarise在保留所有列信息的数据上非常相似，但我希望保留在分组后因冲突而被排除的列。Label <- c("203c","203c","204a","204a","204a","204a","204a","204a","204a","204a") ...

10得票2回答

我知道这一定很简单，但我找不到正确的dplyr命令来完成这个任务。假设我想按两个变量对数据集进行分组，然后总结每行的计数。我们可以使用以下代码：mtcars %>% group_by(cyl, mpg) %>% summarize(Count = n()) 这将生成一个数据框，包含...

8得票1回答

我对R和dplyr都比较新手。我的数据集只有两列：var1和var2。其中，var1包含数字值，而var2则包含3个级别的因子A、B和C。 var1 var2 1 1.4395244 A 2 1.7698225 A 3 3.5587083 A 4 2...

7得票1回答

在分组汇总后，我希望计算另一个因素中特定层级的数量。在下面的实例中，我想计算每个组中"male"层级的数量。我尝试了许多计数、统计等方法，但无法找到一种简单明了的方法来实现它。 df <- data.frame(Group=replicate(20, sample(c("A","B...