得票数最多 'dplyr' 问题 - 第4页

关联标签

118得票8回答

按组提取变量最小值对应的行

我希望能够按照一个变量 (State) 进行数据分组，然后在每个组内找到另一个变量 (Employees) 的最小值所在的行，并提取整行数据。虽然 (1) 和 (2) 可以用一行代码轻松实现，但是我觉得 (3) 也应该可以，但我做不到。这是一个数据集样例：> data Sta...

rdplyrdata.tableaggregate

118得票4回答

dplyr summarise：相当于“.drop=FALSE”的功能，保留输出中长度为零的分组。

使用plyr中的ddply函数和summarise时，默认情况下会删除空类别。您可以通过添加.drop = FALSE来更改此行为。但是，当使用dplyr中的summarise时，这种方法不起作用。还有其他方法可以在结果中保留空类别吗？以下是一个使用虚假数据的示例。library(dply...

rdplyrplyrtidyr

117得票5回答

按照字符串匹配选择列 - dplyr :: select

我有一个数据框（"data"），其中包含很多列。其中一些列包含特定的字符串（"search_string"）。我如何使用dplyr::select()函数来仅选择包含该字符串的列？我尝试过：# columns as boolean vector select(data, grepl("...

rregexdplyr

116得票5回答

收集多个列集

我有一份在线调查的数据，受访者需要回答问题循环1到3次。调查软件（Qualtrics）以多列的形式记录这些数据——也就是说，在调查中Q3.2将有Q3.2.1.、Q3.2.2.和Q3.2.3.三个不同的列。df <- data.frame( id = 1:10, time = as...

rreshapedplyrqualtricstidyr

108得票1回答

使用tidyr在R中展开多列数据

使用此示例变量df <- data.frame(month=rep(1:3,2), student=rep(c("Amy", "Bob"), each=3), A=c(9, 7, 6, 8, 6, 9), ...

rdataframedplyrtidyr

108得票12回答

dplyr在行子集上使用mutate/replace修改多个列

我正在尝试使用基于dplyr的工作流程（而不是我习惯于使用的data.table），并且我遇到了一个问题，即我找不到等效的dplyr解决方案。我通常会遇到这种情况：需要根据单个条件有条件地更新或替换多个列。下面是一些示例代码，其中包含我的data.table解决方案： library(d...

rdata.tabledplyr

105得票15回答

如何按组获取摘要统计信息

我正在尝试在R/S-PLUS中通过分类列一次性获取多个汇总统计信息。我找到了几个函数，但它们都是每次调用一个统计量，比如aggregate()。 data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 7...

rdplyrstatsummarizer-faq

105得票7回答

在dplyr中过滤字符串列上的多个值

我有一个包含字符数据的data.frame。我希望从同一列中筛选出多个选项，有没有什么简单的方法可以做到这一点呢？示例： data.frame名称为datdays name 88 Lynn 11 Tom 2 Chris 5 ...

rdplyrstring-matchingmultiple-conditions

101得票6回答

dplyr："Error in n()：该函数不应直接调用"

我尝试在dplyr包中复现其中一个示例，但是遇到了这个错误信息。我期望看到一个名为n的新列，其中包含每种组合的频率。我漏掉了什么？我三次确认了已经加载了该包。 library(dplyr) # summarise peels off a single layer of grouping by_...

rfunctionplyrdplyrconflicting-libraries

99得票2回答

以易读的方式获取dplyr中不同值的计数

我是新手使用dplyr，我需要计算一个分组中的不重复值。这是一个表格示例： data <- data.frame(aa = c(1, 2, 3, 4, NA), bb = c('a', 'b', 'a', 'c', 'c')) 我知道我可以做...

rdataframedplyr