118得票8回答
按组提取变量最小值对应的行

我希望能够按照一个变量 (State) 进行数据分组,然后在每个组内找到另一个变量 (Employees) 的最小值所在的行,并提取整行数据。 虽然 (1) 和 (2) 可以用一行代码轻松实现,但是我觉得 (3) 也应该可以,但我做不到。 这是一个数据集样例:> data Sta...

118得票4回答
dplyr summarise:相当于“.drop=FALSE”的功能,保留输出中长度为零的分组。

使用plyr中的ddply函数和summarise时,默认情况下会删除空类别。您可以通过添加.drop = FALSE来更改此行为。但是,当使用dplyr中的summarise时,这种方法不起作用。还有其他方法可以在结果中保留空类别吗? 以下是一个使用虚假数据的示例。library(dply...

117得票5回答
按照字符串匹配选择列 - dplyr :: select

我有一个数据框("data"),其中包含很多列。其中一些列包含特定的字符串("search_string")。 我如何使用dplyr::select()函数来仅选择包含该字符串的列? 我尝试过:# columns as boolean vector select(data, grepl("...

116得票5回答
收集多个列集

我有一份在线调查的数据,受访者需要回答问题循环1到3次。调查软件(Qualtrics)以多列的形式记录这些数据——也就是说,在调查中Q3.2将有Q3.2.1.、Q3.2.2.和Q3.2.3.三个不同的列。df <- data.frame( id = 1:10, time = as...

108得票1回答
使用tidyr在R中展开多列数据

使用此示例变量df <- data.frame(month=rep(1:3,2), student=rep(c("Amy", "Bob"), each=3), A=c(9, 7, 6, 8, 6, 9), ...

108得票12回答
dplyr在行子集上使用mutate/replace修改多个列

我正在尝试使用基于dplyr的工作流程(而不是我习惯于使用的data.table),并且我遇到了一个问题,即我找不到等效的dplyr解决方案。 我通常会遇到这种情况:需要根据单个条件有条件地更新或替换多个列。 下面是一些示例代码,其中包含我的data.table解决方案: library(d...

105得票15回答
如何按组获取摘要统计信息

我正在尝试在R/S-PLUS中通过分类列一次性获取多个汇总统计信息。我找到了几个函数,但它们都是每次调用一个统计量,比如aggregate()。 data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 7...

105得票7回答
在dplyr中过滤字符串列上的多个值

我有一个包含字符数据的data.frame。 我希望从同一列中筛选出多个选项,有没有什么简单的方法可以做到这一点呢? 示例: data.frame名称为datdays name 88 Lynn 11 Tom 2 Chris 5 ...

101得票6回答
dplyr:"Error in n():该函数不应直接调用"

我尝试在dplyr包中复现其中一个示例,但是遇到了这个错误信息。我期望看到一个名为n的新列,其中包含每种组合的频率。我漏掉了什么?我三次确认了已经加载了该包。 library(dplyr) # summarise peels off a single layer of grouping by_...

99得票2回答
以易读的方式获取dplyr中不同值的计数

我是新手使用dplyr,我需要计算一个分组中的不重复值。这是一个表格示例: data <- data.frame(aa = c(1, 2, 3, 4, NA), bb = c('a', 'b', 'a', 'c', 'c')) 我知道我可以做...