我希望能够按照一个变量 (State) 进行数据分组,然后在每个组内找到另一个变量 (Employees) 的最小值所在的行,并提取整行数据。 虽然 (1) 和 (2) 可以用一行代码轻松实现,但是我觉得 (3) 也应该可以,但我做不到。 这是一个数据集样例:> data Sta...
使用plyr中的ddply函数和summarise时,默认情况下会删除空类别。您可以通过添加.drop = FALSE来更改此行为。但是,当使用dplyr中的summarise时,这种方法不起作用。还有其他方法可以在结果中保留空类别吗? 以下是一个使用虚假数据的示例。library(dply...
我有一个数据框("data"),其中包含很多列。其中一些列包含特定的字符串("search_string")。 我如何使用dplyr::select()函数来仅选择包含该字符串的列? 我尝试过:# columns as boolean vector select(data, grepl("...
使用此示例变量df <- data.frame(month=rep(1:3,2), student=rep(c("Amy", "Bob"), each=3), A=c(9, 7, 6, 8, 6, 9), ...
我正在尝试使用基于dplyr的工作流程(而不是我习惯于使用的data.table),并且我遇到了一个问题,即我找不到等效的dplyr解决方案。 我通常会遇到这种情况:需要根据单个条件有条件地更新或替换多个列。 下面是一些示例代码,其中包含我的data.table解决方案: library(d...
我有一个包含字符数据的data.frame。 我希望从同一列中筛选出多个选项,有没有什么简单的方法可以做到这一点呢? 示例: data.frame名称为datdays name 88 Lynn 11 Tom 2 Chris 5 ...
我尝试在dplyr包中复现其中一个示例,但是遇到了这个错误信息。我期望看到一个名为n的新列,其中包含每种组合的频率。我漏掉了什么?我三次确认了已经加载了该包。 library(dplyr) # summarise peels off a single layer of grouping by_...
我是新手使用dplyr,我需要计算一个分组中的不重复值。这是一个表格示例: data <- data.frame(aa = c(1, 2, 3, 4, NA), bb = c('a', 'b', 'a', 'c', 'c')) 我知道我可以做...