7得票2回答
使用dplyr::case_when动态传递参数

我希望能够以编程方式使用dplyr的case_when函数来替换基础R中的cut()函数。 目前,可以通过NSE(非标准评估)方法将外部参数与case_when函数一起使用,例如: library(dplyr) library(rlang) patterns <- list( ...

7得票5回答
如何循环遍历数据集中的每一列,检查特定值是否存在于任何一列中,创建新列,并在该值存在时将1输入新列,否则输入0?

我正在做一个研究项目,其中一张表格的输入方式还不太适合进行分析,因此我正在尝试重新组织它。目前,每一行都是一个测试者,每一列都是他们回答错误的问题,按升序输入。因此,对于第一行,条目可能会读取“Q1”“Q3”“Q9”等,对应于第一、二、三列。总共有25个问题。 我的目标是重新组织数据,使每个...

21得票5回答
具有重置功能的条件累加求和

我有一个数据框,这个数据框已经按需排序,但现在我想要将其分组“切片”。这些组的最大累积值应为10。当累积值> 10时,它应重置累积和并重新开始。library(dplyr) id <- sample(1:15) order <- 1:15 value <- c(4, 5, ...

200得票6回答
如何解释dplyr消息`summarise()`通过“x”重新分组输出(使用`.groups`参数覆盖)?

我在更新到dplyr开发版本0.8.99.9003后,在运行group_by和summarise()时收到了一个新消息(请参见帖子标题)。这里有一个重新创建输出的示例:library(tidyverse) library(hablar) df <- read_csv("year, wee...

47得票3回答
使用dplyr summarise()函数从单个函数返回多个值

我想知道是否有一种方法可以在 dplyr 0.1.2 中使用返回多个值的函数 (例如来自 psych 包的 describe 函数) 来进行汇总 (summarise)。 如果不行,是因为它还没有被实现,还是因为这不是一个好主意? 示例:require(psych) require(ggpl...

7得票6回答
在R dplyr中,计算一个数据框中的字符串出现在另一个数据框中的次数。

我有两个数据框,它们看起来像这样: df1 <- data.frame(reference=c("cat","dog")) print(df1) #> reference #> 1 cat #> 2 dog df2 <- data.f...

9得票1回答
使用mutate处理日期会返回数值类型

我正在使用 lubridate 和 dplyr 包来处理日期变量和创建新的日期变量。 library(lubridate) library(dplyr) 假设 df 是我的数据框。我有两个变量 date1 和 date2。我想创建一个新变量 date,它的值为 date1 的值。如果 d...

18得票5回答
使用Tidyverse Join更新/替换数据框中的值

如何使用最有效的方法将主数据集中的NA值更新/替换为查找表中(正确的)值? 这是一个非常常见的操作!类似的问题似乎没有简洁的解决方案。 限制条件: 1)请假设有大量的缺失值和比给出示例更大的查找表。因此,逐个替换操作将不切实际(没有case_when,if_else等)。 2)查找表没有主数...

7得票2回答
对除当前行外的所有行应用一个函数(dplyr)

我正在学习 R 语言中的 dplyr 包,并且目前非常喜欢它。其中一个需要解决的问题是创建一个新列,其每一行的值都是将除了当前行之外的所有行(可能按组进行子集划分)应用一个函数的结果,但我无法找到一种简便的方法来实现它。 一个虚构的例子如下: library(datasets) libra...

11得票4回答
在dplyr中确定分组数据框中最常见因子的最快方法

我正在尝试在dplyr中对数据框进行汇总时查找多个因子变量中组内最常见的值。我需要一个能够完成以下任务的公式: 在一组中,找到所有因子变量中最常用的因子级别(因子级别计数的“max()”)。 如果有几个最常用的因子级别之间存在绑定,则选择其中任何一个因子级别。 返回因子级别名称(不是计数的...