我希望能够以编程方式使用dplyr的case_when函数来替换基础R中的cut()函数。 目前,可以通过NSE(非标准评估)方法将外部参数与case_when函数一起使用,例如: library(dplyr) library(rlang) patterns <- list( ...
我正在做一个研究项目,其中一张表格的输入方式还不太适合进行分析,因此我正在尝试重新组织它。目前,每一行都是一个测试者,每一列都是他们回答错误的问题,按升序输入。因此,对于第一行,条目可能会读取“Q1”“Q3”“Q9”等,对应于第一、二、三列。总共有25个问题。 我的目标是重新组织数据,使每个...
我有一个数据框,这个数据框已经按需排序,但现在我想要将其分组“切片”。这些组的最大累积值应为10。当累积值> 10时,它应重置累积和并重新开始。library(dplyr) id <- sample(1:15) order <- 1:15 value <- c(4, 5, ...
我在更新到dplyr开发版本0.8.99.9003后,在运行group_by和summarise()时收到了一个新消息(请参见帖子标题)。这里有一个重新创建输出的示例:library(tidyverse) library(hablar) df <- read_csv("year, wee...
我想知道是否有一种方法可以在 dplyr 0.1.2 中使用返回多个值的函数 (例如来自 psych 包的 describe 函数) 来进行汇总 (summarise)。 如果不行,是因为它还没有被实现,还是因为这不是一个好主意? 示例:require(psych) require(ggpl...
我有两个数据框,它们看起来像这样: df1 <- data.frame(reference=c("cat","dog")) print(df1) #> reference #> 1 cat #> 2 dog df2 <- data.f...
我正在使用 lubridate 和 dplyr 包来处理日期变量和创建新的日期变量。 library(lubridate) library(dplyr) 假设 df 是我的数据框。我有两个变量 date1 和 date2。我想创建一个新变量 date,它的值为 date1 的值。如果 d...
如何使用最有效的方法将主数据集中的NA值更新/替换为查找表中(正确的)值? 这是一个非常常见的操作!类似的问题似乎没有简洁的解决方案。 限制条件: 1)请假设有大量的缺失值和比给出示例更大的查找表。因此,逐个替换操作将不切实际(没有case_when,if_else等)。 2)查找表没有主数...
我正在学习 R 语言中的 dplyr 包,并且目前非常喜欢它。其中一个需要解决的问题是创建一个新列,其每一行的值都是将除了当前行之外的所有行(可能按组进行子集划分)应用一个函数的结果,但我无法找到一种简便的方法来实现它。 一个虚构的例子如下: library(datasets) libra...
我正在尝试在dplyr中对数据框进行汇总时查找多个因子变量中组内最常见的值。我需要一个能够完成以下任务的公式: 在一组中,找到所有因子变量中最常用的因子级别(因子级别计数的“max()”)。 如果有几个最常用的因子级别之间存在绑定,则选择其中任何一个因子级别。 返回因子级别名称(不是计数的...