最新 'dplyr' 问题

关联标签

7得票2回答

我希望能够以编程方式使用dplyr的case_when函数来替换基础R中的cut()函数。目前，可以通过NSE（非标准评估）方法将外部参数与case_when函数一起使用，例如： library(dplyr) library(rlang) patterns <- list( ...

7得票5回答

我正在做一个研究项目，其中一张表格的输入方式还不太适合进行分析，因此我正在尝试重新组织它。目前，每一行都是一个测试者，每一列都是他们回答错误的问题，按升序输入。因此，对于第一行，条目可能会读取“Q1”“Q3”“Q9”等，对应于第一、二、三列。总共有25个问题。我的目标是重新组织数据，使每个...

21得票5回答

我有一个数据框，这个数据框已经按需排序，但现在我想要将其分组“切片”。这些组的最大累积值应为10。当累积值> 10时，它应重置累积和并重新开始。library(dplyr) id <- sample(1:15) order <- 1:15 value <- c(4, 5, ...

200得票6回答

我在更新到dplyr开发版本0.8.99.9003后，在运行group_by和summarise()时收到了一个新消息（请参见帖子标题）。这里有一个重新创建输出的示例：library(tidyverse) library(hablar) df <- read_csv("year, wee...

47得票3回答

我想知道是否有一种方法可以在 dplyr 0.1.2 中使用返回多个值的函数 (例如来自 psych 包的 describe 函数) 来进行汇总 (summarise)。如果不行，是因为它还没有被实现，还是因为这不是一个好主意？示例：require(psych) require(ggpl...

7得票6回答

我有两个数据框，它们看起来像这样： df1 <- data.frame(reference=c("cat","dog")) print(df1) #> reference #> 1 cat #> 2 dog df2 <- data.f...

9得票1回答

我正在使用 lubridate 和 dplyr 包来处理日期变量和创建新的日期变量。 library(lubridate) library(dplyr) 假设 df 是我的数据框。我有两个变量 date1 和 date2。我想创建一个新变量 date，它的值为 date1 的值。如果 d...

18得票5回答

如何使用最有效的方法将主数据集中的NA值更新/替换为查找表中（正确的）值？这是一个非常常见的操作！类似的问题似乎没有简洁的解决方案。限制条件： 1）请假设有大量的缺失值和比给出示例更大的查找表。因此，逐个替换操作将不切实际（没有case_when，if_else等）。 2）查找表没有主数...

7得票2回答

我正在学习 R 语言中的 dplyr 包，并且目前非常喜欢它。其中一个需要解决的问题是创建一个新列，其每一行的值都是将除了当前行之外的所有行（可能按组进行子集划分）应用一个函数的结果，但我无法找到一种简便的方法来实现它。一个虚构的例子如下： library(datasets) libra...

11得票4回答

我正在尝试在dplyr中对数据框进行汇总时查找多个因子变量中组内最常见的值。我需要一个能够完成以下任务的公式：在一组中，找到所有因子变量中最常用的因子级别（因子级别计数的“max()”）。如果有几个最常用的因子级别之间存在绑定，则选择其中任何一个因子级别。返回因子级别名称（不是计数的...