17得票2回答
用缺失的值组合完整数据框架

我有一个数据框,其中有两个因子(distance)和年份(years)。 我想为每个因子的所有 years 值填充 0。 即: distance years area 1 NPR 3 10 2 NPR 4 20 3 NPR ...

7得票1回答
使用dplyr/tidyr函数的字符串版本(带下划线后缀,例如gather_())时,使用“-”进行排除

通常使用dplyr/tidyr,我可以通过否定来实现排除。 ... %>% gather(x, -y) 然而,目前我想以编程的方式指定一些变量,并将其排除在外,所以理想情况下是这样的: ... %>% gather_(xVar, -yVar) 其中xVar和yVar是字符...

12得票2回答
有重复列名的数据框整理

我有一个程序会给我以这种格式的数据toy file_path Condition Trial.Num A B C ID A B C ID A B C ID 1 root/some.extension Baseline ...

30得票4回答
使用spread函数处理具有重复行标识符的数据

我有一个长格式的数据框,其中同一日期和人员有多个条目。jj <- data.frame(month=rep(1:3,4), student=rep(c("Amy", "Bob"), each=6), A=c(9, 7, 6, 8, 6,...

8得票3回答
展开或解除包含不同长度列表的数据框架

我有一个数据框,其中包含多列列表列,我想将它们展开(或取消切片)。但是,它们的长度不同,所以会出现错误:Error: No common size for...。 这里有一个 reprex 来展示什么有效和无效。 library(tidyr) library(vctrs) # This ...

7得票2回答
使用重新采样的数据拟合多个模型

在实现了数据科学整洁模型(Tidy Model,TM)的modelr中,重采样数据使用列表列(list-columns)进行组织: library(modelr) library(tidyverse) # create the k-folds df_heights_resampled = ...

10得票3回答
迭代并分层循环行,直到满足条件。

我是一个有用的助手,可以为您进行翻译。以下是您需要翻译的内容: 我正在尝试在R中解决一个数据管理问题。 假设我的数据如下: id <- c("123", "414", "606") next.up <- c("414", "606", "119") is.cond.met &...

9得票6回答
dplyr和tidyr - 如何使用动态条件生成case_when?

有没有一种方法可以动态/以编程方式生成具有不同列名称和/或不同条件数量的 dplyr 中的 case_when 条件?我有一个交互式脚本,正在尝试将其转换为函数。在 case_when 语句中有很多重复的代码,我想知道是否可以在不需要再次从头编写所有内容的情况下自动化处理。 这是一个虚拟数据...

8得票3回答
前两行聚集

我需要处理一些格式不规范的数据,它包含前两行中的两个标识符,后面是数据。数据看起来像这样: V1 V2 V3 1 Date 12/16/18 12/17/18 2 Equip a b 3 x1 1 ...

9得票4回答
我们如何检查唯一ID的任意两个时间段是否重叠?

我有患者口服糖尿病药物处方数据,即 DPP4 和 SU,并希望查找患者是否同时服用这些药物(即同一患者的 DPP4 和 SU 是否存在重叠的时间间隔 ID)。 样本数据: ID DRUG START END 1 1 DPP4 2020-01-01 2020-0...