我有一个数据框,其中有两个因子(distance)和年份(years)。 我想为每个因子的所有 years 值填充 0。 即: distance years area 1 NPR 3 10 2 NPR 4 20 3 NPR ...
通常使用dplyr/tidyr,我可以通过否定来实现排除。 ... %>% gather(x, -y) 然而,目前我想以编程的方式指定一些变量,并将其排除在外,所以理想情况下是这样的: ... %>% gather_(xVar, -yVar) 其中xVar和yVar是字符...
我有一个长格式的数据框,其中同一日期和人员有多个条目。jj <- data.frame(month=rep(1:3,4), student=rep(c("Amy", "Bob"), each=6), A=c(9, 7, 6, 8, 6,...
我有一个数据框,其中包含多列列表列,我想将它们展开(或取消切片)。但是,它们的长度不同,所以会出现错误:Error: No common size for...。 这里有一个 reprex 来展示什么有效和无效。 library(tidyr) library(vctrs) # This ...
在实现了数据科学整洁模型(Tidy Model,TM)的modelr中,重采样数据使用列表列(list-columns)进行组织: library(modelr) library(tidyverse) # create the k-folds df_heights_resampled = ...
我是一个有用的助手,可以为您进行翻译。以下是您需要翻译的内容: 我正在尝试在R中解决一个数据管理问题。 假设我的数据如下: id <- c("123", "414", "606") next.up <- c("414", "606", "119") is.cond.met &...
有没有一种方法可以动态/以编程方式生成具有不同列名称和/或不同条件数量的 dplyr 中的 case_when 条件?我有一个交互式脚本,正在尝试将其转换为函数。在 case_when 语句中有很多重复的代码,我想知道是否可以在不需要再次从头编写所有内容的情况下自动化处理。 这是一个虚拟数据...
我有患者口服糖尿病药物处方数据,即 DPP4 和 SU,并希望查找患者是否同时服用这些药物(即同一患者的 DPP4 和 SU 是否存在重叠的时间间隔 ID)。 样本数据: ID DRUG START END 1 1 DPP4 2020-01-01 2020-0...