概述 我对data.table比较熟悉,对dplyr了解不太多。我阅读了一些dplyr的文档和在SO上出现的示例,到目前为止我的结论是: data.table和dplyr在速度上可比,除非有很多(即>10-100K)组,以及其他一些情况(见下面的基准测试) dplyr具有更易于理解...
我需要使用 dplyr 来筛选数据框中包含字符串 RTB 的行。 d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>...
我想使用 dplyr::mutate() 在数据框中创建多个新列。列名和内容应该是动态生成的。 来自 iris 数据集的示例数据:library(dplyr) iris <- as_tibble(iris) 我已经创建了一个函数来从Petal.Width变量中改变我的新列:multip...
在具有数据库后端的dplyr tbl中,获取一个列作为向量的更简洁方法是否存在(即不能直接对数据框/表进行子集操作)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, ...
tibble(以前的tbl_df)是由R中的dplyr数据框操作包创建的数据框的版本。当意外调用数据框时,它可以防止长表格输出。 一旦数据框被tibble/tbl_df 包装,是否有一种命令可查看整个数据框(数据框的所有行和列)? 如果我使用df[1:100,],我将看到所有100行,但如...
假设我想计算每个组中不同值的比例。例如,使用mtcars数据,如何使用dplyr一次性计算按am(自动/手动)分组的gears数量的相对频率?library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency m...
当变异是有条件的(取决于某些列值的情况下),是否可以使用突变? 这个例子有助于说明我的意思。structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6...
问题 使用dplyr,如何在一条语句中选择分组数据的前几行和后几行观测值/行? 数据和示例 给定一个数据框: df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a",...
我一直遇到"未知列"的持续性多个警告,无论是什么类型的命令(例如str(x)安装更新程序包),都不确定如何调试或修复它。 "未知列"警告明显与我重命名的tbl_df中的变量有关,但警告出现在所有种类的命令中,似乎与tbl_df无关(例如在一个简单的字符向量x上执行安装更新文件包,str(x)...