911得票5回答
data.table vs dplyr:它们之间有没有一方能做到另一方无法或做得不好的事情?

概述 我对data.table比较熟悉,对dplyr了解不太多。我阅读了一些dplyr的文档和在SO上出现的示例,到目前为止我的结论是: data.table和dplyr在速度上可比,除非有很多(即>10-100K)组,以及其他一些情况(见下面的基准测试) dplyr具有更易于理解...

308得票5回答
过滤包含特定字符串的行

我需要使用 dplyr 来筛选数据框中包含字符串 RTB 的行。 d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>...

290得票10回答
在 `dplyr` 中为新列/变量使用动态名称

我想使用 dplyr::mutate() 在数据框中创建多个新列。列名和内容应该是动态生成的。 来自 iris 数据集的示例数据:library(dplyr) iris <- as_tibble(iris) 我已经创建了一个函数来从Petal.Width变量中改变我的新列:multip...

268得票8回答
将dplyr tbl中的列提取为向量

在具有数据库后端的dplyr tbl中,获取一个列作为向量的更简洁方法是否存在(即不能直接对数据框/表进行子集操作)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, ...

267得票7回答
显示/打印tbl_df(tibble)的所有行

tibble(以前的tbl_df)是由R中的dplyr数据框操作包创建的数据框的版本。当意外调用数据框时,它可以防止长表格输出。 一旦数据框被tibble/tbl_df 包装,是否有一种命令可查看整个数据框(数据框的所有行和列)? 如果我使用df[1:100,],我将看到所有100行,但如...

242得票10回答
相对频率/比例与dplyr

假设我想计算每个组中不同值的比例。例如,使用mtcars数据,如何使用dplyr一次性计算按am(自动/手动)分组的gears数量的相对频率?library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency m...

227得票5回答
dplyr包能用于条件变异吗?

当变异是有条件的(取决于某些列值的情况下),是否可以使用突变? 这个例子有助于说明我的意思。structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6...

205得票7回答
在R语言中,%>%函数是什么意思?

我看到一些包(如dplyr和rvest)中使用了%>%(百分号大于百分号)函数。它是什么意思?这是在R中编写闭包块的一种方式吗?

201得票10回答
从分组数据中选择第一行和最后一行

问题 使用dplyr,如何在一条语句中选择分组数据的前几行和后几行观测值/行? 数据和示例 给定一个数据框: df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a",...

200得票10回答
修复多个警告“未知列”问题

我一直遇到"未知列"的持续性多个警告,无论是什么类型的命令(例如str(x)安装更新程序包),都不确定如何调试或修复它。 "未知列"警告明显与我重命名的tbl_df中的变量有关,但警告出现在所有种类的命令中,似乎与tbl_df无关(例如在一个简单的字符向量x上执行安装更新文件包,str(x)...