86得票5回答
dplyr summarise_each with na.rm

有没有一种方法可以指示 `dplyr` 在使用 `summarise_each` 时带上 `na.rm=TRUE` 参数? 我想对变量取平均值,使用 `summarise_each("mean")`,但不知道如何指定忽略缺失值。

86得票1回答
使用dplyr在R中如何执行多个左连接?

我该如何使用dplyr在R中合并多个数据框?new <- left_join(x,y, by = "Flag") 这是我用来左连接x和y的代码。 但是该代码对于多个连接不起作用。new <- left_join(x,y,z by = "Flag")

83得票9回答
dplyr筛选:获取具有变量最小值的行,但如果有多个最小值,则仅获取第一个。

我想使用dplyr创建一个分组过滤器,使得在每个组内只返回变量x最小的那一行。 我的问题是:当存在多个最小值时,会返回所有具有最小值的行,但在我的情况下,如果存在多个最小值,则我只想要第一行。 这里是一个例子:df <- data.frame( A=c("A", "A", "A", ...

83得票7回答
dplyr中的mutate函数可以用于进行行求和计算或自定义函数。

我想从某种行计算方式中突变出一个新变量,比如下面的rowSums iris %>% mutate_(sumVar = iris %>% select(Sepal.Length:Petal.Width) %>% ...

82得票3回答
使用dplyr按自定义顺序排列行

使用dplyr中的arrange函数,我们可以按升序或降序排列行。想知道如何按自定义顺序排列行,请参见MWE。Reg <- rep(LETTERS[1:3], each = 2) Res <- rep(c("Urban", "Rural"), times = 3) set.seed...

81得票9回答
在R中使用dplyr:按字母顺序对列进行排序

如果我有一个大的数据框(数百列),这些列具有不同的变量名,并且按字母顺序随机分布:df.x <- data.frame(2:11, 1:10, rnorm(10)) colnames(df.x) <- c("ID", "string", "delta") 如何按照列名字母顺序垂直地...

80得票4回答
如何在dplyr过滤器中指定"不包含"的条件

我对R非常陌生。 使用名为SE_CSVLinelist_clean的表格,我想提取变量名为where_case_travelled_1且不包含字符串"Outside Canada"或"Outside province/territory of residence but within Can...

80得票2回答
dplyr能否在不列出每个变量的情况下对多个变量进行汇总?

dplyr非常快,但我想知道是否有什么我错过的东西:是否可以对多个变量进行汇总。例如: library(dplyr) library(reshape2) df <- data.frame( sex = factor(rep(c("boy", "girl"), each = 2L)...

79得票5回答
使用dplyr将特定值设置为NA

我正在尝试用dplyr找出一个简单的方法来处理这样的情况(数据集=dat,变量=x)。 dat$x[dat$x<0]=NA 应该很简单,但这是我目前能做到的最好的了。有没有更简单的方法? dat = dat %>% mutate(x=ifelse(x<0,NA,x))

79得票3回答
如何使用tidyr::replace_na替换数据框中的所有NA?

我想用0填充数据中的所有NA。有人知道如何使用tidyr中的replace_na来实现吗?根据文档,我们可以轻松地将不同列中的NA替换为不同的值。但是如何用某个值替换掉所有的NA?我有很多列... 以mtcars数据集为例:mtcars [sample(1:nrow(mtcars), 4)...