最新 'dplyr' 问题 - 第5页

关联标签

7得票3回答

在dplyr::mutate中，使用any()和|的区别是什么？

当我在 dplyr::mutate() 中比较列时，为什么应该使用 | 而不是 any()？它们为什么会返回不同的结果呢？例如： library(tidyverse) df <- data_frame(x = rep(c(T,F,T), 4), y = rep(c(T,F,T...

rdplyrtidyverse

11得票2回答

如何将列名作为参数传递到dplyr函数中？

我想做与这里相同的事情，但使用dplyr并选择一个额外的列。我想通过字符串变量选择一列，但同时我也想正常选择第二列。我需要这样做是因为我有一个函数，根据给定参数选择几列。以下是我的示例代码：library(dplyr) data(cars) x <- "speed" cars ...

rparameter-passingdplyrquotenamed

10得票3回答

如何在使用filter或filter_时使用双大括号(curly curly)？

我正在回答这个问题，评论者建议使用!!ensym，我认为这可能是使用双大括号{{}}的好地方，但我无法使其起作用（也许不适用？）。如果不使用filter_、eval/parse或引用-引用，该如何执行此过滤操作？会使用~吗？我的解决方案（1g）使用filter_和通过paste构建的条...

rfilterdplyrrlangtidyeval

15得票1回答

在dplyr中分组变量的相关矩阵

我有一个使用dplyr分组的数据框，其中包含50个数值列，这些列根据其中一列分为不同的组。我想计算所有非分组列与特定列之间的相关矩阵。以下是使用mtcars数据集的示例：data(mtcars) cor(mtcars[,2:11], mtcars[,2]) 返回每加仑英里数与其他变量之间的相关...

rdplyr

17得票5回答

函数的默认参数使用变量，使用dplyr

目标我的目标是定义一些函数，供在dplyr动词内使用，并使用预定义的变量。这是因为我有一些需要大量参数的函数，其中许多参数总是相同的变量名。我的理解：这很困难（也许是不可能的），因为dplyr会延迟评估用户指定的变量，但任何默认参数都不在函数调用中，因此对于dplyr是不可见的。玩...

rdplyrscopinglazyeval

10得票4回答

在R中对数据集进行反汇总/逆摘要/扩展

我的数据是这样的：data("Titanic") df <- as.data.frame(Titanic) 我该如何取消聚合或反向汇总计数/频率并将数据集扩展回其原始的非计数观察状态？例如，我希望在数据框中重复3rd, Male, Child, No 35次和1st, Female,...

rdplyrtidyr

49得票7回答

使用dplyr在列中有条件地替换值

我有一个示例数据集，其中一列的内容类似于：Candy Sanitizer Candy Water Cake Candy Ice Cream Gum Candy Coffee 我想做的是将其替换为只有两个因素 -“糖果”和“非糖果”。我可以使用Python/Pandas来实现，但似乎无法找到基于...

rdplyr

23得票5回答

如何使用dplyr给多个变量名添加前缀？

我想在data.frame的每个变量名前添加一个共同的前缀。例如，使用mtcars数据，我可以使用以下代码添加前缀"cars."：> data(mtcars) > names(mtcars) [1] "mpg" "cyl" "disp" "hp" "drat" "wt" ...

rdplyr

24得票2回答

“local data frame”消息是从`dplyr:::print.tbl_df`函数输出的一种数据类型，表示数据框（data frame）在本地环境中存储。

使用dplyr时，tbl_df函数会打印一条声明，表明数据框是“本地”的： > mtcars %>% + group_by(gear) Source: local data frame [32 x 11] Groups: gear mpg cyl ... 1...

rprintingdplyr

37得票7回答

使用dplyr::mutate添加多个值

这个问题在dplyr的Github repo上已经有了几个讨论，还有至少一个相关的Stack Overflow问题，但它们都没能完全回答我的问题——我想。在dplyr的mutate中添加多列大致是我想要的，但那里只提供了一个特例的答案（tidyr::separate），似乎对我不适用。 ...

rdplyr