10得票2回答
除了某些列外,全部进行突变

我有一个包含一组变量的数据框,我希望将它们以不同的长度进行滞后,以便稍后在回归中使用它们(而不是手动逐个滞后一个变量)。 我在Stackoverflow上找到了这段代码(链接),看起来可以解决问题: df = data.frame(a = 1:10, b = 21:30) dplyr::m...

10得票6回答
如何将列表嵌套转换为tibble(数据框)

我有以下列表。它包含两个变量:pair和genes。变量pair的内容始终为包含两个字符串的向量。变量genes是一个向量,可以包含多个值。 lol <- list(structure(list(pair = c("BoneMarrow", "Pulmonary"), genes = ...

9得票1回答
dplyr 0.7.0+中dplyr :: select的正确用法,使用字符向量选择列

假设我们有一个包含要从数据框 df 中选择的某些列的字符向量 cols_to_select,例如: df <- tibble::data_frame(a=1:3, b=1:3, c=1:3, d=1:3, e=1:3) cols_to_select <- c("b", "d") ...

41得票2回答
在dplyr链中替换NA

问题已从原始版本进行了编辑。 在阅读这个有趣的讨论之后,我想知道如何使用dplyr在列中替换缺失值,例如Lahman击球数据: Source: local data frame [96,600 x 3] Groups: teamID yearID teamID G ...

7得票3回答
ggplot:使用管道传递数据来子集化层

我正在尝试对通过管道传递数据到 ggplot 的绘图层进行子集筛选。 以下是一个示例: library(dplyr) library(ggplot2) library(scales) set.seed(12345) df_example = data_frame(Month = rep(...

21得票1回答
dplyr的summarise()和summarise_each()会对提供的函数进行额外调用。

看起来 summarise 和 summarise_each 会对它们提供的回调函数进行不必要的额外调用。假设我们有以下内容:X <- data.frame( Group = rep(c("G1","G2"),2:3), Var1 = 1:5, Var2 = 11:15 ) 看起来是这样...

21得票3回答
将一个列中的多个值拆分为多行 R。

我有一个数据框,大部分情况下每行只有一条观察记录。然而,有些行有多个数值:# A tibble: 3 x 2 `number` abilities <dbl> <chr> 1 51...

11得票3回答
dplyr + ggplot2:通过管道绘图无法工作

我想绘制数据框的一个子集。我正在使用dplyr和ggplot2。我的代码只在版本1中有效,而在通过管道传输的版本2中无效。有什么区别吗? 版本1(绘图有效):data <- dataset %>% filter(type=="type1") ggplot(data, aes(x=...

16得票2回答
R中的dplyr筛选器是否会掩盖基本筛选器?

在工作中,我使用运行R 3.1.2的Windows 7电脑。我有一个名为packages.R的文件,在这个文件中,我有以下代码:library(dplyr) library(sqlutils) library(RODBC) 我的.Rprofile文件包含一个名为.First的函数。.First...

26得票3回答
使用dplyr和POSIXlt数据时遇到的问题

我有一个问题。我下载了数据并将日期转换为POSIXlt格式。 df<-read.csv("007.csv", header=T, sep=";") df$transaction_date<-strptime(df$transaction_date, "%d.%m.%Y") df$...