在dplyr链中格式化列

18

我有这个数据集:

dat <- 
structure(list(date = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 
3L, 3L, 4L, 4L), .Label = c("3/31/2014", "4/1/2014", "4/2/2014", 
"4/3/2014"), class = "factor"), site = structure(c(1L, 2L, 1L, 
2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L), .Label = c("a", "b"), class = "factor"), 
clicks = c(73L, 64L, 80L, 58L, 58L, 61L, 70L, 60L, 84L, 65L, 
77L), impressions = c(55817L, 78027L, 77017L, 68797L, 92437L, 
94259L, 88418L, 55420L, 69866L, 86767L, 92088L)), .Names = c("date", 
"site", "clicks", "impressions"), class = "data.frame", row.names = c(NA, 
-11L))

dat
        date site clicks impressions
1  3/31/2014    a     73       55817
2  3/31/2014    b     64       78027
3  3/31/2014    a     80       77017
4   4/1/2014    b     58       68797
...

在这个链条中是否可能包含一个列的日期格式?(我也尝试过使用 with,但那只返回了日期列。)

library(dplyr)

> dat %.%
+   select(date, clicks, impressions) %.%
+   group_by(date) %.%
+   summarise(clicks = sum(clicks),
+             impressions = sum(impressions)) %.%
+   as.Date(Date, format = '%m/%d/%Y')
Error in as.Date.default(`__prev`, Date, format = "%m/%d/%Y") : 
  do not know how to convert '__prev' to class “Date”

如果我不在链式调用中包含格式化,它就能正常工作。我知道可以在链式调用之外简单地编写这个,但我想确认这是否可行。

dat %.%
select(date, clicks, impressions) %.%
group_by(date) %.%
summarise(clicks = sum(clicks),
          impressions = sum(impressions))

dat$date <- as.Date(dat$Date, format = '%m/%d/%Y')
2个回答

26

这是您想要的吗?

dat %>%
  select(date, clicks, impressions) %>%
  group_by(date) %>%
  summarise(clicks = sum(clicks),
            impressions = sum(impressions)) %>%
  mutate(date = as.Date(date, format = '%m/%d/%Y'))

是的!我简直不敢相信它一直就在我的面前……谢谢罗伯特! - maloneypatr
1
嗨,Robert,我遇到了一些问题 - 有时候 - 出现“错误:无法修改分组变量”。有没有一种方法可以在不分配新变量进行分组的情况下重置“group_by”? - maloneypatr
使用 ungroup() 来重置分组。 - fuadj

5
有时,当您尝试在已经分组的内容上运行`group_by()`操作时,会出现“错误:无法修改分组变量”(Error: cannot modify grouping variable)的消息。您可以先尝试包含`ungroup`。以下是Robert答案的语法:
dat %>%
  ungroup %>% 
  select(date, clicks, impressions) %>%
  group_by(date) %>%
  summarize(clicks      = sum(clicks),
            impressions = sum(impressions)) %>%
  mutate(date = as.Date(date, format = "%m/%d/%Y"))

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接