我有一个类似于下面 "my_data" 格式的数据集,其中每行是一个事件的单独计数。 我想获得每个小时发生的事件总数的摘要。我希望每个没有事件发生的小时都包括并将其 "hourly_total" 值设为0。虽然可以使用dplyr来实现这一点,但空白小时被删除而不是被设置为0。谢谢!
set.seed(123)
library(dplyr)
library(lubridate)
latemail <- function(N, st="2012/01/01", et="2012/1/31") {
st <- as.POSIXct(as.Date(st))
et <- as.POSIXct(as.Date(et))
dt <- as.numeric(difftime(et,st,unit="sec"))
ev <- sort(runif(N, 0, dt))
rt <- st + ev
}
my_data <- data_frame( fake_times = latemail(25),
count = 1)
my_data %>% group_by( rounded_hour = floor_date(fake_times, unit = "hour")) %>%
summarise( hourly_total = sum(count))