如何使用R创建时间螺旋图

13
有没有办法在R中绘制像这样的图形,并在其上具有相同的12个轴名称?
这是图表的图片。
这是我的一部分数据。
        Date1  Time TravelTime
1  2016-09-04 13:11         34
2  2016-09-04 13:12         34
3  2016-09-04 13:13         33
4  2016-09-04 13:14         33
5  2016-09-04 13:15         33
6  2016-09-04 13:16         43
7  2016-09-04 13:17         44
8  2016-09-04 13:18         44
9  2016-09-04 13:19         40
10 2016-09-04 13:20         39

这是来自dput的输出

structure(list(Date1 = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L), .Label = "2016-09-04", class = "factor"), Time = structure(1:10, .Label = c("13:11", 
"13:12", "13:13", "13:14", "13:15", "13:16", "13:17", "13:18", 
"13:19", "13:20"), class = "factor"), TravelTime = c(34L, 34L, 
33L, 33L, 33L, 43L, 44L, 44L, 40L, 39L)), .Names = c("Date1", 
"Time", "TravelTime"), row.names = c(NA, -10L), class = "data.frame")

这是我过去5天的数据

Data1


这是另一个显示时间螺旋形的图表...请您把您的图表改为螺旋形,而不是圆形吗?

enter image description here

我从这个链接获取了此图 这里


已删除问题的副本 http://stackoverflow.com/questions/39429355/time-spiral-using-r - Matthew Lundberg
我查看了好问题,搜索了每篇可能有答案的帖子,发现我的问题已经很好了...虽然一开始不太好,但现在和其他我看到的问题一样了...我展示了我的数据和图表,并提供了数据...还应该做什么?再加上我等了两天,我按照你告诉我的去做了...所以这不公平... - Omar Abd El-Naser
你不应该删除问题,而是应该编辑原始内容。这只是用于将来的参考信息。 - Cyrus Mohammadian
1个回答

25

总体的方法是将数据汇总到时间段(我使用了15分钟的时间段),每个时间段的值是该时间段内数值的平均旅行时间。然后我们使用POSIXct日期作为y值,使得图形随着时间向外螺旋。使用geom_rect,我们将平均旅行时间映射到条形高度,创建一个螺旋条形图。

首先,加载并处理数据:

library(dplyr)
library(readxl)
library(ggplot2)

dat = read_excel("Data1.xlsx")

# Convert Date1 and Time to POSIXct
dat$time = with(dat, as.POSIXct(paste(Date1, Time), tz="GMT"))

# Get hour from time
dat$hour = as.numeric(dat$time) %% (24*60*60) / 3600

# Get date from time
dat$day =  as.Date(dat$time)

# Rename Travel Time and convert to numeric
names(dat)[grep("Travel",names(dat))] = "TravelTime"
dat$TravelTime = as.numeric(dat$TravelTime)

现在,将数据汇总到每15分钟的时间段中,计算每个时间段的平均旅行时间,并创建一个名为“螺旋时间”变量作为y轴数值:

dat.smry = dat %>% 
  mutate(hour.group = cut(hour, breaks=seq(0,24,0.25), labels=seq(0,23.75,0.25), include.lowest=TRUE),
         hour.group = as.numeric(as.character(hour.group))) %>%
  group_by(day, hour.group) %>%
  summarise(meanTT = mean(TravelTime)) %>%
  mutate(spiralTime = as.POSIXct(day) + hour.group*3600)

最后,绘制数据。每个15分钟的小时段都有自己的段落,我们使用旅行时间作为颜色渐变和柱子高度。 当然,如果您愿意,您可以将填充颜色和柱高映射到两个不同的变量(在您的示例中,填充颜色映射到月份;对于您的数据,如果您想突出显示日期,则可以将填充颜色映射到日期)。

ggplot(dat.smry, aes(xmin=as.numeric(hour.group), xmax=as.numeric(hour.group) + 0.25, 
                     ymin=spiralTime, ymax=spiralTime + meanTT*1500, fill=meanTT)) +
  geom_rect(color="grey40", size=0.2) +
  scale_x_continuous(limits=c(0,24), breaks=0:23, minor_breaks=0:24,
                     labels=paste0(rep(c(12,1:11),2), rep(c("AM","PM"),each=12))) +
  scale_y_datetime(limits=range(dat.smry$spiralTime) + c(-2*24*3600,3600*19), 
                   breaks=seq(min(dat.smry$spiralTime),max(dat.smry$spiralTime),"1 day"),
                   date_labels="%b %e") +
  scale_fill_gradient2(low="green", mid="yellow", high="red", midpoint=35) +
  coord_polar() +
  theme_bw(base_size=13) + 
  labs(x="Hour",y="Day",fill="Mean Travel Time") +
  theme(panel.grid.minor.x=element_line(colour="grey60", size=0.3))

enter image description here

下面是另外两个版本:第一个使用geom_segment,因此只将旅行时间映射到填充颜色。第二个使用geom_tile,将旅行时间映射到填充颜色和瓷砖高度。

geom_segment版本

ggplot(dat.smry, aes(x=as.numeric(hour.group), xend=as.numeric(hour.group) + 0.25, 
                     y=spiralTime, yend=spiralTime, colour=meanTT)) +
  geom_segment(size=6) +
  scale_x_continuous(limits=c(0,24), breaks=0:23, minor_breaks=0:24,
                     labels=paste0(rep(c(12,1:11),2), rep(c("AM","PM"),each=12))) +
  scale_y_datetime(limits=range(dat.smry$spiralTime) + c(-3*24*3600,0), 
               breaks=seq(min(dat.smry$spiralTime), max(dat.smry$spiralTime),"1 day"),
               date_labels="%b %e") +
  scale_colour_gradient2(low="green", mid="yellow", high="red", midpoint=35) +
  coord_polar() +
  theme_bw(base_size=10) + 
  labs(x="Hour",y="Day",color="Mean Travel Time") +
  theme(panel.grid.minor.x=element_line(colour="grey60", size=0.3))

enter image description here

geom_tile 版本

ggplot(dat.smry, aes(x=as.numeric(hour.group) + 0.25/2, xend=as.numeric(hour.group) + 0.25/2, 
                     y=spiralTime, yend=spiralTime, fill=meanTT)) +
  geom_tile(aes(height=meanTT*1800*0.9)) +
  scale_x_continuous(limits=c(0,24), breaks=0:23, minor_breaks=0:24,
                     labels=paste0(rep(c(12,1:11),2), rep(c("AM","PM"),each=12))) +
  scale_y_datetime(limits=range(dat.smry$spiralTime) + c(-3*24*3600,3600*9), 
                   breaks=seq(min(dat.smry$spiralTime),max(dat.smry$spiralTime),"1 day"),
                   date_labels="%b %e") +
  scale_fill_gradient2(low="green", mid="yellow", high="red", midpoint=35) +
  coord_polar() +
  theme_bw(base_size=12) + 
  labs(x="Hour",y="Day",color="Mean Travel Time") +
  theme(panel.grid.minor.x=element_line(colour="grey60", size=0.3))

enter image description here


请问,您能否用我的数据帮我做一下吗?我对 R 不是很熟悉。另外,请将图例中的低旅行时间值表示为绿色,最高值表示为红色。谢谢。 - Omar Abd El-Naser
这是一个圆形图吗? - Omar Abd El-Naser
我今晚会更新我的回答,以回应您的问题和评论。然而请注意,在您原始的小数据样本中,所有行的时间都在十分钟内。请注意,每一行的线段将被绘制在另一行之上。您是否希望以某种方式对这些数据进行分组,例如在15或30分钟的块内计算平均旅行时间? - eipi10
这真的很酷!我正在尝试弄清如何使用具有开始时间和停止时间的离散事件实现类似的情节。我一直在编辑您的代码,试图制作它,但是遇到了困难。您能否给出离散事件的示例? - Nate Gardner
我需要看一些数据才能了解你的意思。最好发布一个新问题并链接到这个问题。 - eipi10
显示剩余11条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接