我正在制作一个基本的箱线图,其中y=年龄
,x=病人组
age <- ggplot(data, aes(factor(group2), age)) + ylim(15, 80)
age + geom_boxplot(fill = "grey80", colour = "#3366FF")
我希望你能帮我解决以下几个问题:
1)是否可能在每个分组箱线图上方包含一些观测值的数量(但不是在我的分组标签所在的X轴上),而不必使用画图软件? 我已经尝试过使用:
age + annotate("text", x = "CON", y = 60, label = "25")
其中,CON
是第一个组,y = 60
大致在该组的箱线图上方。然而,该命令并没有起作用。我猜想这可能与它将x
读为连续变量而不是分类变量有关。
2) 另外,虽然有很多关于在箱线图中使用均值而不是中位数的问题,但我仍然没有找到适合我的代码?
3) 在同一问题上,是否有一种方式可以在箱线图中包含平均组统计信息?也许使用
age + stat_summary(fun.y=mean, colour="red", geom="point")
然而,这仅包括均值所在位置的一个点。或者再次使用
age + annotate("text", x = "CON", y = 30, label = "30")
其中CON
是第一组,y = 30
是该组年龄平均值。鉴于ggplot2
语法的灵活性和丰富性,我希望有一种更优雅的方式来使用实际统计结果而不是annotate
。
任何建议/链接将不胜感激!
谢谢!!