我有大约5个非常大的向量(约1.08亿个条目),因此在R中进行任何绘图/操作都需要花费相当长的时间。
我正试图可视化它们的分布(直方图),不知道如何在R中最好地叠加它们的直方图分布,而不会导致太长时间的等待。我想首先将一个分布拟合到直方图中,然后在一个图中绘制所有的分布线拟合。
您对如何实现这一点有什么建议吗?
假设我的向量是:
x1, x2, x3, x4, x5.
我将尝试使用这段代码:在R中使用ggplot2叠加直方图 以下是我用于3个向量的示例代码(R无法绘制):
n = length(x1)
dat <- data.frame(xx = c(x1, x2, x3),yy = rep(letters[1:3],each = n))
ggplot(dat,aes(x=xx)) +
geom_histogram(data=subset(dat,yy == 'a'),fill = "red", alpha = 0.2) +
geom_histogram(data=subset(dat,yy == 'b'),fill = "blue", alpha = 0.2) +
geom_histogram(data=subset(dat,yy == 'c'),fill = "green", alpha = 0.2)
但是生成图表需要很长时间,最终会将我踢出R。有没有关于如何高效使用ggplot2处理大向量的建议?在我的情况下,似乎需要创建一个包含5*108MM条目的数据框才能进行绘图,这非常低效。
谢谢!
sourceCpp
的原因。 - hadley