我遇到了许多情况,想要绘制比我实际需要的更多的点 - 主要问题是当我与他人分享我的图形或将它们嵌入论文时,它们占用太多空间。从数据框中随机抽样行非常简单。
如果我想要一个真正的随机样本来绘制点图,很容易说:
ggplot(x,y,data=myDf[sample(1:nrow(myDf),1000),])
然而,我想知道是否有更有效(最好是预先制作的)的方法来指定绘图点的数量,以便在图中准确反映实际数据。以下是一个例子。假设我正在绘制类似于重尾分布的CCDF,例如:
ccdf <- function(myList,density=FALSE)
{
# generates the CCDF of a list or vector
freqs = table(myList)
X = rev(as.numeric(names(freqs)))
Y =cumsum(rev(as.list(freqs)));
data.frame(x=X,count=Y)
}
qplot(x,count,data=ccdf(rlnorm(10000,3,2.4)),log='xy')
这将生成一个x和y轴变得越来越密集的图。在此情况下,最好少绘制大x或y值的样本。
有人对处理类似问题有什么技巧或建议吗?
谢谢, -e