我在绘制概率密度直方图方面遇到了麻烦。
我希望所有区间的总和都等于1,这样可以更容易地比较数据集。但是不知为何,每当我指定分割点(默认为4或其他值),它就不再绘制概率密度而是绘制频数分布。
hist(data[,1], freq = FALSE, xlim = c(-1,1), breaks = 800)
我该如何更改这一行?我需要一个概率分布和大量的箱子。(我有600万个数据点)这在 R 帮助文件中,但我不知道如何覆盖它:
freq 逻辑值; 如果为 TRUE,则直方图图形是结果中 counts 部分的表示;如果为 FALSE,则绘制概率密度,组成部分 density (使直方图的总面积为1)。如果并且没有指定 probability,则默认为 TRUE。
谢谢
编辑: 细节
我的图形超过了 1,如果这是概率就相当令人困惑。现在我明白这与箱子宽度有关。我更多地想让每个箱子价值 1 分钟,同时仍然有很多箱子。换句话说,除非直接位于 1.0,并且所有其他箱子都为 0.0,否则不应该有任何箱子高度超过 1.0。目前,我的箱子在 15.0 左右形成了一个圆顶。
编辑: 按%点高度
@Dwin : 那么我该如何绘制概率?我意识到由于 x 轴上的单位,取积分仍将给我 1.0,但这不是我想要的。比如说,我有100个点,其中5个点落在第一个箱子里,那么那个箱子的高度应该为0.05。这就是我想要的。我做错了吗?还有其他方法可以实现这个目的吗?
我知道我有多少点。有没有办法将频率直方图中每个箱子计数除以这个数字?