我有一个为大型数据集预先分组的频率表。换句话说,有一个包含分组的单列向量和一个与这些分组相关联的单列计数向量。我希望使用 R 进行进一步的分组并对现有计数进行求和,绘制此数据的直方图。例如,如果在预先分组的数据中,我有类似于 [(0.01, 5000), (0.02, 231), (0.03, 948)] 的内容,其中第一个数字是分组,第二个数字是计数,并且我选择 0.04 作为新的分组宽度,则期望得到 [(0.04, 6179)]。在 R 中实现这个最快或最简单的方法是什么?
library(ggplot2)
qplot(bin, data=cbind(bins,counts), weight=counts, geom="histogram")
MergeBuckets
函数。install.packages("HistogramTools")
library(HistogramTools)
h <- hist(rexp(1000), breaks=60)
plot(MergeBuckets(h, adj.buckets=3))
另外,您还可以明确指定要使用的新断点列表,而不是告诉MergeBuckets()始终合并相邻的相同数量的桶。