从n个元素的集合中随机选择一个元素的预期概率为P=1.0/n。假设我使用足够多次的无偏方法检查P。那么P的分布类型是什么?显然,P不是正态分布,因为它不能为负数。因此,我可以正确地假设P服从伽马分布吗?如果可以,这个分布的参数是什么?100个元素集合中选取1000次元素的概率的直方图在这里显示。有没有办法将其转换为标准分布?现在假设所选择的元素的观察概率为P*(P*!= P)。如何估计偏差是否具有统计学意义?编辑:这不是一项作业。我正在做一个兴趣项目,我需要这个统计信息。我最后一次做作业是在大约10年前 :)
这是一个明确的二项分布,其中p=1/(元素数),n=(试验次数)。 为了测试观察结果是否与预期结果显著不同,您可以进行二项式检验。 两个维基百科页面上的骰子示例应该能够为您提供如何制定问题的良好指导。在您的100个元素、1000次试验的例子中,这就像是投掷100面骰子1000次。
对于重复选择,你的分布将是二项式分布。因此,令X为您选择某个固定对象的次数,总共进行M次选择 P{ X = x } = ( M choose x ) * (1/N)^x * (N-1/N)^(M-x) 当N足够大时,您可能会发现难以计算。事实证明,对于足够大的N,这实际上收敛于正态分布,概率为1(中心极限定理)。 如果P{X=x}由正态分布给出。平均值将为M/N,方差将为M*(1/N)*(N-1)/N。