在R中近似计算二项随机变量之和的分布

5
我的目标是近似计算二项变量之和的分布。 我使用Ken Butler和Michael Stephens的论文The Distribution of a Sum of Binomial Random Variables。 我想编写一个R脚本来找到二项式和的Pearson近似。 有一个R包PearsonDS可以简单地完成这个任务。 因此,我从论文中选取第一个例子,并尝试找到该情况下Pearson分布的密度。 最后,我收到了一个错误消息:“没有这些矩的概率分布”。 请问以下代码有什么问题?
library(PearsonDS)

# 定义五个二项式随机变量的参数

n<-rep(5,5)
p<-seq(0.02,0.10,0.02)

# 找到前四个累积量

k.1<-sum(n*p)
k.2<-sum(n*p*(1-p))
k.3<-sum(n*p*(1-p)*(1-2*p))
k.4<-sum(n*p*(1-p)*(1-6*p*(1-p)))

#查找偏度和峰度参数

beta.1<-k.3^2/k.2^3
beta.2<-k.4/k.2^2

# 定义时刻并计算

moments <- c(mean=k.1,variance=k.2,skewness=sqrt(beta.1),kurtosis=beta.2)
dpearson(1:7,moments=moments)

我收到了错误信息“没有这些矩的概率分布”。

从文档中我并不清楚dpearson在使用moments进行覆盖时如何确定分布类型。如果您知道要使用哪种分布,请直接使用所需的dpearson[I至VII]函数。或者,确保所有的moments参数都是合法的,例如方差>0且为实数。 - Carl Witthoft
@Carl,感谢您的回复。我已经仔细阅读了文档。 - Eugeny Chankov
函数 pearsonFitM 确定分布类型。当峰度减1小于偏度时,会显示消息“这些矩无法对应任何概率分布”。 不幸的是,我不知道也找不到这种情况的原因。如果我放弃它,那么累积量将定义 PearsonI 分布。 - Eugeny Chankov
抱歉,我打错了。无效条件的正确形式应该是“峰度减1小于偏度的平方”。 - Eugeny Chankov
1个回答

2
您尝试在矩中插入的峰度实际上是“过量峰度”,即只是“峰度-3”。从dpearson()的帮助页面中可以得知:

moments:
均值、方差、偏度和峰度(非过量峰度)的可选向量/列表。

因此,将3添加到beta.2将提供您实际的峰度:

beta.1 <- (k.3^2)/(k.2^3)
beta.2 <- k.4/(k.2^2)
kurt <- beta.2 + 3

moments <- c(mean = k.1, variance = k.2, skewness = beta.1, kurtosis = kurt)
dpearson(1:7, moments=moments)
# [1] 0.3438773545 0.2788412385 0.1295129534 0.0411140817 0.0099279576
# [6] 0.0019551512 0.0003294087

为了得到类似论文中的结果,我们需要研究累积分布函数,并加上0.5来纠正由于将离散分布近似为连续分布而导致的偏差。
ppearson(1:7+0.5, moments = moments)
# [1] 0.5348017 0.8104394 0.9430092 0.9865434 0.9973715 0.9995578 0.9999339

一些背景信息:

这个函数抛出了一个错误,因为峰度和偏度之间的关系无效:峰度以下界受到如下偏度限制:kurtosis >= (skewness)^2 - 1。证明并不美观,肯定超出了问题的范围,但如果您喜欢,可以查看下面的参考文献以获取此不等式的不同版本。

  1. Wilkins,J. Ernest。偏度和峰度注释。Ann. Math. Statist. 15(1944),no. 3,333--335。http://projecteuclid.org/euclid.aoms/1177731243
  2. K. Pearson。进化理论中的数学贡献,XIX; 偏斜变异的第二个补充。Philos. Trans. Roy. Soc. London Ser. A, 216(1916),p. 432 http://rsta.royalsocietypublishing.org/content/216/538-548/429
  3. Pearson,K。 (1929)。 “编辑说明'频率函数和各种统计常数的矩不等式'”。Biometrika。 21(1-4):361-375。链接

这些数字似乎与表3中的Pearson近似的数字不匹配。你能发表一下评论吗? - bdeonovic

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接