在R中分离两个重叠的正态分布

3

我正在寻找一个在R中可以将两个重叠的正态分布分离的函数/包名称。该分布看起来像这样:

x<-c(3.95, 3.99, 4.0, 4.04, 4.1, 10.9, 11.5, 11.9, 11.7, 12.3)

2
为什么这个问题被关闭了,认为它不属于讨论范围? - nico
鉴于已有的好回答,我决定投票支持重新开放,但我仍然坚持我的原始投票。这个问题缺乏关于他们想要实现什么方法的足够细节,使得它不仅仅是一个编程问题,并且它的质量太低,无法迁移到CV。 - Ari B. Friedman
@AriB.Friedman:……考虑到当前的简历政策,这个问题会被认为与编程过于相关,不适合作为简历中的内容。 - russellpierce
2个回答

9

我过去使用向量广义线性模型获得了良好的结果。对此,VGAM软件包非常有用。

mix2normal1函数可用于估计两个单变量正态分布的混合参数。

以下是一个小例子:

require(VGAM)
set.seed(12345)

# Create a binormal distribution with means 10 and 20
data <- c(rnorm(100, 10, 1.5), rnorm(200, 20, 3))

# Initial parameters for minimization algorithm
# You may want to create some logic to estimate this a priori... not always easy but possible
# m, m2: Means - s, s2: SDs - w: relative weight of the first distribution (the second is 1-w)
init.params <- list(m=5, m2=8, s=1, s2=1, w=0.5)

fit <<- vglm(data ~ 1, mix2normal1(equalsd=FALSE), 
                iphi=init.params$w, imu=init.params$m, imu2=init.params$m2, 
                isd1=init.params$s, isd2=init.params$s2)

# Calculated parameters
pars = as.vector(coef(fit))
w = logit(pars[1], inverse=TRUE)
m1 = pars[2]
sd1 = exp(pars[3])
m2 = pars[4]
sd2 = exp(pars[5])

# Plot an histogram of the data
hist(data, 30, col="black", freq=F)
# Superimpose the fitted distribution
x <- seq(0, 30, 0.1)
points(x, w*dnorm(x, m1, sd1)+(1-w)*dnorm(x,m2,sd2), "l", col="red", lwd=2)

这个正确地给出了(“真正的”参数 - 10,20,1.5,3)

> m1
[1] 10.49236
> m2
[1] 20.06296
> sd1
[1] 1.792519
> sd2
[1] 2.877999

Fit bimodal distribution


3
您可能想要使用非线性回归工具(或其他非线性回归器)nls。我猜您有一个表示叠加分布的数据向量。然后,大致地说,nls(y~I(a*exp(-(x-meana)^2/siga) + b*exp(-(x-meanb)^2/sigb) ),{initial guess values required for all constants} ),其中y是您的分布,x是定义域。 我完全没有考虑这个问题,所以我不确定哪种收敛方法不太可能失败。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接