使用Stan/RStan建模二项随机变量时if()条件存在问题

3

我正在尝试使用Stan和R拟合一个模型,该模型模拟观察结果 y_i = 16、9、10、13、19、20、18、17、35、55,这些结果来自于一个二项分布随机变量Y_i,其参数为m_i(试验次数)和p_i(每次试验的成功概率)。

yi = c(16, 9, 10, 13, 19, 20, 18, 17, 35, 55)

为了这个实验的目的,我假设所有的m_i都是固定的,并且由m_i = 74、99、58、70、122、77、104、129、308、119给出。

mi = c(74, 99, 58, 70, 122, 77, 104, 129, 308, 119)

我将使用杰弗里先验分布:\alpha=0.5 和 \beta=0.5。
alpha = 0.5, beta = 0.5

我正在尝试:

  1. 找到$p_i$的贝叶斯估计值。
  2. 找到$p_i$的范围(即参数k),如下所示:enter image description here

我对第二个问题的尝试是以下代码段:

        real k;
        real mx = 0;
        real mn = 0;
        if (p > mx) 
          mx = p;
        if (mn > p) {
          mn = p;
        }
        k = mx - mn;

我的Stan代码如下所示:
```{stan output.var="BinModBeta"}
  data {
    int <lower = 1> mi[10];
    int <lower = 0> yi[10];
    real <lower = 0> alpha;
    real <lower = 0> beta;
  }

  parameters {
    real <lower = 0, upper = 1> p[10];
  }

  transformed parameters {
    real k;
    real mx = 0;
    real mn = 0;
    if (p > mx) 
      mx = p;
    if (mn > p) {
      mn = p;
    }
    k = mx - mn;
  }

  model {
    yi ~ binomial(mi, p);
    p ~ beta(alpha, beta);
  }
```

我的R代码如下:

```{r}
library(rstan)
```

```{r}
data.in <- list(mi = c(74, 99, 58, 70, 122, 77, 104, 129, 308, 119), yi = c(16, 9, 10, 13, 19, 20, 18, 17, 35, 55), alpha = 0.5, beta = 0.5)
model.fit1 <- sampling(BinModBeta, data=data.in)
```

```{r}
print(model.fit1, pars = c("p"), probs=c(0.1,0.5,0.9), digits = 5)
```

现在,我刚开始学习Stan,所以我真的不确定这是否正确。然而,这份代码似乎对我的第一个目标有用(至少,我编码的部分似乎是起作用的……)。但当我尝试编写我的第二个目标时,问题就来了。

当我尝试编译上面的Stan代码时,我得到以下错误:

enter image description here

根据这个错误信息,看起来我的问题是因为p是一个包含10个实数值的向量,而不是一个单一的实数。然而,由于我对Stan的经验不足,我不知道如何解决这个问题。


你在parameters块中将p声明为长度为10的实数向量。因此,这导致了if语句中的错误。 - Maurits Evers
尝试将 p 声明为实数标量。 - Maurits Evers
我不确定我理解你试图建模的内容。m_1是什么?你在“转换参数”块中做了什么?我看不出问题陈述和你的模型之间有什么联系。你能详细说明一下吗? - Maurits Evers
@MauritsEvers mi 只是值为 74、99、58、70、122、77、104、129、308 和 119。在“转换参数”块中,我只是尝试做我在问题 2 中所说的(找到 p_i 的范围)。如果我们删除我描述为“我的尝试 2.”的代码,那么我们剩下的代码就解决了问题 1。但是,据我所见,我的代码适用于问题 1,但不适用于问题 2,这就是我请求帮助的原因。正如您所说,由于 p 是实数向量,它不适用于我的 if 语句。那么我该怎么办呢? - The Pointer
1
请看一下我在下面的回答,以及帖子底部的评论。 - Maurits Evers
显示剩余4条评论
1个回答

2

以下是我会做的:

model <- "
data {
  int <lower = 1> mi[10];
  int <lower = 0> yi[10];
  real <lower = 0> alpha;
  real <lower = 0> beta;
}

parameters {
  real <lower = 0, upper = 1> p[10];
}

model {
    p ~ beta(alpha, beta);        // Prior
    yi ~ binomial(mi, p);         // Likelihood
}

generated quantities {
    real k;
    k = max(p) - min(p);
}
"

library(rstan);
yi = c(16, 9, 10, 13, 19, 20, 18, 17, 35, 55);
mi = c(74, 99, 58, 70, 122, 77, 104, 129, 308, 119);
fit <- stan(
    model_code = model,
    data = list(mi = mi, yi = yi, alpha = 0.5, beta = 0.5))
fit;
#Inference for Stan model: 6a01a3b25656e1b18183baf19183abf7.
#4 chains, each with iter=2000; warmup=1000; thin=1;
#post-warmup draws per chain=1000, total post-warmup draws=4000.
#
#         mean se_mean   sd    2.5%     25%     50%     75%   97.5% n_eff Rhat
#p[1]     0.22    0.00 0.05    0.13    0.19    0.22    0.25    0.32  4000    1
#p[2]     0.10    0.00 0.03    0.05    0.07    0.09    0.11    0.16  4000    1
#p[3]     0.18    0.00 0.05    0.09    0.14    0.17    0.21    0.28  4000    1
#p[4]     0.19    0.00 0.05    0.11    0.16    0.19    0.22    0.29  4000    1
#p[5]     0.16    0.00 0.03    0.10    0.14    0.16    0.18    0.22  4000    1
#p[6]     0.26    0.00 0.05    0.17    0.23    0.26    0.30    0.37  4000    1
#p[7]     0.18    0.00 0.04    0.11    0.15    0.17    0.20    0.25  4000    1
#p[8]     0.13    0.00 0.03    0.08    0.11    0.13    0.15    0.20  4000    1
#p[9]     0.11    0.00 0.02    0.08    0.10    0.11    0.13    0.15  4000    1
#p[10]    0.46    0.00 0.04    0.38    0.43    0.46    0.49    0.55  4000    1
#k        0.38    0.00 0.05    0.28    0.34    0.38    0.41    0.47  4000    1
#lp__  -530.01    0.05 2.26 -535.38 -531.33 -529.65 -528.37 -526.69  1782    1
#
#Samples were drawn using NUTS(diag_e) at Tue Apr 24 22:02:07 2018.
#For each parameter, n_eff is a crude measure of effective sample size,
#and Rhat is the potential scale reduction factor on split chains (at
#convergence, Rhat=1).

注释:

  1. 我建议将涉及计算k的部分移至generated quantities块中;这与不同程序块在不同时间执行有关。虽然transformed parameters块在每个leapfrog步骤中执行一次,但generated quantities块仅在每个样本绘制时执行一次。因此,在重新计算k时会减少开销。详情请参见此处。请注意,pi后验密度的不确定性会正确传播到k

  2. 在计算k时,您可以使用Stan内部的max,min函数。这比使用if条件确定pi的最小/最大值更快,也消除了定义mnmx的需要。


1
@ThePointer 我认为 k=0.36k=0.38 的可信区间是非常一致的。仅对您评论的第一部分进行澄清:将 k 计算留在“转换参数”部分并没有问题;这只是效率较低且不是必需的。当您需要在更新后验概率之前计算量时,“转换参数”块很重要(但本例中并非如此)。 - Maurits Evers
1
好的。谢谢您分享您的智慧。这对我来说非常启发性。 - The Pointer
1
@ThePointer 关于您在简历中提出的问题:请记住,不确定性会传播。考虑到 mxmn 及其相关标准差。我们正在使用贝叶斯框架,但让我们暂时考虑不确定性的经典传播方式:对于一个派生量 k = mx - mn,不确定性的传播遵循以下规则:(sd(k)/k)^2 = (sd(mx)/mx)^2 + (sd(mn)/mn)^2。换句话说,k 的平方相对不确定度将等于 mxmn 的平方相对不确定度之和。[...] - Maurits Evers
1
在完全的贝叶斯框架下,你不是在看点估计,而是整个后验密度。点估计不“加起来”并不令人惊讶,因为你忽略了不确定性及其非线性传播(这也发生在非贝叶斯框架内,正如刚刚所证明的)。 - Maurits Evers
1
@ThePointer 很高兴能够帮到你。这是一个很好而且有趣的问题。感谢讨论。 - Maurits Evers
显示剩余2条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接