我有以下数据表格,想要使用泊松分布
最终的数据表应该是这样的,每一行代表一个乘客,到达时间从泊松分布中随机采样,其中λ为第一个数据表中航班的到达时间。
rpois(n, lambda)
对每位乘客的到达时间进行抽样。# A tibble: 3 x 4
flight terminal passengers arrivaltime
<chr> <chr> <dbl> <dbl>
1 LX123 A 3 120
2 UA1 B 2 130
最终的数据表应该是这样的,每一行代表一个乘客,到达时间从泊松分布中随机采样,其中λ为第一个数据表中航班的到达时间。
# A tibble: 3 x 4
flight terminal arrivaltime
<chr> <chr> <dbl>
1 LX123 A 125
2 LX123 A 115
3 LX123 A 118
4 UA1 B 129
5 UA1 B 132
我已经有了以下计算rpois值并将其应用于tibble的代码:
f = function(x, output){
n = as.integer(x[[3]])
lambda = as.integer(x[[4]])
rpois(n, lambda)
}
apply(tibble, MARGIN = 1, FUN = f)
我现在的问题是如何完成我的方法来创建第二个tibble。鉴于使用的数据集很大,快速计算是一个问题。