预测泊松过程

Question

4

我希望使用泊松分布来预测道路交通的车辆到达时间间隔。目前，我使用泊松过程生成(合成)到达时间，以使到达时间间隔呈指数分布。

观察过去的数据，我想预测下一个/未来的到达时间间隔。为此，我想实现学习算法。

我使用了各种方法，例如贝叶斯预测器(最大后验概率)和多层神经网络。在这两种方法中，我使用一定长度的输入特征(到达时间间隔)的移动窗口n。

对于贝叶斯预测器，我使用到达时间间隔作为二元特征(1->长，0->短)来预测下一个到达时间间隔是否为“长”或“短”，而对于具有n个神经元输入层和m个隐藏层(n=13,m=20)的神经网络，则输入n个先前的到达时间间隔，并生成未来的估计到达时间(权重和阈值由反向传播算法更新)。

贝叶斯方法的问题在于，如果“短”间隔的数量高于“长”间隔，则会出现偏差。因此，它永远不会预测“长”空闲期(因为“短”的后验概率始终更大)。而在多层神经预测器中，预测精度不足。特别是对于较高的到达时间间隔，预测精度急剧下降。

我的问题是，“随机过程(泊松)不能以良好的准确性进行预测吗？还是我的方法不正确？”任何帮助将不胜感激。

- user846400

2个回答

5

如果生成过程是同质泊松过程，那么就没有太多需要预测的了，对吧？速率参数在整个时间内保持恒定且可以轻松地估计，但除此之外，最近的历史记录对到达间隔时间没有影响。您正在使用最近到达的二进制特征，但同质泊松过程的整个要点在于到达是独立指数分布的，并且指数分布具有无记忆性。

现在，如果不正确地做出了同质化假设，您需要更多地考虑细节，答案取决于您希望使用的平均度量方式。看一下Cox过程（双随机泊松过程，其中平均度量也是随机变量）或可能是Hawkes过程（每次到达都会引起进一步活动的爆发）。

- bsdfish

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- symcbean · Accepted Answer

如果它确实遵循泊松分布，您只能预测下一个流量项在给定时间间隔内到达的概率 - 而概率曲线仅是泊松分布的归一化积分（即渐近线为1的曲线）。为什么要使用神经网络/贝叶斯预测器进行所有这些混乱呢？