预测泊松过程

4
我希望使用泊松分布来预测道路交通的车辆到达时间间隔。目前,我使用泊松过程生成(合成)到达时间,以使到达时间间隔呈指数分布。
观察过去的数据,我想预测下一个/未来的到达时间间隔。为此,我想实现学习算法。
我使用了各种方法,例如贝叶斯预测器(最大后验概率)和多层神经网络。在这两种方法中,我使用一定长度的输入特征(到达时间间隔)的移动窗口n。
对于贝叶斯预测器,我使用到达时间间隔作为二元特征(1->长,0->短)来预测下一个到达时间间隔是否为“长”或“短”,而对于具有n个神经元输入层和m个隐藏层(n=13,m=20)的神经网络,则输入n个先前的到达时间间隔,并生成未来的估计到达时间(权重和阈值由反向传播算法更新)。
贝叶斯方法的问题在于,如果“短”间隔的数量高于“长”间隔,则会出现偏差。因此,它永远不会预测“长”空闲期(因为“短”的后验概率始终更大)。而在多层神经预测器中,预测精度不足。特别是对于较高的到达时间间隔,预测精度急剧下降。
我的问题是,“随机过程(泊松)不能以良好的准确性进行预测吗?还是我的方法不正确?”任何帮助将不胜感激。
2个回答

5
如果它确实遵循泊松分布,您只能预测下一个流量项在给定时间间隔内到达的概率 - 而概率曲线仅是泊松分布的归一化积分(即渐近线为1的曲线)。为什么要使用神经网络/贝叶斯预测器进行所有这些混乱呢?

5
如果生成过程是同质泊松过程,那么就没有太多需要预测的了,对吧?速率参数在整个时间内保持恒定且可以轻松地估计,但除此之外,最近的历史记录对到达间隔时间没有影响。您正在使用最近到达的二进制特征,但同质泊松过程的整个要点在于到达是独立指数分布的,并且指数分布具有无记忆性。
现在,如果不正确地做出了同质化假设,您需要更多地考虑细节,答案取决于您希望使用的平均度量方式。看一下Cox过程(双随机泊松过程,其中平均度量也是随机变量)或可能是Hawkes过程(每次到达都会引起进一步活动的爆发)。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接