如何检测时间序列数据的变化是否不再显著?

5
我有一组新闻文章,其中包含统计数据,例如:一段时间内提到该文章的推特帖子数量。统计值的自然行为是,新帖子的数量快速增长,然后随着新闻的老化而减少。
我想知道如何计算更改的统计数据不再显着的天数(例如:<0.1%的总帖子数),并具有一定的置信水平,适用于整个数据集。
你能给出一些信息和方法的提示吗?我也会很感激提供Python代码示例 :)

你想让你的程序“学习”,还是只是想知道你需要什么值,以便硬编码它? - 0xc0de
简单来说:只学习价值就足够了。 - xvga
1个回答

9
这个问题实际上与时间序列分析有关。既然您有兴趣确定截断点,那么一个好的起点是阅读控制图的相关内容(Control Charts)。如果您想深入了解统计学(超出控制图),则可以研究变点分析,并查找时间序列中的结构性变化。
Python模块:要在Python中执行此分析,相关的NumPy和pandas模块很重要。这篇statalgo文章将为您提供正确的Python代码轨迹。(如果您愿意使用R进行分析,请考虑CRAN包tseriesstrucchange。)

相关问题(统计学): 如何检测时间序列数据的变化?

相关现实生活例子: 在奥萨马·本·拉登之死后,人们对推特上的新闻传播进行了大量分析。文章甚至有一个专门与您关于新闻传播的停止的问题相关的部分。

最后,您也可以考虑在Stats SE网站上提出这个问题。

希望能对您有所帮助。


2
所有链接都已失效。 - Adders

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接