我在时间序列分析方面是新手。我试图找出短期(1天)温度时间序列的趋势,并尝试了不同的近似方法。此外,采样频率为2分钟。数据是针对不同站点进行协调的。我将比较不同趋势,以查看它们是否相似。
我在这个过程中面临三个挑战:
Q1 - 如何提取模式?
Q2 - 如何量化趋势,因为我将比较属于两个不同地方的趋势?
Q3 - 何时可以说两个趋势是相似的或不相似的?
我在时间序列分析方面是新手。我试图找出短期(1天)温度时间序列的趋势,并尝试了不同的近似方法。此外,采样频率为2分钟。数据是针对不同站点进行协调的。我将比较不同趋势,以查看它们是否相似。
我在这个过程中面临三个挑战:
Q1 - 如何提取模式?
Q2 - 如何量化趋势,因为我将比较属于两个不同地方的趋势?
Q3 - 何时可以说两个趋势是相似的或不相似的?
Q1 - 如何提取模式?
您可以对两个数据集执行时间序列分析。您需要使用统计库进行测试和比较。
如果您可以使用Python,则pandas
是一个不错的选择。
在R中,forecast
软件包非常好。首先在两个数据集上运行ets
。
Q2 - 由于我将比较属于两个不同地方的趋势,所以如何量化趋势?
量化趋势的想法是首先寻找一个(线性)趋势线。所有统计软件都可以协助完成这项工作。例如,如果您假设有一个线性趋势,则该线将最小化与数据点的平方偏差。
维基百科关于趋势估计的文章相当易懂。 此外,请记住,趋势可以是线性、指数或阻尼的。可以尝试不同的趋势参数来处理这些问题。
Q3 - 什么情况下可以说两个趋势相似或不相似?
在两个数据集上运行ARIMA。(这里的基本思想是看看是否可以使用相同的参数(构成ARIMA模型)来描述您的温度时间序列。如果在forecast
(R)中运行auto.arima()
,它将为您的数据选择参数p,d,q,这是一个很大的便利。
另一个想法是对两个系列执行2样本t检验,并检查显着性的p值。(警告:我不是统计学家,所以我不确定是否有任何理论反对对时间序列进行这样的操作。)
在研究过程中,我遇到了Granger测试——基本思想是看一个时间序列是否有助于预测另一个时间序列。似乎非常适用于您的情况。
这些只是一些让您入门的东西。希望能有所帮助。
0.0
的结果。 - Derek O