我的数据集中有约23300个小时级的数据点,我尝试使用Facebook Prophet进行预测。 为了微调超参数,可以使用交叉验证:
from fbprophet.diagnostics import cross_validation
整个流程如下: https://facebook.github.io/prophet/docs/diagnostics.html 使用
cross_validation
时需要指定initial
、period
和horizon
。df_cv = cross_validation(m, initial='xxx', period='xxx', horizon = 'xxx')
我现在想知道如何在我的情况下配置这三个值?如所述,我拥有大约23,300个小时数据点。我应该将其中一部分作为视野,或者正确的数据分数是否那么重要?我可以采取任何看起来合适的值吗?
此外,“cutoffs”也已按如下定义:
cutoffs = pd.to_datetime(['2013-02-15', '2013-08-15', '2014-02-15'])
df_cv2 = cross_validation(m, cutoffs=cutoffs, horizon='365 days')
这些是否应该像上面一样平均分布,还是可以根据个人喜好单独设置?