对于时间序列数据集,我想进行一些分析并创建预测模型。通常,我们会将数据(在整个数据集上通过随机抽样)分成训练集和测试集,并使用训练集与 randomForest 函数。同时保留测试部分以检查模型的行为。
然而,有人告诉我对于时间序列数据,无法通过随机抽样来拆分数据。
如果有人能够解释如何将数据分成训练集和测试集供时间序列数据使用,或者是否有其他替代方法可以使用时间序列随机森林,我将不胜感激。
谢谢!
Sales<-read.csv("Sales.csv")
train_len=round(nrow(Sales)*0.8)
test_len=nrow(Sales)
training<-slice(SubSales,1:train_len)
testing<-slice(SubSales,train_len+1:test_len)