我看到了许多使用LSTM处理tensorflow时间序列的指南,但是我仍然不确定当前最佳实践是关于读取和处理数据的 - 特别是当一个人应该使用tf.data.Dataset
API时。
在我的情况下,我有一个名为data.csv
的文件,其中包含我的features
,我想执行以下两个任务:
Compute targets - the target at time
t
is the percent change of some column at some horizon, i.e.,labels[i] = features[i + h, -1] / features[i, -1] - 1
I would like
h
to be a parameter here, so I can experiment with different horizons.Get rolling windows - for training purposes, I need to roll my features into windows of length
window
:train_features[i] = features[i: i + window]
我可以完美地使用 pandas
或者 numpy
构建这些对象,所以我不是在询问如何在一般情况下实现这个-我的问题是特别想知道在 tensorflow
中这样的管道应该是什么样子。
编辑:我想知道我列出的这两个任务是否适合数据集 API,或者是否最好使用其他库来处理它们?
tf.data.Datasets
API,因为Tensorflow能更好地优化读写操作,而不会限制训练时间。 - Evan Weissburg