我正在使用TensorFlow + Script Mode在SageMaker中进行训练,目前使用的是“文件”输入模式来处理我的数据。
有没有人已经想出如何在Script Mode训练中使用“管道”数据格式来流式处理数据了?
我正在使用TensorFlow + Script Mode在SageMaker中进行训练,目前使用的是“文件”输入模式来处理我的数据。
有没有人已经想出如何在Script Mode训练中使用“管道”数据格式来流式处理数据了?
sagemaker_tensorflow
:
from sagemaker_tensorflow import PipeModeDataset
from tensorflow.contrib.data import map_and_batch
channel = 'my-pipe-channel-name'
ds = PipeModeDataset(channel)
ds = ds.repeat(EPOCHS)
ds = ds.prefetch(PREFETCH_SIZE)
ds = ds.apply(map_and_batch(parse, batch_size=BATCH_SIZE,
num_parallel_batches=NUM_PARALLEL_BATCHES))