SageMaker脚本模式+管道模式

Question

SageMaker脚本模式+管道模式

pythontensorflowstreamingamazon-sagemaker

3

我正在使用TensorFlow + Script Mode在SageMaker中进行训练，目前使用的是“文件”输入模式来处理我的数据。

有没有人已经想出如何在Script Mode训练中使用“管道”数据格式来流式处理数据了？

- Austin

嗨，奥斯汀。你有什么进展可以分享吗？ - ace

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Marcio dos Santos · Accepted Answer

你可以按照以下方式从训练脚本中导入sagemaker_tensorflow：

from sagemaker_tensorflow import PipeModeDataset
from tensorflow.contrib.data import map_and_batch

channel = 'my-pipe-channel-name'

ds = PipeModeDataset(channel)
ds = ds.repeat(EPOCHS)
ds = ds.prefetch(PREFETCH_SIZE)
ds = ds.apply(map_and_batch(parse, batch_size=BATCH_SIZE,
                            num_parallel_batches=NUM_PARALLEL_BATCHES))

你可以在这里找到完整的示例：https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/tensorflow_pipemode_example/pipemode.py 你可以在这里找到有关sagemaker_tensorflow的文档：https://github.com/aws/sagemaker-tensorflow-extensions#using-the-pipemodedataset