如何使用nvidia-docker在docker操作的swarm模式下创建服务。我正在尝试在这个swarm网络中训练一个tensorflow模型,以进行分布式学习。我发现一种方法是在不同机器上运行不同容器的swarm网络,并在每台机器上使用GPU进行分布式训练。如果在swarm模式下不可能,是否有可能完成上述任务?
docker服务创建--name tensorflow --network overnet saikishor/tfm:test azt0tczwkxaqpkh9yaea4laq1
由于未指定--detach=false,任务将在后台创建。
在未来的发布中,--detach=false将成为默认值
但在docker服务ls下,我有这个:
ID NAME MODE REPLICAS IMAGE PORTS uf6jgp3tm6dp tensorflow replicated 0/1 saikishor/tfm:test
docker服务创建--name tensorflow --network overnet saikishor/tfm:test azt0tczwkxaqpkh9yaea4laq1
由于未指定--detach=false,任务将在后台创建。
在未来的发布中,--detach=false将成为默认值
但在docker服务ls下,我有这个:
ID NAME MODE REPLICAS IMAGE PORTS uf6jgp3tm6dp tensorflow replicated 0/1 saikishor/tfm:test