在slurm中,AssocMaxWallDurationPerJobLimit是什么意思?

3
我提交了一个任务,但是出现了以下错误消息:
               253       x86 brando_j miranda9 PD       0:00      1 (AssocMaxWallDurationPerJobLimit)

这是什么意思?

我的sbatch脚本如下:

#!/bin/bash
#SBATCH --job-name="brando_job"
#SBATCH --output="main.sh.o%j.%N"
#SBATCH --partition=x86
#SBATCH --time=47:00:00
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=32
#SBATCH --sockets-per-node=1
#SBATCH --cores-per-socket=16
#SBATCH --threads-per-core=2
#SBATCH --mem-per-cpu=32000
#SBATCH --gres=gpu:a100:4
#SBATCH --export=ALL
1个回答

4

这意味着您所请求的持续时间#SBATCH --time=47:00:00与您帐户上的限制相比过长。

您可以通过以下方式检查:

sacctmgr show user $USER withassoc format=account,user,partition,MaxWallDurationPerJob

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接