正在运行的Slurm作业如何更改CPU数量

4

我有一个SLURM集群和一个正在运行的作业,我请求使用60个线程:

#SBATCH --cpus-per-task=60

我正在使用cgroups在一个节点上分享线程。

现在我想将线程数量减少到30个。

$ scontrol update jobid=274332 NumCPUs=30
Job is no longer pending execution for job 274332

这份工作仍然分配了60个线程。
$ scontrol show job 274332
JobState=RUNNING Reason=None Dependency=(null)
NumNodes=1 NumCPUs=60 NumTasks=1 CPUs/Task=60 ReqB:S:C:T=0:0:*:*

如何正确地完成这个任务?

谢谢!

1个回答

5
在当前版本的Slurm中,scontrol只允许减少正在运行作业的节点数,但不允许减少CPU数量(或内存)。FAQ中提到:
使用scontrol命令通过指定作业的新节点数(NumNodes=)或标识要保留作业的特定节点(NodeList=)来更改作业的大小。
(重点是我的)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接