169得票2回答
SLURM `srun` vs `sbatch` and their parameters

我正在尝试理解SLURM的srun和sbatch命令之间的区别。我希望得到一般性的解释,而不是针对以下问题的具体答案,但以下这些困惑的具体点可以作为起点并给出我所寻找的想法。 根据文档,srun用于提交作业,sbatch用于提交稍后执行的作业,但实际区别不清楚,它们的行为似乎相同。例如,我有...

108得票3回答
在运行的Slurm作业中添加时间

我有一份工作在由slurm管理的Linux机器上运行。 现在工作已经运行了几个小时,我意识到我低估了工作完成所需的时间,因此我指定的--time参数的值不足。是否有一种方法可以通过slurm为现有正在运行的作业添加时间?

92得票7回答
找出一个slurm作业的CPU时间和内存使用情况

我想这是一个相当琐碎的问题,不过我仍在寻找(我猜是)显示一个slurm作业ID使用的CPU时间和内存的命令(可能是sacct命令)。

85得票3回答
SLURM中的--ntasks或-n tasks是什么意思?

我使用SLURM来使用一些计算群集,其中有-ntasks或-n选项。我已经阅读了它的文档(http://slurm.schedmd.com/sbatch.html): sbatch不会启动任务,它请求分配资源并提交批处理脚本。此选项建议Slurm控制器在分配内运行作业步骤时启动最大数量...

75得票7回答
通过sbatch传递命令行参数

假设我有以下简单的bash脚本,我想通过SLURM将其提交到批处理服务器: #!/bin/bash #SBATCH -o "outFile"$1".txt" #SBATCH -e "errFile"$1".txt" hostname exit 0 在这个脚本中,我只想将hostna...

62得票2回答
在Slurm中展开列以查看完整的作业名称

在SLURM中的sacct命令中,是否有可能扩展JobName列使用的字符数? 例如,目前我的显示如下: JobID JobName Elapsed NCPUS NTasks State ------------ ---------- ---...

53得票1回答
状态'drain'是什么意思?

当我使用sinfo时,我看到以下内容:$ sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST [...] RG3 up 28-00:00:0 1 drain rg3hpc4 [...] “drain”的意...

47得票1回答
“工作”、“任务”和“步骤”这些术语之间有何关联?

如何理解SLURM文档中的“job”、“task”和“step”这些术语? 据我了解,一个作业可以包含多个任务和步骤,但即使是这样,任务和步骤之间的关系仍不清楚。 通过示例展示作业/任务/步骤的完整复杂性将会很有帮助。

46得票3回答
SLURM: 查看每个节点的核心数以及每个作业使用的核心数

我已经搜索了谷歌并阅读了文档。 我的本地集群正在使用SLURM。我想要检查以下内容: 每个节点有多少个核心? 队列中的每个作业预留了多少个核心? 任何建议都将不胜感激!

46得票1回答
HPC集群:在SLURM sbatch中选择CPU和线程数量

sbatch 手册中使用的术语可能有点令人困惑。因此,我想确保我正确设置了选项。假设我有一个任务需要在单个节点上运行,并且需要 N 个线程。 我是否正确地假设我将使用 --nodes=1 和 --ntasks=N? 我习惯于考虑在单个进程中使用 pthreads 创建 N 个线程。那他们所称...