18得票3回答
如何获取用于SLURM作业的脚本的原始位置?

我正在使用脚本开始SLURM作业,这个脚本必须根据其位置工作,该位置是在脚本中通过SCRIPT_LOCATION = $ (realpath $ 0)获得的。但是SLURM会将脚本复制到 slurmd 文件夹中并从那里启动作业,这会破坏进一步的操作。 有什么办法可以在移动/复制之前获取用于s...

17得票6回答
限制SLURM中正在运行的作业数量

我正在 SLURM 中排队多个作业。我能否限制 SLURM 中并行运行的作业数量? 提前感谢!

17得票2回答
如何将最高优先级设置为Slurm作业?

作为管理员,我需要给予某个任务最高的优先级。 我发现像 --priority=<value> 或者 --nice[=adjustment] 的提交选项可能很有用,但是我不知道应该给它们分配什么值才能为任务提供最高的优先级。 另一种方法可能是将所有任务默认设置为低优先级,对特殊任...

17得票2回答
如何在提交到Slurm时激活特定的Python环境?

我想在集群上运行一个脚本 (SBATCH文件)。 如何激活我的虚拟环境 (path/to/env_name/bin/activate)。 我是否只需要将以下代码添加到my_script.sh文件中? module load python/2.7.14 source "/pathto...

16得票2回答
如何从SLURM获取详细的作业运行信息(例如,类似于LSF生成的“标准输出”)?

当使用 LSF 的 bsub 命令时,-o 选项会提供许多详细信息,例如作业的开始和结束时间以及作业所使用的内存和 CPU 时间。但是,在使用 SLURM 时,我只能获得与没有使用 LSF 运行脚本时相同的标准输出。 例如,假设有以下 Perl 6 脚本:warn "standar...

16得票4回答
在Slurm中,是否有一个快速的命令可以确定给定时刻挂起和活动的作业总数?

在Slurm中,调用命令squeue -u <username>将列出给定用户所有处于等待或活动状态的作业。我想知道是否有一种快速的方式来对它们进行计数,以便我知道有多少未完成的作业,包括等待和正在运行的作业。谢谢!

15得票1回答
如何更改SLURM更新输出文件(stdout)的频率?

我正在使用SLURM在超级计算机上分发任务。我设置了--output=log.out选项,以将作业的标准输出内容保存到文件(log.out)中。我发现该文件每30-60分钟更新一次,这使得我难以查看我的任务状态。 你知道为什么更新此文件需要这么长时间吗?有没有办法更改设置,使得该文件能够更频...

15得票3回答
使用SLURM sbatch作业数组并行运行具有不同输入参数的同一脚本

我有一个问题,需要使用不同的输入参数来启动相同的脚本。 假设我有一个脚本 myscript.py -p <par_Val> -i <num_trial>,我需要考虑N个不同的par_values(在x0和x1之间),每个par_value需要进行M次试验。 M次试验...

15得票3回答
使用SRUN代替SBATCH,能否在后台运行SLURM作业?

我试图使用srun在后台运行slurm作业。不幸的是,由于我现在必须通过Docker运行事物,因此使用sbatch有点麻烦,因此我正在尝试找出是否可以完全避免使用它。 根据我的观察,每当我运行srun时,比如说:srun docker image my_job_script.py 关闭我正在...

14得票1回答
使用多个节点运行Slurm脚本,在每个任务步骤中启动1个任务。

我正在尝试使用批处理脚本启动大量作业步骤。这些不同的步骤可以是完全不同的程序,并且每个程序都需要恰好一个CPU。首先,我尝试使用srun命令的--multi-prog参数来完成此操作。不幸的是,当以这种方式使用分配给我的所有CPU时,性能会严重降低。运行时间几乎接近串行化值。通过欠订阅,我可以...