47得票9回答
Qstat和长作业名称

如何才能让qstat显示完整的作业名称? 我知道qstat -r会提供有关任务的详细信息,但其中包括了太多资源需求等内容。 qstat -r的输出形式如下: 131806 0.25001 tumor_foca ajalali qw 09/29/2014 15:49:41 ...

33得票3回答
如何在qsub中指定错误日志文件和输出文件

我有一个qsub脚本,如下: #####----submit_job.sh---##### #!/bin/sh #$ -N job1 #$ -t 1-100 #$ -cwd SEEDFILE=/home/user1/data1 SEED=$(s...

21得票4回答
Segmentation fault 后空的核心转储文件

我正在运行一个程序,但是它被 Segmentation fault 中断了。问题在于,虽然创建了核心转储文件,但大小为零。 你听说过这种情况吗?怎么解决呢? 我的磁盘上有足够的空间。我已经执行了 ulimit -c unlimited 来取消限制核心转储文件大小,无论是在运行时还是将其放置...

21得票3回答
在SGE下从qsub命令中排除节点

我有超过200个任务需要提交到SGE集群。我将把它们提交到两个队列中。其中一个队列有一台机器,我不想提交任务到那里。如何排除那台机器?我找到的唯一可能有用的东西是(假设q1有三个有效节点可用,q2的所有可用节点都是有效的): qsub -q q1.q@n1 q1.q@n2 q1.q@n3 q...

17得票1回答
Sun Grid Engine 完成的作业信息

有没有办法使用qstat或其他SGE命令列出执行Sun Grid Engine作业的节点? 我必须使用Python脚本获取这些信息。我已经弄清楚了如何从Python执行SGE命令,但我没有找到列出特定作业的执行节点的解决方案。我尝试过使用以下方式列出已完成的作业: qstat -s z -...

15得票2回答
在SGE中按编号和名称请求节点

在SGE作业提交时,如何请求节点数(而非处理器数)? 例如,在TORQUE中,我们可以指定qsub -l nodes=3 在SGE中,如何按节点名称请求节点? 例如,在TORQUE中,我们可以这样做:qsub -l nodes=abc+xyz+pqr,其中abc、xyz和pqr是主机名 ...

13得票1回答
在SLURM中运行二进制文件而无需顶级脚本

在SGE/PBS中,我可以像在本地一样提交二进制可执行文件到集群。例如:qsub -b y -cwd echo hello 我想提交一个名为echo的作业,它会将单词"hello"写入其输出文件。我该如何向SLURM提交类似的作业?SLURM要求在文件的第一行具有hash-bang解释器。在S...

12得票1回答
如何列出SGE集群上的所有节点?

我正在尝试列出集群上的所有节点,但不知道命令是什么。我搜索了一下,如果使用qhost命令可以列出部分节点。有没有办法列出所有节点?

11得票1回答
QSUB:在作业数组中为每个任务指定输出和错误文件

希望这不是重复的问题,也不仅仅是我们集群配置的问题... 我正在使用以下命令将作业数组提交到集群中:qsub。 qsub -q QUEUE -N JOBNAME -t 1:10 -e ${ERRFILE}_$SGE_TASK_ID /path/to/script.sh 在哪里 ERR...

11得票1回答
如何删除一系列作业?

我想删除一系列具有连续ID的作业,例如:qdel。 qdel 18280 18281 18282 18283 18284 18285 假设我有一个像这样的连续ID列表。显然,我不想手动输入它们所有。有更简单的方法吗?