7得票1回答
如何优雅地防止snakemake因shell/R错误而失败?

我希望能够让我的snakemake工作流即使某些规则失败也能继续运行。 例如,我正在使用多种工具来执行ChIP-seq数据的峰值调用。然而,某些程序在无法识别峰值时会发出错误。在这种情况下,我更愿意创建一个空输出文件,而不是让snakemake失败(如一些峰值调用程序已经做到的那样)。 是...

14得票2回答
Snakemake中基准变量的含义

我在snakemake工作流的一些规则中加入了benchmark指令,生成的文件具有以下标题: s h:m:s max_rss max_vms max_uss max_pss io_in io_out mean_load 我找到的唯一文档提到了一个“基准测试txt文件(其中...

7得票2回答
snakemake中的temp()导致规则不必要地重新运行

我使用的是snakemake v 5.4.0,并且在temp()方面遇到了问题。在一个假设的场景中: Rule A --> Rule B1 --> Rule C1 | --> Rule B2 --> Rule C2 where Rule A ...

10得票2回答
使用循环中的规则执行Snakemake

我想将Snakemake规则放在一个循环中以便规则可以将前一次迭代的输出作为输入。这个是否可能,如果是,如何实现? 下面是我的示例: 设置测试数据 mkdir -p test echo "SampleA" > test/SampleA.txt echo "SampleB" &g...

14得票1回答
使用snakemake打印简化的DAG图

我有一个长的snakemake工作流程,处理着9个样本,其中有很多并行规则。当我使用以下命令为DAG创建图片:snakemake --forceall --dag | dot -Tpdf > dag.pdf 产生的有向无环图很大而且非常冗余(由于复杂节点放置而难看)。 是否可能生成一个...

8得票1回答
Snakemake希望运行作业,尽管输出文件已经存在。

我有一个工作流,首先从公共数据库下载文件,然后在后续步骤中处理这些文件,创建了几个聚合数据表。 我正在没有互联网连接的机器上测试该工作流。我在另一台机器上运行了预备数据下载步骤,并将它们复制到此机器上,现在我正在尝试运行其余的工作流。当我运行snakemake -np时,它报告所有数据下载作...

8得票1回答
在snakemake中按照规则限制作业数量

在Snakemake中,是否可以限制特定规则运行的作业数量?--jobs可以全局控制允许同时运行的作业数量,但我想限制特定规则的数量。 原因是我有一个特定规则,最多可以并行使用两个作业。然而,如果我将--jobs设置为20,则会导致该规则中的工具崩溃。我在LSF集群中使用Snakemake ...

7得票3回答
awk命令在使用snakemake --use-singularity时失败

我正在尝试将Snakemake与Singularity结合使用,发现在使用Singularity时,简单的awk命令不再起作用。最后一行中的$1被bash替换,而不是被awk用作第一个字段。 这里是一个最小工作示例(Snakefile): singularity: "docker://de...

19得票3回答
如何避免在输入或中间输出文件更新后运行Snakemake规则

即使Snakemake构建的输出文件已经存在,只要我修改了第一个输入或中间输出文件,Snakemake就希望重新运行整个管道。我通过使用-n进行Snakemake干运行来找出这个问题,并得到了以下更新输入文件的报告:Reason: Updated input files: input-data...

8得票2回答
防止snakemake创建输出目录

有没有办法防止snakemake为尚不存在的输出目录创建一个目录? 来自MEME套件的fimo令人讨厌地在运行结束时失败,如果目录已经存在。 我的解决方法是给fimo一个与我在输出中指定的不同的目录,但想知道是否有更直接/优雅的解决方法。 例如: rule generate_s...