C++程序在调用'mkfifo'(Lustre文件系统)时挂起

3

我正在运行C++程序STAR(https://github.com/alexdobin/STAR),这个程序在我的研究领域很常见。

当我在我的服务器上运行此软件时,一切都很顺利。

但是,当我在另一台服务器(FS=lustre)上运行完全相同的软件时,程序会冻结。

我的命令行是:

/path/to/star/STAR-2.7.1a/source/STAR --genomeDir /path/to/reference/ \
        --readFilesIn jeter1.fastq.gz jeter1.fastq.gz \
        --readFilesCommand gunzip -c  --outReadsUnmapped None --outSAMattributes All  |\
        head -n 1000

我使用strace来查看发生了什么:

   (...)

   rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
   --- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=54748, si_uid=24382, si_status=0, si_utime=0, si_stime=0} ---
   getxattr("./_STARtmp//readFilesIn.info", "security.shook_state", 0x7ffd5a10b6c0, 1024) = -1 ENODATA (No data available)
   open("./_STARtmp//readFilesIn.info", O_RDONLY) = 7
   read(7, "-rw-r-----. 1 lindenbp fg0073 10"..., 8191) = 66
   read(7, "", 8191)                       = 0
   close(7)                                = 0
   write(6, "exec > \"./_STARtmp/tmp.fifo.read"..., 82) = 82
   lseek(6, 0, SEEK_SET)                   = 0
   read(6, "exec > \"./_STARtmp/tmp.fifo.read"..., 8191) = 82
   read(6, "", 8191)                       = 0
   write(3, "-rw-r-----. 1 lindenbp fg0073 10"..., 172) = 172
   close(6)                                = 0
   chmod("./_STARtmp//readsCommand_read1", 0700) = 0
   vfork()                                 = 54750
   --- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=54750, si_uid=24382, si_status=0, si_utime=0, si_stime=0} ---
   getxattr("./_STARtmp/tmp.fifo.read1", "security.shook_state", 0x7ffd5a10b6c0, 1024) = -1 ENODATA (No data available)
   open("./_STARtmp/tmp.fifo.read1", O_RDONLY ######### <= FREEZES HERE
   (...)

我认为软件在这里某处卡住了(?):https://github.com/alexdobin/STAR/blob/bb207df0cb62560c9194247a0480182ccbe1dca5/source/Parameters_openReadsFiles.cpp#L38,当软件创建另一个进程使用gunzip -c解压缩输入文件时。

我还尝试使用指定tmp目录为'/tmp'的选项,但是结果却是一样的。

什么可以解释这种行为,有方法可以修复吗?

谢谢


1
如果您解压缩输入文件并且不使用参数“--readFilesCommand gunzip -c”,会导致程序冻结吗? - Vince
1
另外,请问 lustre 文件系统上是否启用了 xattr?详见:https://stackoverflow.com/questions/28084348/whats-the-meaning-no-data-available61-during-getxattr-system-call。 - Vince
@vince 不,如果文件是普通的话就没有问题。至于第二个问题,我会问系统管理员。 - Pierre
1个回答

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接