我正在尝试在一个集群上执行MPI和CUDA代码。该代码在单机上运行良好,但在集群上运行时出现错误:
“error while loading shared libraries: libcudart.so.4: cannot open shared object file: No such file or directory”
我检查了我的PATH和LD_PATH,并且看起来没问题。我有一个包含以下条目的.bashrc文件 -
export PATH=$PATH:/usr/local/lib/:/usr/local/lib/openmpi:/usr/local/cuda/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib:/usr/local/ lib/openmpi/:/usr/local/cuda/lib
所有机器都安装了相同版本的CUDA和OpenMPI。
我还在/etc/ld.so.conf中加入了/usr/local/cuda/lib。
能否有人帮助我解决这个问题。这个问题真的很烦人。
谢谢。
“error while loading shared libraries: libcudart.so.4: cannot open shared object file: No such file or directory”
我检查了我的PATH和LD_PATH,并且看起来没问题。我有一个包含以下条目的.bashrc文件 -
export PATH=$PATH:/usr/local/lib/:/usr/local/lib/openmpi:/usr/local/cuda/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib:/usr/local/ lib/openmpi/:/usr/local/cuda/lib
所有机器都安装了相同版本的CUDA和OpenMPI。
我还在/etc/ld.so.conf中加入了/usr/local/cuda/lib。
能否有人帮助我解决这个问题。这个问题真的很烦人。
谢谢。