我正在与一个想要加速Matlab代码的人合作。他们目前尝试将所有代码转换为CUDA,以使其在CPU上运行。我认为使用Matlab的并行计算工具箱来加速这一过程并在拥有Matlab分布式计算工具箱的集群上运行,可以提高速度,让我能够在多个不同的工作节点上运行。现在,在并行计算工具箱的一部分中,你可以使用类似于GPUArray等工具。但是,我对此如何工作感到困惑。使用像parfor(并行化)和gpuarray(gpu编程)这样的东西是否兼容?我可以同时使用两者吗?在分割到不同的工作节点(并行化)的同时,还可以利用每个工作节点上可用的GPU吗?
他们认为仍然值得探索将所有Matlab代码转换为CUDA代码并在多个GPU机器上运行所需的时间,但我认为正确的方法是使用已经内置在Matlab中的功能。
非常感谢您提供任何帮助、建议或指导!
谢谢!
他们认为仍然值得探索将所有Matlab代码转换为CUDA代码并在多个GPU机器上运行所需的时间,但我认为正确的方法是使用已经内置在Matlab中的功能。
非常感谢您提供任何帮助、建议或指导!
谢谢!