我能否使用MPS在NVIDIA Kepler GPU上同时运行非MPI CUDA应用程序?我想这样做是因为我的应用程序无法充分利用GPU,所以我希望它们可以一起运行。是否有代码示例来实现此功能?
在Kepler架构白皮书中,NVIDIA表示每个SMX有32个特殊功能单元(SFUs)和32个加载/存储单元(LD/ST)。 SFU用于“快速逼近的超越函数操作”。不幸的是,我不理解这究竟是什么意思。另一方面,在 专门针对SFU的CUDA双精度三角函数中,它说它们只能在单精度下工作。在K20...