我看到一篇文章称,在SSBO中,原子计数缓冲区和原子变量之间的性能没有差异。
这是否适用于现在的nvidia和AMD GPU?我记得Radeon 5870代GPU似乎具有特定的更快支持原子计数器子集的功能?所以我认为这可能曾经是AMD特有的性能优势?
从对nvidia CUDA的了解,我怀疑这对他们从来没有产生过影响?
有人知道从AMD / Nvidia的哪一代GPU开始,原子计数器就不值得使用了吗?
这是否适用于现在的nvidia和AMD GPU?我记得Radeon 5870代GPU似乎具有特定的更快支持原子计数器子集的功能?所以我认为这可能曾经是AMD特有的性能优势?
从对nvidia CUDA的了解,我怀疑这对他们从来没有产生过影响?
有人知道从AMD / Nvidia的哪一代GPU开始,原子计数器就不值得使用了吗?