CUDA/PTX 32位与64位的区别

Question

6

CUDA编译器有生成32位或64位PTX的选项。这两者之间有什么区别？它是否像x86一样，NVidia GPU实际上有32位和64位ISA？还是只与主机代码相关？

- zlatanski

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#sixtyfour-bit-compatibility - Sagar Masuti

+Sagar Masuti：我看过这个，但对我的问题没有什么帮助。 - zlatanski

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Robert Crovella · Accepted Answer

指针显然是最明显的区别。 64位机器模型使64位指针成为可能。 64位指针可以实现许多功能，例如比4GB更大的地址空间和统一虚拟寻址。而统一虚拟寻址则可以实现其他功能，例如GPUDirect点对点通信。 CUDA IPC API也依赖于64位机器模型。

x64 ISA与x86 ISA不完全不同，它主要是对其的扩展。熟悉x86 ISA的人会发现x64 ISA很熟悉，在必要时自然地进行了64位扩展。同样，64位机器模型是PTX ISA能力向64位的扩展。大多数PTX指令的工作方式完全相同。

32位机器模型可以处理64位数据类型（如double和long long），因此经常不需要对正确编写的CUDA C/C++源代码进行任何更改以编译为32位机器模型或64位机器模型。如果您直接在PTX中编程，则可能需要考虑指针大小差异。