在“CUDA C Programming Guide 5.0”第73页(也可以在这里)中说,“全局内存中变量的任何地址或由驱动程序或运行时API中的内存分配例程返回的变量地址,始终对齐至少256字节”。我不知道这句话的确切含义。是否有人可以举个例子给我看看呢?非常感谢。
一个衍生问题: 那么,如果分配了一个基本元素(如int)或自定义元素的一维数组,该数组的起始地址将是256B的倍数,而数组中每个元素的地址不一定是256B的倍数呢?
一个衍生问题: 那么,如果分配了一个基本元素(如int)或自定义元素的一维数组,该数组的起始地址将是256B的倍数,而数组中每个元素的地址不一定是256B的倍数呢?