我有一个CUDA项目,它由几个包含应用逻辑的.cpp文件和一个包含多个内核加上一个调用它们的__host__函数的.cu文件组成。
现在我想确定我的内核使用的寄存器数量。我的普通编译器调用如下:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
将"-Xptxas –v"编译器标志添加到此调用中不幸没有效果。编译器仍然产生与之前相同的文本输出。编译后的.exe也以与之前相同的方式工作,只有一个例外:我的帧速率从80fps跳到1800fps。
现在我想确定我的内核使用的寄存器数量。我的普通编译器调用如下:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
将"-Xptxas –v"编译器标志添加到此调用中不幸没有效果。编译器仍然产生与之前相同的文本输出。编译后的.exe也以与之前相同的方式工作,只有一个例外:我的帧速率从80fps跳到1800fps。