14得票1回答
关于NVCC编译器,PTX和CUBIN有什么区别?

我已安装CUDA 4.0,并拥有一个Compute Capability 2.0的设备(一张GTX 460显卡)。 'cubin'文件和'ptx'文件有什么区别? 我认为'cubin'是GPU的本地代码,因此具有特定的微架构,而'ptx'是通过JIT编译在Fermi设备(例如GeForce G...

14得票2回答
CUDA共享库链接:对cudaRegisterLinkedBinary的未定义引用。

目标: 创建一个包含我的CUDA内核的共享库,该库包含一个无需CUDA的封装/头文件。 为共享库创建一个名为test的可执行文件。 问题: 共享库MYLIB.so似乎编译良好(没有问题)。 链接错误: ./libMYLIB.so: undefined reference to ...

13得票4回答
Cuda与Boost结合使用

我正在编写一个CUDA应用程序,希望使用boost::program_options库获取所需的参数和用户输入。 问题在于NVCC无法处理编译boost文件any.hpp,导致出现错误。 1>C:\boost_1_47_0\boost/any.hpp(68): error C3857...

13得票4回答
CUDA虚拟架构与真实架构的区别

尝试理解CUDA虚拟和真实体系结构的区别,以及不同的配置如何影响程序的性能,例如。-gencode arch=compute_20,code=sm_20 -gencode arch=compute_20,code=sm_21 -gencode arch=compute_21,code=sm_2...

13得票1回答
Nvcc版本与CUDA不同。

我已安装了Cuda 7,但当我运行nvcc --version时,它显示的是6.5版本。我想在GTX 960卡上安装Theano库,但它需要nvcc 7.0版本。我尝试重新安装Cuda,但它没有更新nvcc。当我运行apt-get install nvidia-cuda-toolkit时,它只...

12得票1回答
使用CUDA模块构建GPL C程序

我尝试修改一段用C语言编写的GPL程序。我的目标是用CUDA实现替换其中的一个方法,这意味着我需要使用nvcc而不是gcc进行编译。我需要帮助构建项目 - 而不是实现它(您不需要了解CUDA C来提供帮助,我认为)。 这是我第一次尝试更改一个涉及.configure和Makefile的中等复...

11得票3回答
为什么使用cudaMallocManaged时,NVIDIA Pascal GPU在运行CUDA内核时速度较慢

我正在测试新的CUDA 8和Pascal Titan X GPU,期望我的代码能够加速,但由于某些原因,它变得更慢了。我使用的是Ubuntu 16.04。以下是能够重现结果的最小代码:CUDASample.cuhclass CUDASample{ public: void AddOneT...

11得票8回答
Windows下的CUDA编译问题,Cmake错误:找不到CUDA工具集。

我一直在Linux上成功地开发我的CUDA程序,但是我也想支持Windows平台。然而,我一直在努力正确编译它。我使用: Windows 10 Cmake 3.15 Visual Studio 2017 CUDA Toolkit 10.1 当使用旧的弃用Cmake CUDA支持方式 f...

10得票6回答
如何编译PTX代码

我需要修改PTX代码并直接编译它。原因是我想在彼此紧随其后的一些特定指令之后,编写CUDA代码很难得到我的目标PTX代码,所以我需要直接修改ptx代码。 问题是我可以将其编译为(fatbin和cubin),但我不知道如何将这些(.fatbin和.cubin)编译成“X.o”文件。

9得票6回答
nvcc -Xptxas –v编译器标志无效。

我有一个CUDA项目,它由几个包含应用逻辑的.cpp文件和一个包含多个内核加上一个调用它们的__host__函数的.cu文件组成。 现在我想确定我的内核使用的寄存器数量。我的普通编译器调用如下: nvcc -arch compute_20 -link src/kernel.cu obj/....