CUDA有很多文档和指南,但我找不到任何形式的指导,告诉我如何诊断编译但出现晦涩、含糊错误消息(例如“未指定启动失败”),除了常规的“这些块/网格结构是否合理?”等等。
我能否以某种方式拦截cubin文件,并对内存结构进行静态分析等操作?请原谅我的新手程度,但我找不到任何明确的、白痴式的指南。
祝大家周末愉快。
我要寻找的内容:
我能否以某种方式拦截cubin文件,并对内存结构进行静态分析等操作?请原谅我的新手程度,但我找不到任何明确的、白痴式的指南。
祝大家周末愉快。
我要寻找的内容:
- 如何分离出cubin中间文件
- 之后该怎么做,以确定发生了什么事情,特别是寄存器和内存配置,以查看我的代码是否违反了任何硬件要求,或者我只是错过了一个偏移一的错误。
========= Error: process didn't terminate successfully
========= Invalid __global__ write of size 4
========= at 0x00000040 in decomp
========= by thread (1,0,0) in block (0,0,0)
========= Address 0x00101024 is out of bounds
=========
========= ERROR SUMMARY: 1 error
我甚至不需要解释那个错误信息...