CUDA虚拟类

6
我想在cuda内核中执行一些虚拟方法,但不是在同一个内核中创建对象,而是在主机上创建对象并将其复制到gpu内存。
我成功地在内核中创建对象并调用虚拟方法。问题出现在复制对象时。这是有道理的,因为虚函数指针显然是伪造的。发生的事情只是"Cuda grid launch failed",至少这是Nsight所说的。但是当查看SASS时,它会在对虚拟函数指针进行解引用时崩溃,这是有道理的。
当然,我正在使用Cuda 4.2,并使用“compute_30”在合适的卡上编译。
那么推荐的方法是什么?或者这个功能根本不受支持?
我想先运行一个不同的内核,它创建虚拟对象并提取虚拟函数指针以“修补”我的对象,然后再复制它们。不幸的是,这不是一个真正有效的解决方案(我还没有弄清楚),而且这将是一个丑陋的解决方案。
P.S. 这实际上是this问题的重新运行,遗憾的是从未得到完全回答。
编辑:

我找到了一种方法来做我想要的事情。但是要明确一点:这并不是答案或解决方案,答案已经被提供了,这只是一个hack,只是为了好玩。

首先让我们看看当调用虚方法时Cuda在做什么,下面是调试SASS:

//R0 is the address of our object
LD.CG R0, [R0];  
IADD R0, R0, 0x4;  
NOP;  
MOV R0, R0;  
LD.CG R0, [R0];
...
IADD R0, RZ, R9;  
MOV R0, R0;  
LDC R0, c[0x2][R0];
...
BRX R0 - 0x5478

假设对于所有内核,"c[0x2][INDEX]"都是常量,那么我们只需运行一个内核并执行以下操作即可获取类的索引,其中obj是该类的新创建对象:
unsigned int index = *(unsigned int*)(*(unsigned int*)obj + 4);

然后使用类似这样的东西:
struct entry
{
    unsigned int vfptr;// := &vfref, thats our value to store in an object
    int dummy;// := 1234, great for debugging
    unsigned int vfref;// := &dummy
    unsigned int index;
    char ClassName[256];//use it as a key for a dict
};

将此存储在主机和设备内存中(内存位置为设备内存),在主机上,您可以使用ClassName作为对象的查找方式进行“修补”。

但是再次强调:出于性能考虑,虚拟函数并不是很好,因此我不会在任何重要的项目中使用它们。


1
这是一个完全重复的问题,但我投票关闭了另一个问题,因为提问者自从他提出问题以来就没有在SO上出现过。如果您正在阅读此内容并可以投票关闭,请投票关闭另一个问题 - harrism
1个回答

6
当前CUDA编译器和运行时(截至CUDA 5.0)不支持您正在尝试的操作。 CUDA C编程指南v5.0的第D.2.6.3节如下所述:当派生类中的函数覆盖基类中的虚函数时,被覆盖和覆盖函数上的执行空间限定符(即__host____device__)必须匹配。不允许将具有虚函数的类的对象作为参数传递给__global__函数。编译器会将虚函数表放置在全局或常量内存中。我建议您将类的数据与其功能分开。例如,将数据存储在结构中。如果您计划对这些对象的数组进行操作,请将数据存储在数组结构中(出于性能考虑 - 超出本问题的范围)。使用cudaMalloc在主机上分配数据结构,然后将数据作为参数传递到内核中,而不是传递具有虚拟方法的类。然后,在设备上构造带有虚拟方法的对象。具有虚拟方法的类的构造函数将采用设备指针内核参数作为参数。虚拟device方法可以在设备数据上运行。相同的方法也适用于在设备上的一个内核中分配数据,在设备上的另一个内核中访问数据(因为具有虚函数的类不能作为内核参数)。

我接受了这个答案,因为编程指南明确说明了它。 我看到你的解决方法有一个问题:从结构体创建设备对象需要在结构体中存储类型信息以及一个大的switch语句,我认为这不是很好。但无论如何,我会尝试一下,谢谢! - hhergeth
1
是的,我假设不同子类之间的数据是相同的,但显然这并不是普遍情况。你能否使用模板而不是虚函数来实现所需的功能?例如策略类?虚函数可能在性能敏感的代码中并不是最佳选择(通常CUDA用于性能敏感的代码)。 - harrism
我之前从未听说过策略模式设计,听起来很聪明。但由于我不知道在编译时我正在处理什么,所以我无法使用它。你对性能方面的看法绝对是正确的,尽管我只是出于娱乐目的而这样做,试图弄清楚它会产生什么影响。 - hhergeth

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接