在CUDA中将std::vector转换为数组

Question

在CUDA中将std::vector转换为数组

3

有没有一种方法可以将2D向量转换为数组，以便在CUDA内核中使用？

它声明为：

vector<vector<int>> information;

我想使用cudaMalloc并从主机复制到设备，最好的方法是什么？

int *d_information;
cudaMalloc((void**)&d_information, sizeof(int)*size);
cudaMemcpy(d_information, information, sizeof(int)*size, cudaMemcpyHostToDevice);

- BRabbit27

2个回答

2

据我所知，向量的向量不需要驻留在连续的内存中，即它们可以是分散的。

根据您需要传输的内存量，我建议您采取以下两种方法之一：

1. 重新排列内存以成为单个向量，然后使用cudaMemcpy。 2. 创建一系列cudaMemcpyAsync，其中每个复制处理向量的一个单独部分，然后进行同步。

- Henrik

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- talonmies · Accepted Answer

总之，没有这样的功能。CUDA API不支持深拷贝，也不了解std::vector。如果你坚持要将向量嵌套作为主机源，则需要执行以下操作：

int *d_information;
cudaMalloc((void**)&d_information, sizeof(int)*size);

int *dst = d_information;
for (std::vector<std::vector<int> >::iterator it = information.begin() ; it != information.end(); ++it) {
    int *src = &((*it)[0]);
    size_t sz = it->size();
    
    cudaMemcpy(dst, src, sizeof(int)*sz, cudaMemcpyHostToDevice);
    dst += sz;
}

免责声明：此处内容为在浏览器中编写，未编译或测试。使用时自负风险。

这将把主机内存复制到GPU线性内存中的一个分配中，每个向量都需要一次复制。如果向量的向量是“不规则”的数组，则还需要在GPU上存储索引以供使用。