12得票1回答
如何在GPU上计算成对距离矩阵

我的代码瓶颈在计算成对距离矩阵的区域。由于这是迄今为止最慢的部分,我已经花费了很多时间来加速我的代码。 我在网络文章中发现了许多加速方法,但增益很小。因此,我正在寻找一种使用GPU来创建距离矩阵的方法,以进一步提高速度。然而,我对使用GPU进行计算知之甚少。有人能帮我吗? 在我的研究中,我...

11得票1回答
在CUDA中增加每个线程的工作量的示例

算法: 我正在使用CUDA编写程序,问题如下: 两个矩阵A(n * 128)和B(m * 128) 我取A的第一行,逐一计算该向量与B的所有行之间的距离。 我将每个距离的结果写入一个矩阵C的行中,因此C(i,j)元素包含A的第i行和B的第j行之间的距离。 然后进行A的下一行。 我是这...

10得票3回答
如何在Spark中计算距离矩阵?

我尝试过对样本进行配对,但由于100个样本会导致9900个样本,这样会消耗大量的内存。在spark分布式环境中,有哪些更有效的计算距离矩阵的方法? 下面是我正在尝试的伪代码片段val input = (sc.textFile("AirPassengers.csv",(numPartition...

7得票1回答
如何创建一个包含每行之间平均绝对分数的距离矩阵?

假设有一个矩阵, df <- read.table(text=" X1 X2 X3 X4 X5 1 2 3 2 1 2 3 4 4 3 3 4 4 6 2 4 5 5 5 4 2 3 3 3 6 5 6 2 8 ...

7得票1回答
优化执行三角矩阵计算的CUDA内核

我正在开发我的第一个Cuda应用程序,目前遇到的最大问题是内核的吞吐量低于预期。 这个内核的任务是计算一个N乘N大小的矩阵(DD),其中包含数据矩阵上所有元素之间的平方距离。数据矩阵(Y)的大小为N乘D(支持多维数据),以行优先方式存储。 来源: __global__ void comp...