我首先在cublas中处理了一个矩阵,已经将其发送到设备,并且我想要处理矩阵的一些列向量,仍然使用cublas函数。我尝试使用指针算术运算来偏移从主机到设备的指针,但似乎不起作用。有没有办法可以在不将向量复制回主机的情况下处理矩阵中的向量。
例如:cublasSscal(int n,float alpha,float * x,int incx); 用于缩放向量。我有一个设备指针指向列优先矩阵B,我想缩放B的第三列而不复制向量回主机,怎么做?
例如:cublasSscal(int n,float alpha,float * x,int incx); 用于缩放向量。我有一个设备指针指向列优先矩阵B,我想缩放B的第三列而不复制向量回主机,怎么做?