BLAS Level 2 带状矩阵-向量乘积多向量

3

BLAS Level 2中存在针对带状矩阵向量乘积的例程,适用于一般和对称情况(MKL实现的链接如下)。

cblas_?gbmv

cblas_?sbmv

在这种情况下,有没有办法使用多个向量(不使用外部for循环),以最大化性能?


当您拥有一个密集的完整矩阵(多于一个向量),就没有办法利用带状结构的速度优势。 - percusse
@percusse,我认为你的说法不成立。也许你误解了我的问题。我想要多个右手边向量,即y=A*x,其中A是稀疏带状矩阵,x是N乘d的矩阵。你可以利用x中的每个向量,因为它们的结果是独立的(y的每一列)。 - fcdimitr
是的,这就是为什么BLAS3没有它们的原因,因为它只是在循环处理y的每一列,因此使用BLAS2函数。BLAS3使用的是RHS的块而不是列。 - percusse
2个回答

1

1

我将您的答案标记为正确,而不是Picaud Vincent的答案,仅因为您提供了有效的替代方案。然而,我确信这应该在BLAS实现中可用。 - fcdimitr

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接