我最近想使用简单的CUDA矩阵-向量乘法。我在cublas库中找到了一个合适的函数:cublas<<>>gbmv。这里是官方文档。
但实际上,它非常不友好,所以我没能理解
但实际上,它非常不友好,所以我没能理解
kl
和ku
参数的含义。此外,我也不知道stride
是什么(必须提供)。这些参数有一个简要的解释(第37页),但看起来我需要知道其他东西。
在互联网上搜索并没有提供大量关于这个问题的有用信息,大多数是对不同版本文档的引用。
所以我有几个问题要问GPU/CUDA/cublas专家:
- 如何找到更易理解的有关使用cublas的文档或指南?
- 如果您知道如何使用此函数,能否向我解释一下如何使用它?
- 也许cublas库有些特别,每个人都使用一些更流行、文档更好等等的东西?
非常感谢。