BLAS性能非常依赖于系统,因此最好在您要使用的机器上自行进行基准测试。由于只有少数BLAS实现,所以比听起来要少(通常是硬件供应商实现、ATLAS和GOTO BLAS)。但请注意,BLAS仅涵盖稠密矩阵,因此对于稀疏矩阵乘法,您将需要Sparse-BLAS或其他代码。在这里,性能不仅取决于硬件,还取决于您想使用的稀疏格式,甚至还取决于您正在处理的矩阵类型(诸如稀疏模式、带宽等)。因此,如果需要最大的性能,则更需要进行自己的基准测试,尤其是在稠密情况下。