我正在使用Fortran 77编写一些科学代码,现在有一个关于加速的讨论。基本上,我有一个MxN矩阵,我们称之为A。其中M大于N。在代码后面,我需要将转置(A)与一堆向量相乘。我的问题是,是自己转置A并存储它更快,还是当我调用BLAS时,只需给它转置标志即可?谢谢! -Patrick