在一些代码中,我们需要对称实矩阵的广义特征值问题(Ax=lamba Bx)获取自动向量和自动值。此代码使用来自LACPACK的DSPGVX。我们想使用MAGMA函数在GPU上加速它。我们在这个论坛上提出了问题,并得到了以下答案:http://icl.cs.utk.edu/magma/docs/zhegvx_8cpp.html。我们的矩阵大小(N)从100到50000甚至更大,与分子中原子的数量有关。我们观察到:
a) 对于大于2500(约)的N,MAGMA根本不起作用;段错误 b) MAGMA始终比LAPACK顺序慢,慢大约10倍
这种行为是否正常?我们能否克服它?是否有人报告过任何类似问题的工作获得了不错的加速效果?谢谢。
a) 对于大于2500(约)的N,MAGMA根本不起作用;段错误 b) MAGMA始终比LAPACK顺序慢,慢大约10倍
这种行为是否正常?我们能否克服它?是否有人报告过任何类似问题的工作获得了不错的加速效果?谢谢。