我为iPad游戏设计了一个学习型AI,但其原型是用matlab编写的。我需要执行以下几个操作:(大写表示矩阵)
A = B > c;
A = B * C;
A = B' * C;
A = B .* C;
A = B - C;
我有一些大型矩阵(2601 x 100)。在GPU上运行这些操作可以显著提高此操作的性能。是否有一个更适合的线性代数库来替换Accelerate的BLAS?因为BLAS仅支持最大4x4矩阵。
我为iPad游戏设计了一个学习型AI,但其原型是用matlab编写的。我需要执行以下几个操作:(大写表示矩阵)
A = B > c;
A = B * C;
A = B' * C;
A = B .* C;
A = B - C;
我有一些大型矩阵(2601 x 100)。在GPU上运行这些操作可以显著提高此操作的性能。是否有一个更适合的线性代数库来替换Accelerate的BLAS?因为BLAS仅支持最大4x4矩阵。