我有一个M*N的整数矩阵,需要遍历并计算每个元素M[i][j]的值:
The integer which appears most often in the submatrix from (i-k,j-k) to (i+k, j+k).
因此,结果是一个矩阵,每个单元格都是原始矩阵中[i,j]周围的优势数字。该矩阵可能非常大,并且我需要在紧密循环中执行此操作,因此我想通过并行计算来最小化操作时间。我知道GPU擅长矩阵乘法,但似乎这不能简化为简单的矩阵乘法。(或者可以吗?)是否可以在GPU上同时计算每个单元格?如果可以,我想在iOS中实现这一点,应该使用哪种编程接口,Metal?OpenGL?
accelerate
和Metal
有什么区别?它们之间是否有基于另一个的关系,哪个更高级、更易于使用? - NeoWang