我将尝试通过使用CUDA来优化一些用MATLAB编写的代码。最近我开始了解CUDA编程,但我对其工作原理有一个基本的了解。
假设我想要将两个矩阵相加。在CUDA中,我可以编写一个算法,利用一个线程计算结果矩阵中每个元素的答案。然而,这种技术与MATLAB已经使用的技术可能类似,那么效率是否独立于技术,并且只能归因于硬件水平呢?
假设我想要将两个矩阵相加。在CUDA中,我可以编写一个算法,利用一个线程计算结果矩阵中每个元素的答案。然而,这种技术与MATLAB已经使用的技术可能类似,那么效率是否独立于技术,并且只能归因于硬件水平呢?