我在桌面上使用CUDA开发算法,这些算法之后将在服务器上运行。
使用最近的低端显卡(如计算能力2.1)来获取所有良好的调试和分析功能是否可行,然后将代码放在具有相同计算能力的高端显卡的服务器上?我只需要调整线程/网格大小,还是它会改变所有东西™。
例如:我会在Quadro 600上进行开发,而服务器将使用Tesla C2075。
使用最近的低端显卡(如计算能力2.1)来获取所有良好的调试和分析功能是否可行,然后将代码放在具有相同计算能力的高端显卡的服务器上?我只需要调整线程/网格大小,还是它会改变所有东西™。
例如:我会在Quadro 600上进行开发,而服务器将使用Tesla C2075。