我有一个cuda代码,其中实现了几个C2C 2D FFT。它们都使用相同的计划,但由于某种原因,2D FFT的时间很长,并且似乎变化很大。相同数据大小的FFT的时间从0.4秒到1.8秒不等。
这是用于1920x1080 FFT的。这些时间看起来合理吗?
无论如何-我已经通过CUDA 1-D批量FFT获得了良好的经验,速度很快。将1D FFT沿行和列重复执行以给出与此2D FFT相同的结果是否相同?我之前在更大的数据集上体验过1D FFT发生在几百分之一秒内,因此我希望可以修复一些这些结果。
谢谢