我正在制作一台医学成像设备。我想使用CUDA来使设备更快。
我从CCD接收到1024个大小为1d的数据,这样重复了512次。 在我执行IFFT之前, 我必须对每个1024大小的数据应用高性能插值算法(如三次样条插值), 然后是1d插值512次。
是否有任何CUDA库可以执行三次样条插值? (我发现有一个库,但它适用于2或3维图像。 由于我需要执行其他复杂的滤波功能,我需要数据存在全局内存中,而不是纹理内存。)
是否有任何NUFFT(非均匀快速傅里叶变换)库(不需要编写CUDA)? 我认为如果我有NUFFT函数,我就不必分别进行插值和IFFT,可以使设备更快。