Python：使用GPU进行双三次插值

Question

Python：使用GPU进行双三次插值

pythoncudascipyinterpolationbicubic

3

在Python中，我使用scipy.ndimage.zoom对图像执行双三次插值，但发现在上采样时速度太慢。我想用一些支持GPU的其他Python库来替换它，但不幸的是我找不到一个可用于Python的库。

NVIDIA提供了一个很好的示例，它完全实现了C/C++中的双三次插值。是否有已知的等效CUDA Python示例/库，我们可以直接使用并替换scipy.ndimage.zoom？

我在网上进行了一些搜索，但无法找到在Python中使用GPU进行双三次插值的方法。因此，我认为没有太多可用的答案，这可能导致主观性的答案和垃圾邮件。

- chesschi

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jcupitt · Accepted Answer

虽然不是GPU（而是尝试利用线程和CPU的矢量单元），但pyvips比scipy快得多，您可以进行测试。

我进行了基准测试：

import sys
import time

import scipy.ndimage
import pyvips

scale = 10
n_loops = 10

start = time.time()
test_image = scipy.ndimage.imread(sys.argv[1])
for i in range(0, n_loops):
    result = scipy.ndimage.interpolation.zoom(test_image, scale)
end = time.time()

print 'scipy took', end - start

start = time.time()
test_image = pyvips.Image.new_from_file(sys.argv[1])
for i in range(0, n_loops):
    result = test_image.resize(scale).write_to_memory()
end = time.time()

print 'pyvips took', end - start

# transform with both libraries to compare results

ndi = scipy.ndimage.imread(sys.argv[1])
result = scipy.ndimage.interpolation.zoom(ndi, scale)
scipy.misc.imsave('ndi.tif', result)

im = pyvips.Image.new_from_file(sys.argv[1], access='sequential')
result = im.resize(scale)
result.write_to_file('pyvips.tif')

默认都是双三次插值。pyvips是一个懒惰库，所以你需要在结尾处使用额外的write_to_memory()来生成内存数组。

在这台四核/八线程的Ubuntu 17.10桌面上，使用所有库的预装版本和一个512x512单色版本的“lena”测试图像，我看到：

$ python zoom.py ~/pics/lena.png 
scipy took 15.6309859753
pyvips took 1.36838102341

一个GPU的升频器显然会更快，但也许pyvips已经足够快了？

如果你比较这两个输出图像，你会发现scipy的那个向上移动了一点点。你可以用一个非常小的输入图像更清楚地看到正在发生的事情，例如这个3x3像素的图像：

当被scipy放大20倍和pyvips变成：

这使我感到困惑。此外，它们明显使用不同的内核，这也很奇怪。