做得好。我认为你的期望是正确的,就像np.interp
所展示的那样,会给出0.1
和0.9
的值。
让我们绘制一个金字塔(插值到49:51的像素范围内):
import numpy as np
import cv2
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
prvs = np.zeros((100,80), dtype=np.float32)
prvs[50:51, 50:51] = 1
lin = np.linspace(49,51,200)
grid_x,grid_y = np.meshgrid(lin,lin)
grid_x = grid_x.astype(np.float32)
grid_y = grid_y.astype(np.float32)
prvs_zoommapped = cv2.remap(prvs, grid_x, grid_y, interpolation=cv2.INTER_LINEAR)
fig = plt.figure()
ax = fig.add_subplot(111,projection='3d')
ax.plot_surface(grid_x,grid_y,prvs_zoommapped,cmap='viridis')
plt.show()
![result: pyramid with jagged edges](https://istack.dev59.com/q4czC.webp)
注意到什么不对了吗?使用200x200的绘图网格时,金字塔上有明显的台阶。让我们来看一下结果的横截面:
fig,ax = plt.subplots()
ax.plot(prvs_zoommapped[100,:],'x-')
ax.grid('on')
plt.show()
![result: clearly piecewise-constant function](https://istack.dev59.com/oY3aX.webp)
如您所见,结果是分段常数函数,即输出中存在较大的离散化误差。具体来说,我们在结果中看到了0.03125 == 1/32
的步长。
我的怀疑是 cv2.remap
并不适用于亚像素操作,而是适用于从一个网格到另一个网格的更大规模的映射。另一种可能是出于性能改进而在内部牺牲了精度。无论哪种情况,你并没有发疯:你应该看到0.1
和0.9
作为精确(双)线性插值的结果。
如果您由于其他任务而没有承诺使用openCV,则可以使用各种scipy.interpolate
库进行此映射,即2d插值,特别是用于2d插值的其子库。对于您在规则网格上进行线性插值的特殊情况,scipy.interpolate.RegularGridInterpolator
或类似的东西可能更适合。
甚至更好的是(但我还没有使用过这个子模块):scipy.ndimage.map_coordinates
看起来正是您需要的:
from scipy import ndimage
ndimage.map_coordinates(prvs, [[50.1, 49.1], [50, 50]], order=1)
应用于金字塔的例子:
import numpy as np
import cv2
from scipy import ndimage
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
prvs = np.zeros((100,80), dtype=np.float32)
prvs[50:51, 50:51] = 1
lin = np.linspace(49,51,200)
grid_x,grid_y = np.meshgrid(lin,lin)
prvs_zoommapped = ndimage.map_coordinates(prvs, [grid_x, grid_y], order=1)
fig = plt.figure()
ax = fig.add_subplot(111,projection='3d')
ax.plot_surface(grid_x,grid_y,prvs_zoommapped,cmap='viridis')
plt.show()
![漂亮平滑的金字塔](https://istack.dev59.com/JNA87.webp)
好多了。