我的理解:SIFT描述符使用从16x16邻域像素计算出的方向梯度直方图。在大图像中,16x16区域可能是非常小的一个区域,例如猫爪子上1/10的大小,当您将目标图像调整为较小的尺寸时,在同一关键点周围的16x16邻域可以成为图像的大部分,例如猫的爪子。使用SIFT描述符比较原始图像与调整大小后的图像对我来说没有意义,请问有人能告诉我我的理解有什么问题吗?
这是一个简单的描述,但应该让您理解该方法。
SIFT使用的阶段之一是创建图像尺度金字塔。 它将使用低通滤波器缩小并平滑图像。
特征检测器通过查找不仅在图像空间中具有峰值响应,而且在尺度空间中也具有峰值响应来工作。 这意味着它找到了图像中该特征将产生最高响应的比例。
然后,在该尺度上计算描述符。 因此,当您使用较小/较大版本时,它仍应找到特征的相同尺度。