图像特征提取前的平滑处理

Question

3

我正在使用vl_phow函数(http://www.vlfeat.org/matlab/vl_phow.html)，想知道特征提取前为什么要应用平滑处理。

具体来说，在vl_phow的文档中提到：图像通过标准差为SIZE / MAGNIF的高斯核进行平滑处理。请注意，在标准SIFT描述符中，放大值是3；而在这里，默认值为6，因为在应用中似乎表现更好。 那么为什么要进行这种平滑操作呢？

同样在这份文档中，有一个名为WindowSize的选项，解释如下：高斯窗口的大小，以空间单元为单位。 这个窗口是用来对图像进行平滑处理还是用于其他目的？

能否请您告诉我为什么要这么做以及在特征提取之前平滑处理图像的优点。

- burak akdemir

3个回答

0

为了消除图像中的噪声，特征点（传统上是强度角点）可能会受到噪声的很大影响。

- John Wiggles

0

没有一台相机是不带噪声的。除非你有一个人工图像，否则你的图像中总会有噪声。

这种噪声有许多来源，随时间、温度甚至位置而变化。

你会发现，在几乎任何图像处理操作中，应用低通滤波器（如高斯模糊）到输入图像或对多个拍摄进行平均处理是第一步。

如果没有这个步骤，几乎不可能从同一未更改场景的两个图像中获得相同的结果。

有关噪声来源和去噪方法的快速概述，请阅读： http://www.ijaiem.org/volume2issue11/IJAIEM-2013-11-24-070.pdf

- Piglet

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ander Biguri · Accepted Answer

虽然这更像是一个数学问题而不是Matlab问题，但我还是会尝试回答。

SIFT特征应该是在图像中“突出”的点。它们是具有高信息量并且在不同的图像中具有“不变性”的特征。

然而，嘈杂的图像可能会有看起来像重要内容的“噪声”。以下是一个简单的例子：

没有平滑处理，人们可能会认为有两个区域拥有大量的信息，一个是2的区域，另一个是只有一个1的区域。但是，虽然2的区域看起来像是信息的一部分，因为它们聚集在一起很多，但只有一个1的部分可能只是噪声，是由于成像技术中的噪声添加了一个小的随机值。

如果您使用滤波器对图像进行平滑处理，您将得到类似以下的结果（虚构的例子）。

[0 0    0 0   0
 0 0    0 1.9 2
 0 0.01 0 1.9 2
 0 0    0  0  0]

在这里，1只是噪音，而2则更加明显。

因此，特征提取算法（例如SIFT）通常在获取关键点之前对图像进行平滑处理。

平滑窗口越大，你将发现越多的鲁棒性关键点，因为较小的物体将被移除。但是，如果过于大，则会有删除真实信息（例如例子中的2）的风险。