HOG人体检测器:为什么会将背景地面物体检测为人?

3
我正在处理一个涉及在各种帧中检测人的项目。检测器能够检测到大多数帧中的人物。
但有时它会将静止的背景对象误认为是人。我真的很想知道为什么会发生这种情况,当前检测器的工作方式如何导致这些假阳性。
还有什么方法可以消除这些假阳性?
以下是假阳性检测的示例:


2
因为没有传感器是完美的。尝试将探测器与不同的技术结合使用,如背景减法、地面平面假设等等... - Micka
1个回答

5
正如this论文的作者在标题中所暗示的那样:“我们离解决行人检测问题还有多远?”,事实上,在现实场景中视觉行人检测问题尚未得到完全解决,有些人甚至认为这个问题永远无法完全解决。
在城市场景中检测人群可能是计算机视觉中最困难的任务之一。场景中充斥着混乱、随机和不可预测的元素,行人可能被遮挡,他们可能隐藏在阴影中或在如此黑暗的环境中,以至于相机无法看到他们。事实上,视觉行人检测仍然是迄今为止最重要的挑战之一。
而且你甚至没有使用最先进的方法,正如下面的图表所示,自从HOG成为这项任务的最佳性能算法以来已经过了很长时间。

enter image description here

(图片取自"行人检测:现有技术的评估",作者为Piotr Dollar、Christian Wojek、Bernt Schiele和Pietro Perona)

那篇论文已经有点过时了,但你可以看到即使最好的算法在图像数据集中也表现不太出色,更别说在真实情况下了。

所以,回答你的问题,要如何提高它的性能?这要看情况。如果你的具体场景中有一些假设可以使这个问题变得简单,那么你可能能够消除一些误报。另一个改善结果的方法是融合不同的传感器信息来帮助视觉系统,这也是每个自动驾驶辅助系统都在做的事情。大多数使用LIDAR和RADAR将摄像头与需要观察的地方联系起来,这有助于算法的性能和速度。

因此,你可以看到这非常依赖应用程序。如果你的应用程序只需要在简单的场景下工作,那么背景减除算法将有助于消除错误检测。你还可以使用错误检测的数据来引导分类器,从而提高其性能。

但要知道一件事:在计算机视觉中没有100%的准确率,无论你尝试多少次。它始终是接受假阳性和系统鲁棒性之间的平衡。

干杯。

编辑:回答标题中的问题,为什么背景物体被检测为人?因为HOG算法是评估图像边缘的算法,你可能会将HOG特征发送到SVM中,对吧?在您提供的图像中检测到的垂直杆与人类具有一些视觉特性,例如其垂直边缘。这就是为什么这些算法在交通标志和其他垂直元素中经常失败的原因,正如您可以在我关于此主题的硕士论文中看到的那样:使用积分通道进行ADAS的视觉行人检测


嗨Pedro,谢谢你的回复。为了解决这个问题,我对所有图像进行了背景减法处理。然后,我将遮罩图像添加到原始图像中,以便用人物的像素替换白色像素。接着,我在这些帧上运行了HOG检测器。但令我惊讶的是,结果非常糟糕。出现了更多错误的正例。检测器出于某种奇怪的原因不停地在黑色背景中检测到人物。可能我会再写一个问题详细说明并附上图片。 - Nik
这是其他问题的链接:(https://dev59.com/Np7ha4cB1Zd3GeqPo80C) - Nik

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接