我正在尝试理解Viola Jones方法,我大部分都已经理解了。
该方法使用简单的Haar特征,将其提升为强分类器并组织成层级/级联,以实现更好的性能(不需要处理明显的“非对象”区域)。
我认为我理解积分图像,并且我理解如何计算特征值。
我唯一无法弄清楚的是算法如何处理人脸大小变化。
据我所知,它们使用24x24子窗口滑过图像,在其中算法通过分类器并尝试弄清楚是否有面部/对象,或者没有。
那么,如果一个人脸是10x10的大小,另一个是100x100的呢?那时会发生什么?
我非常想知道这前两个特征(在级联的第一层中),它们长什么样子(根据Viola&Jones的说法,这两个特征几乎不会错过一个面孔,并且将消除60%的错误面孔)?怎么做到的?
还有,如何构建这些特征以适应图像中不同人脸大小的统计数据?
我是不是漏掉了什么,或者我可能完全搞错了?
如果表述不够清晰,我会尝试更好地解释我的困惑。