我发现了很多关于OpenCV的haartraining和级联训练工具的教程。特别是我对使用createsamples工具训练汽车分类器感兴趣,但似乎各处都存在关于-w和-h参数的矛盾说法,让我困惑不解。
我指的是以下命令:
$ createsamples -info samples.dat -vec samples.vec -w 20 -h 20
我有以下三个问题:
我知道正样本的宽高比应该与上面的-w和-h参数得到的宽高比相同。但是所有正样本的-w和-h参数是否都必须是相同的尺寸?例如,我有接近1000张图片,它们在剪裁后是否都必须是相同的尺寸?
如果重要的不是尺寸而是宽高比,那么正样本的宽高比与OpenCV工具中提到的-w和-h参数相比需要多么精确匹配?我的意思是,分类器是否非常敏感,以至于偏差一两个像素就会影响其性能?还是说只要肉眼看起来它们大致相同,就可以使用这些图像?
我已经将几张图片裁剪成相同的尺寸。但是在试图使它们尺寸相同的过程中,有些图像的边界框中包含了更多的背景,而有些图像的边界框略有不同的边距(例如,参见下面的两个图像。更大的汽车占用了更多的图像空间,但是小汽车周围的空白区域更宽)。我只是想知道是否拥有这样的图像集合是可以的,还是说这会降低分类器的准确性,因此我应该确保所有感兴趣的对象(在本例中为汽车)都有更紧密的边界框?