如何理解人脸检测XML

3

我使用opencv_trainedcascade.exe训练了人脸,为不同阶段创建了一系列的xml文件。每个xml文件都有内部节点和叶子值,其中一个如下所示。

<?xml version="1.0"?>
<opencv_storage>
<stage0>
  <maxWeakCount>3</maxWeakCount>
  <stageThreshold>-1.3019366264343262e+000</stageThreshold>
  <weakClassifiers>
    <_>
      <internalNodes>
        0 -1 2711 -2099201 -2623493 -774797061 -2162625 -827343685
        -5535541 -1163949377 -21761</internalNodes>
      <leafValues>
        -9.2679738998413086e-001 6.0445684194564819e-001</leafValues></_>
    <_>
      <internalNodes>
        0 -1 1533 -252379683 -203697739 1410462197 1435881947 -74449473
        -1147414357 1510080511 -1</internalNodes>
      <leafValues>
        -9.1606438159942627e-001 6.2200444936752319e-001</leafValues></_>
    <_>
      <internalNodes>
        0 -1 917 -42468780 -11479728 -745548289 -2371181 -23070497
        -552607093 -74777633 -536871937</internalNodes>
      <leafValues>
        -9.2716777324676514e-001 5.4092508554458618e-001</leafValues></_></weakClassifiers></stage0>
</opencv_storage>

我的问题是: (1) stageThreshold、internalNodes和leafValues是什么意思? (2) 在实际的人脸检测中,它们如何在级联分类器中使用?我读了一些关于Adaboost算法的论文,但我并不是很理解。 谢谢。


我仍在通过调试“detection_based_tracker.cpp”来弄清楚那些interNodes和leafValues。还需要更深入的挖掘,但大致理解为internalNodes类似于属性。leafValues和threshold是决定是否检测到对象的因素。一旦我完全理解,我将提出解决方案。 - batuman
1个回答

6

经过对 detection_based_tracker.cpp 的研究,我现在明白了 internalNodes、leafValues 和 stagethreshold 分别是什么以及它们是如何被使用的。当我们查看 lbpcascade_frontalface.xml 时,我们会看到一系列矩形框,这些框是训练过的人脸图像所在的区域 (即这些区域具有特定的特征,可以用来区分人脸和非人脸图像)。lbpcascade_frontalface.xml 具有 139 个矩形框,每个矩形框的 x,y 坐标点都乘以一个常数,从而形成额外的三个矩形框,因此实际上一个矩形框代表四个矩形框。

接下来,我将解释什么是 internalNode。

<internalNodes>
            0 -1 13 -163512766 -769593758 -10027009 -262145 -514457854
            -193593353 -524289 -1</internalNodes>

第一个和第二个数字0-1表示左右。我认为它们代表左叶值和右叶值。第三个数字是特征索引。如果我们将这些139个矩形放入数组中,该特征索引就是数组索引。这意味着要表示哪个矩形。最后的八个数字表示四个矩形的角点减法。这些是从积分图像计算出来的,因此这些数字很大。
但我不太确定如何计算叶值,但这些叶值的总和与阶段阈值相比,用于决定面部或非面部。
这就是我从调试代码中理解的内容。 如果有人解释一下如何计算叶值,那将是我的问题的完整解决方案。 谢谢

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接