我正在为Android构建多个人脸跟踪器,并使用卡尔曼滤波器,显然需要一些算法来区分跟踪的对象。 我目前对匈牙利算法很感兴趣。
我确实了解该算法的工作原理,但无法弄清如何在有坐标的二维空间中构建输入矩阵。 假设我在帧中检测到三个人:
**Person1** on the coordinates [10, 20]
**Person2** on the coordinates [100, 125]
**Person3** on the coordinates [50, 200]
在下一帧中,新坐标上仍然检测到3个人,但现在我想知道在前一张图片中哪一个是Person1,哪一个是Person2等等。
现在我不太确定如何构建矩阵。 列应该是不同的人,如下所示:
+---------+-x1--y1--x2--y2--x3--y3-+
| Person1 | |
| Person2 | |
| Person3 | |
+---------+------------------------+
这些值是当前位置和上一次找到位置之间的距离吗?我知道这听起来很愚蠢,但我感到困惑。
谢谢您的帮助。