我有一组视频,是一个人在说话。我正在开发一个唇语识别系统,因此需要对图像的特定区域(下巴和嘴唇)进行一些图像处理。
我有超过200个视频,每个视频包含一个句子。由于自然对话,头部不断移动,因此嘴唇不在固定位置。我很难指定图像中感兴趣的区域,必须观看每个视频,并标记出我的框大小以确保唇部被裁剪在ROI内,这非常繁琐。
我想知道是否有更简单的方法来检查这个问题,也许可以使用MATLAB?我在考虑逐帧裁剪视频并为每一帧输出一幅图像。然后手动查看图片,以确定唇部是否超出了画面范围。
我有超过200个视频,每个视频包含一个句子。由于自然对话,头部不断移动,因此嘴唇不在固定位置。我很难指定图像中感兴趣的区域,必须观看每个视频,并标记出我的框大小以确保唇部被裁剪在ROI内,这非常繁琐。
我想知道是否有更简单的方法来检查这个问题,也许可以使用MATLAB?我在考虑逐帧裁剪视频并为每一帧输出一幅图像。然后手动查看图片,以确定唇部是否超出了画面范围。