如何使用Firebase/ML Kit识别和计数对象

3

我希望能够在图片中识别和计数对象,例如在社区照片中数房子的数量。使用ML Kit,最好的方法是什么?

我需要使用对象检测 API吗?或者是否可能通过简单的图像标签工具获取多个“房子”标签?

1个回答

6
ML Kit物体检测API(请注意,它现在作为独立的SDK提供)可以计算图像/视频流中的对象数量,但仅限于前5个最大的对象。此外,您应该评估物体检测是否适用于您的用例。它是一个非常通用的本地化程序,适用于大多数对象,但当对象靠近/重叠时,它可能无法区分它们。
如果您需要检测超过5个对象,我建议直接使用TensorFlow LiteTF Hub上提供的预训练模型之一,或者使用AutoML Vision Edge自己训练一个,如果通用模型不适合您的用例。
顺便说一句,图像标记会分配描述图像场景的标签。但是,它不会计算对象数量,通常只有一个标签“房子”。

使用MLKit是否可以获取检测到的对象的3D坐标?或者需要像ARCore这样的附加API才能实现? - Erick Adam

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接