如何使用Firebase/ML Kit识别和计数对象

Question

3

我希望能够在图片中识别和计数对象，例如在社区照片中数房子的数量。使用ML Kit，最好的方法是什么？

我需要使用对象检测 API吗？或者是否可能通过简单的图像标签工具获取多个“房子”标签？

- rgisi

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Chrisito · Accepted Answer

ML Kit物体检测API（请注意，它现在作为独立的SDK提供）可以计算图像/视频流中的对象数量，但仅限于前5个最大的对象。此外，您应该评估物体检测是否适用于您的用例。它是一个非常通用的本地化程序，适用于大多数对象，但当对象靠近/重叠时，它可能无法区分它们。

如果您需要检测超过5个对象，我建议直接使用TensorFlow Lite和TF Hub上提供的预训练模型之一，或者使用AutoML Vision Edge自己训练一个，如果通用模型不适合您的用例。

顺便说一句，图像标记会分配描述图像场景的标签。但是，它不会计算对象数量，通常只有一个标签“房子”。