计算机视觉 API 和自定义视觉 API 的区别

17

我对使用微软认知服务还比较新。我想知道 MS 计算机视觉 API 和 MS 自定义视觉 API 之间的区别是什么?

1个回答

25

它们都处理图像上的计算机视觉问题,但希望我能在此处帮助区分它们。 :)

计算机视觉

计算机视觉 API 是微软构建自己的图像模型,可以提供以下几个功能:

  • 图像分类 - 此 API 将为您提供对图像分类的多个标记。它还会给出一个置信度分数,用于展示模型预测该标记的强度。
  • 内容审核 - 该 API 可以判断图像是否符合isAdultisRacy标准,并附有相应的置信度评分。
  • OCR - 该 API 可以识别图像中的文本并将其返回。此 API 还可以处理手写文本而不仅仅是标志上的文本。
  • 人脸识别 - 该 API 将识别图像中的名人或其他知名人物的面部。
  • 地标识别 - 它将识别图像中的地标。

自定义视觉

Custom Vision服务与众不同之处在于,您可以基于Microsoft预建模型训练自己的图像模型。其中一个区别是该服务只能进行图像分类和对象检测。对象检测部分将告诉您图像标签以及其在图像中的位置。目前,该服务的此部分仍处于预览阶段,但我迄今为止看到了良好的结果。

Custom Vision服务的另一个区别在于允许您上传自己的图像。对于图像分类,这意味着您可以上传您的图像,并为每个图像提供一个或多个标签。因此,当您通过模型运行图像时,它将返回它认为的标签以及标签的置信度得分。对于对象检测,您进行相同的处理,但选取图片中想要检测的对象并给出标签。

每次上传和标记新图像后,都需要对模型进行训练。从那里,您可以评估模型的表现如何,为其提供测试图像,甚至使用REST URL或SDK与其交互。

总之,两者之间最大的区别在于Custom Vision服务只能执行图像分类和对象检测,并且可以接受您自己的图像来执行这些操作。而Computer Vision APIs可以做更多,但您无法控制模型的训练方式。

希望这能帮到你! 如果您有任何问题,请随时与我联系。


非常感谢!这真的很有帮助 :) - Ayesha Bibi
我很高兴它能帮到你! :) - Jon
你好,你知道在上传图片的网站上提供的预训练模型有多少个类(对象)吗?它训练了多少个对象,它们是什么?我能否添加更多的类别?我在文档中读到有成千上万个类别。是否有更多关于这些类别的文档资料? - Mohamad Ballout

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接