得票数最多 'apple-vision' 问题

关联标签

87得票2回答

我正在尝试估算我的设备在空间中与QR码的位置关系。我正在使用iOS11中引入的ARKit和Vision框架，但是这个问题的答案可能不取决于它们。使用Vision框架，我能够获取相机帧中包围QR码的矩形。我想将此矩形与设备平移和旋转匹配，以将QR码从标准位置转换。例如，如果我观察到该帧：...

58得票8回答

我正在查看苹果的Vision API文档，看到了一些与UIImages中的文本检测相关的类： 1) class VNDetectTextRectanglesRequest 2) class VNTextObservation 看起来它们可以检测字符，但我没有看到任何处理字符的方法。一旦你...

24得票3回答

我正在使用iOS 11的Vision框架来检测图像上的文本。文本已经成功地被检测到了，但我们该如何获得检测到的文本呢？

16得票2回答

如何使用iPhone的 true-depth 相机捕获的深度数据来区分真实的3D人脸和同一张照片？要求将其用于身份验证。我的做法是：创建一个示例应用程序，获取相机前面连续的 AVDepthData 流。

13得票3回答

我需要将收到的 VNRectangleObservation 中的 CGPoints（bottomLeft，bottomRight，topLeft，topRight）转换为另一个坐标系（例如视图在屏幕上的坐标）。我定义了一个请求： // Rectangle Request l...

11得票3回答

我正在使用Vision框架来检测多张图片上的人脸和物体，效果非常好。但是我有一个问题，在文档中找不到答案。iOS上的照片应用可以对人脸进行分类，并且您可以点击人脸以显示所有包含该人脸的图片。我如何像照片应用一样对人脸进行分类？是否有任何唯一标识符或类似的方法可以实现这一点？谢谢！

10得票3回答

我希望能得到一些指引，如何将苹果的新Vision API与ARKit相结合，以实现对象识别。这不需要追踪移动对象，只需要稳定地在三维空间中识别它，使AR体验能够相应地做出反应。我知道像 Vuforia 或 Wikitude 这样的服务已经提供了此类体验，但我想尝试仅使用本机的苹果API来实现它。

10得票3回答

和其他开发者一样，我深入研究了苹果的新ARKit技术，发现它很好用。但是为了一个特定的项目，我希望能够识别场景中的（真实）图像，以便在其上投射某些东西（就像Vuforia使用其目标图像一样），或者将其用于触发应用程序中的事件。在我研究如何实现这一点时，我偶然发现了苹果的Vision和Cor...

9得票1回答

我正在使用Vision框架和CoreML在增强现实应用中，通过ARSession代理对每个帧的图像进行分类，在ARKit和RealityKit中。在处理frame.capturedImage时，为了提高性能，我不会请求另一个frame.capturedImage。相机没有提供流畅的体验，它...

9得票1回答

我想要使用Vision框架中的VNDetectTextRectanglesRequest，来检测只包含一个字符、数字“9”的图片区域，且背景为白色。我正在使用以下代码实现： private func performTextDetection() { let textRequest ...