87得票2回答
iOS相机投影反转

我正在尝试估算我的设备在空间中与QR码的位置关系。我正在使用iOS11中引入的ARKit和Vision框架,但是这个问题的答案可能不取决于它们。 使用Vision框架,我能够获取相机帧中包围QR码的矩形。我想将此矩形与设备平移和旋转匹配,以将QR码从标准位置转换。 例如,如果我观察到该帧:...

58得票8回答
将Vision的VNTextObservation转换为字符串

我正在查看苹果的Vision API文档,看到了一些与UIImages中的文本检测相关的类: 1) class VNDetectTextRectanglesRequest 2) class VNTextObservation 看起来它们可以检测字符,但我没有看到任何处理字符的方法。一旦你...

24得票3回答
苹果视觉框架 - 从图像中提取文本

我正在使用iOS 11的Vision框架来检测图像上的文本。 文本已经成功地被检测到了,但我们该如何获得检测到的文本呢?

16得票2回答
使用iPhone TrueDepth传感器来检测真实面孔和照片的区别?

如何使用iPhone的 true-depth 相机捕获的深度数据来区分真实的3D人脸和同一张照片? 要求将其用于身份验证。 我的做法是:创建一个示例应用程序,获取相机前面连续的 AVDepthData 流。

13得票3回答
将VNRectangleObservation点转换到其他坐标系

我需要将收到的 VNRectangleObservation 中的 CGPoints(bottomLeft,bottomRight,topLeft,topRight)转换为另一个坐标系(例如视图在屏幕上的坐标)。 我定义了一个请求: // Rectangle Request l...

11得票3回答
从VNFaceObservation中分类面部

我正在使用Vision框架来检测多张图片上的人脸和物体,效果非常好。 但是我有一个问题,在文档中找不到答案。iOS上的照片应用可以对人脸进行分类,并且您可以点击人脸以显示所有包含该人脸的图片。 我如何像照片应用一样对人脸进行分类?是否有任何唯一标识符或类似的方法可以实现这一点? 谢谢!

10得票3回答
ARKit和Vision框架用于物体识别

我希望能得到一些指引,如何将苹果的新Vision API与ARKit相结合,以实现对象识别。这不需要追踪移动对象,只需要稳定地在三维空间中识别它,使AR体验能够相应地做出反应。 我知道像 Vuforia 或 Wikitude 这样的服务已经提供了此类体验,但我想尝试仅使用本机的苹果API来实现它。

10得票3回答
苹果视觉图像识别技术

和其他开发者一样,我深入研究了苹果的新ARKit技术,发现它很好用。但是为了一个特定的项目,我希望能够识别场景中的(真实)图像,以便在其上投射某些东西(就像Vuforia使用其目标图像一样),或者将其用于触发应用程序中的事件。 在我研究如何实现这一点时,我偶然发现了苹果的Vision和Cor...

9得票1回答
ARKit 和 RealityKit - ARSessionDelegate 保留了14个 ARFrames

我正在使用Vision框架和CoreML在增强现实应用中,通过ARSession代理对每个帧的图像进行分类,在ARKit和RealityKit中。在处理frame.capturedImage时,为了提高性能,我不会请求另一个frame.capturedImage。 相机没有提供流畅的体验,它...

9得票1回答
苹果视觉 - 无法将单个数字识别为区域

我想要使用Vision框架中的VNDetectTextRectanglesRequest,来检测只包含一个字符、数字“9”的图片区域,且背景为白色。我正在使用以下代码实现: private func performTextDetection() { let textRequest ...