10得票3回答
ML Kit Vision 设备端文本识别未下载模型:正在等待文本识别模型下载。请稍候。

我知道有许多类似的问题(这里,这里或这里),但即使我已按照建议的指示操作,仍然遇到了同样的问题。 尽管我的项目配置看起来是正确的,但 Firebase ML Kit 似乎有问题无法下载设备上的文本识别模型,导致出现以下异常: com.google.firebase.ml.common.Fi...

9得票2回答
如何从灰度字节缓冲图像创建位图?

我正在尝试使用新的Android人脸检测移动视觉API获取框架图像以进行处理。 因此,我创建了自定义检测器来获取框架并尝试调用getBitmap()方法,但它为null,因此我访问了框架的灰度数据。是否有一种方法可以从中创建位图或类似的图像持有者类? public class Custom...

9得票2回答
谷歌PDF视觉识别。

我需要将PDF文件发送到Google Vision以提取并返回文本。根据文档,我了解到PDF文件必须位于Google存储中,因此我会像这样将文件放入我的Google存储桶中: require '../vendor/autoload.php'; use Google\Cloud\Storag...

8得票2回答
谷歌.api_core.exceptions.ServiceUnavailable: 503 从插件获取元数据失败,错误为:'str'对象没有属性'before_request'。

我正在尝试遍历目录中的图像,并通过google_api_vision获取它们的标签。以下是我的代码: def run_quickstart(): import io import os import cv2 import numpy as np fro...

8得票1回答
使用Tesseract进行蛋标记识别的图像预处理

目标是创建一个可以识别蛋印记的应用程序,例如0-DE-134461。我尝试了Tesseract和Google Vision API OCR引擎对以下图像进行识别。两种OCR引擎的结果都很糟糕。 0-DE-46042 Tesseract → "" Google Vision API →...

8得票3回答
使用Java客户端库批量注释Google Vision图像

在使用提供的Google Vision Java客户端对图像进行注释时,我遇到了异常。 具体地说,是在批处理客户端batchAnnotateImages处理以下代码时出错: public void processOCR(byte[] file) { List<Annota...

8得票1回答
云视觉API对7段数码管数字识别效果不佳

我试图识别的最简单的例子: 我使用DOCUMENT_TEXT_DETECTION,但是答案中出现了一些象形文字。 如果我在ImageContext参数中使用Eng来调用addAllLanguageHints方法,则结果中有111个数字。虽然比之前好了一些,但仍然不够理想。 是否有任何...

7得票1回答
在谷歌视觉文字检测API中,何处使用语言提示?

我知道Google Vision API支持多种语言的文本检测。通过以下代码,我可以从图像中检测出英语语言。但是根据Google的说法,我可以使用语言提示参数来检测其他语言。那么我应该在以下代码中的哪里放置此参数呢? def detect_text(path): """Detects...

7得票2回答
如何使用新的Google Vision API生成条形码并将其转换为位图?

如何使用新的Google Vision API生成条形码并将其转换为位图? Barcode barcode = new Barcode(); Barcode.Email email = new Barcode.Email(); email.address = "my_email@gmail....

7得票1回答
安卓人脸检测 - Vision API 或 Camera API

我需要一种简单的方法在我的相机应用中检测人脸。我只关心回调功能,告诉我在某个特定位置或者坐标上检测到了人脸。我注意到似乎有几个人脸检测API - 在Google Play服务中以及遗留API和Camera2 API中。针对上述简单需求,我应该使用哪一个API?