云视觉API对7段数码管数字识别效果不佳

Question

云视觉API对7段数码管数字识别效果不佳

google-vision

8

我试图识别的最简单的例子：

我试图识别的最简单的例子

我使用DOCUMENT_TEXT_DETECTION，但是答案中出现了一些象形文字。

如果我在ImageContext参数中使用Eng来调用addAllLanguageHints方法，则结果中有111个数字。虽然比之前好了一些，但仍然不够理想。

是否有任何方法可以指示识别数字或以某种方式改善结果呢？

此外，在ImageContext中使用setRepeatedField选项是如何使用的？我无法找到任何其使用示例。

提前感谢您的帮助。

- berek

同样的问题。我在这里找到了一些预处理代码：https://github.com/arturaugusto/display_ocr但是当使用Google Cloud Vision时，它似乎并没有帮助太多（例如，当您从该存储库中获取“22”的屏幕截图并将其发送到Vision API时，它无法正确识别）。我一直在尝试各种OpenCV预处理技术，但运气不太好。 - kos

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Martin Zeitler · Accepted Answer

即使它不能直接使用...你需要做的是使用自定义标签对图像进行分类，当默认标签不够用时。在Cloud Auto ML Vision（从那个蓝色下拉菜单中选择Vision）中，您可以训练自定义模型，用于识别该字体。由于带有7段显示器的可能形状相当有限，因此训练它不应该太困难。如果您使用更好的显示器计算器，它也可能效果更好。虽然上面的液晶显示器看起来有点便宜，有那么多的空间和切断的结尾 - 但仍然可以训练它来读取它。