云视觉API对7段数码管数字识别效果不佳

8

我试图识别的最简单的例子:

我试图识别的最简单的例子

我使用DOCUMENT_TEXT_DETECTION,但是答案中出现了一些象形文字。

如果我在ImageContext参数中使用Eng来调用addAllLanguageHints方法,则结果中有111个数字。虽然比之前好了一些,但仍然不够理想。

是否有任何方法可以指示识别数字或以某种方式改善结果呢?

此外,在ImageContext中使用setRepeatedField选项是如何使用的?我无法找到任何其使用示例。

提前感谢您的帮助。


同样的问题。我在这里找到了一些预处理代码:https://github.com/arturaugusto/display_ocr但是当使用Google Cloud Vision时,它似乎并没有帮助太多(例如,当您从该存储库中获取“22”的屏幕截图并将其发送到Vision API时,它无法正确识别)。我一直在尝试各种OpenCV预处理技术,但运气不太好。 - kos
1个回答

2
即使它不能直接使用...你需要做的是使用自定义标签对图像进行分类,当默认标签不够用时。在Cloud Auto ML Vision(从那个蓝色下拉菜单中选择Vision)中,您可以训练自定义模型,用于识别该字体。由于带有7段显示器的可能形状相当有限,因此训练它不应该太困难。如果您使用更好的显示器计算器,它也可能效果更好。虽然上面的液晶显示器看起来有点便宜,有那么多的空间和切断的结尾 - 但仍然可以训练它来读取它。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接