如何使用Firebase ML Kit自定义模型识别数字

7

我的安卓应用需要读取图片中的文字,我使用Firebase ML Kit来实现这个功能。对于罗马字符的文本,它可以正常工作,但是对于下面字体系列中的数字完全无法识别。

enter image description here

尤其是数字0、1和6,Firebase返回的结果分别是O、i、l、L和b。由于在不同的测试中产生了相同数字的替代字母,因此我不能使用正则表达式来将这些字母替换为数字。

我还尝试了Firebase ML Kit云端文本识别(Google Cloud Vision)来获取这些数字,但是仍然存在相同的问题。

所以,我唯一的选择就是Firebase ML Kit自定义模型。我想知道能否使用基于TensorFlowLite模型的ML Kit自定义模型来读取文本。我之所以这样问,是因为我看到的所有安卓ML Kit自定义模型示例都只用于检测对象,没有看到任何使用MLKit自定义模型来读取文本的示例。

基本上,我想要的与Firebase离线/云端文本识别相同的行为,但是使用自定义Tensorflow Lite模型,这是否可能? 请描述。


2
为什么这个问题会被踩?我不知道问题出在哪里,我已经尽可能地用最好的方式来写问题了。是因为语法或缺乏研究努力吗? - AbuMaaiz
1
我认为负评是因为缺乏研究努力。Digital Ocean制作了一个教程,涵盖了你所问的内容。而且在谷歌搜索的第一个结果中,还有更多更多甚至更多的资源可用。 - Arthur Attout
5
楼主明确表示尝试了“ML Kit云文字识别”,但某些数字的结果很差。他正在询问是否有更可靠的解决方案。在我看来这是一个合法的问题。 - Arseny Levin
1
@ParthBhuva,目前还没有办法添加自定义字体,尽管他们计划很快实现它。我目前正在使用正则表达式将字母替换为数字,这几乎可以解决70%的问题。 - AbuMaaiz
1
我认为我在通过邮件联系Firebase支持团队时得到了这些信息,他们说这是他们未来的计划,但没有提供任何预计时间。 - AbuMaaiz
显示剩余4条评论
1个回答

1

目前,使用 ML Kit 无法通过自定义模型识别文本。但是可以使用 TensorFlow 实现。

TensorFlow 示例


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接