OCR和图像预处理技术

5

大家好,我有一系列类似于汽车注册牌照照片的图像集合。

我想知道在将图像发送到OCR引擎以确定文本之前该如何预处理图像。

我希望最终能够仅在注册牌照的白色内容上裁剪输入。

实际图像应该看起来像这样:

input

并且最终效果应该是这样的(颜色深度不重要)ouput

感谢任何帮助。 问候, 鲍勃

1个回答

6
  • 对图像进行分割(参考这里)。

  • 使用灰度阈值对分割进行分类(因为您只需要寻找白色)。

  • 通过使用白色分割边界框(或边界框,如果它分解成多个部分)来裁剪图像。这可能不适用于白色汽车 - 但建立一些规则来处理这种情况应该不太困难。

  • 查看tesseract-ocr以提取文本。


我已经在看Tesseract,它的效果非常好..只要图像处理工作正常就行 :) - The HCD
如果你遇到问题,只需问就可以了 :) - Vitor Py
嗨@VitorBraga,我已经使用了图像链接代码的分段功能,但是每当我尝试在OS X终端中使用./segment 0.5 500 20 js.jpeg rs.jpeg命令时,我都会遇到一个名为terminate called throwing an exceptionAbort trap: 6的错误。你能帮我解决这个问题吗?你能告诉我我错在哪里吗?请帮我解决这个问题 :) - The iOSDev
我遇到了几乎相同的问题,可以参考这个问题。我已经尝试了一些解决方法,还有我自己提供并被接受的答案,但是似乎并没有完全解决问题 :( - The iOSDev

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接