文件OCR / 易读性的图像处理/增强算法?

9
我正在寻找与增强传真、手机相机图片以及其他类似来源的可读性和OCR相关的算法、论文或软件。
我主要感兴趣的是简单的增强技术(例如使用ImageMagick可以完成的技术),但我也对更复杂的技术感兴趣。我已经在与供应商交流,所以这个问题上,我主要是寻找算法或开源软件。
进一步澄清一下:我不是在寻找OCR软件或算法;我正在寻找能够清除图像并使其对人眼更易读的算法,并且可能用于OCR。
3个回答

5

当我写一些书籍扫描方面的软件时,也遇到了类似的问题。在互联网上有一个叫做 pagetools 的程序,它使用了一种相当巧妙的数学技巧(称为 Radon 变换)来对扫描的页面进行矫正。

我还编写了一个小例程,用于将页面上的空白处涂成白色;当OCR算法不必处理背景噪声时,会表现得更好。我的方法是查找远离深色像素超过小半径的浅色像素,然后将其提升到纯白色。

不过已经过去几年了,所以我手头没有精确的实现细节。


4

2

是的,我也想知道文章在哪里。 - Don Werve

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接