使用OCR识别“文本大小”和“文本字体”

3

我需要从图片中识别文本,这是可能的,因为有很多OCR库,但现在我还需要找到文本大小和字体类型。

我已经搜索了很多但没有得到帮助,这是可以实现的,有一个名为"WhatTheFont"的应用程序可以在商店中获取,它可以找到最匹配的字体类型。如何做到这一点?


1
请查看此帖子 - Jeru Luke
你需要一个字体大小识别的参考。因此,可以在同一图像中使用已知大小的对象或校准过的成像系统。 字体识别可能很容易,也可能非常困难,这取决于字母与理想情况下应该看起来有多相似。 - Piglet
1个回答

2

我直接从评论中的链接(http://stackoverflow.com/questions/4601291/ocr-combined-with-font-recognition?rq=1)复制了这个答案,因为问题和答案已经被删除,只能在Google Cache中找到。我对此很感兴趣,所以不想依赖一个损坏的链接 :)

答案由Andrew Cash提供 (https://stackoverflow.com/users/433635/andrew-cash)

这是常见OCR引擎通常做的事情。看看ABBYY FineReader、Omnipage、Cuneiform、Google Tessetact、Expervision等...

这并不像看起来那么容易,因为许多商业OCR引擎仍然会犯傻瓜错误,大多数引擎已经花费了多年时间进行开发。

查找段落边界框的问题是OCR过程的一部分。对于您的情况,段落划分非常简单,但是想象一下报纸或杂志的一页,这项工作变得更加困难。

保留背景的问题同样困难。简单的单色背景很容易去除,但是添加一些更复杂的内容就会很快变得困难。

将所有三个问题结合在同一图像中,它变得更加困难。添加一些线条和框,灰度阴影,半色调,旋转字体,淡化和其他特殊效果,OCR几乎变得不可能。许多OCR引擎在具有清晰定义文本的简单页面上的准确率达到100%,但是当您开始向文档添加更多复杂性时,阅读速度会迅速下降。某些OCR引擎比其他引擎好得多。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接