我需要从图片中识别文本,这是可能的,因为有很多OCR库,但现在我还需要找到文本大小和字体类型。
我已经搜索了很多但没有得到帮助,这是可以实现的,有一个名为"WhatTheFont"的应用程序可以在商店中获取,它可以找到最匹配的字体类型。如何做到这一点?
我需要从图片中识别文本,这是可能的,因为有很多OCR库,但现在我还需要找到文本大小和字体类型。
我已经搜索了很多但没有得到帮助,这是可以实现的,有一个名为"WhatTheFont"的应用程序可以在商店中获取,它可以找到最匹配的字体类型。如何做到这一点?
我直接从评论中的链接(http://stackoverflow.com/questions/4601291/ocr-combined-with-font-recognition?rq=1)复制了这个答案,因为问题和答案已经被删除,只能在Google Cache中找到。我对此很感兴趣,所以不想依赖一个损坏的链接 :)
答案由Andrew Cash提供 (https://stackoverflow.com/users/433635/andrew-cash)
这是常见OCR引擎通常做的事情。看看ABBYY FineReader、Omnipage、Cuneiform、Google Tessetact、Expervision等...
这并不像看起来那么容易,因为许多商业OCR引擎仍然会犯傻瓜错误,大多数引擎已经花费了多年时间进行开发。
查找段落边界框的问题是OCR过程的一部分。对于您的情况,段落划分非常简单,但是想象一下报纸或杂志的一页,这项工作变得更加困难。
保留背景的问题同样困难。简单的单色背景很容易去除,但是添加一些更复杂的内容就会很快变得困难。
将所有三个问题结合在同一图像中,它变得更加困难。添加一些线条和框,灰度阴影,半色调,旋转字体,淡化和其他特殊效果,OCR几乎变得不可能。许多OCR引擎在具有清晰定义文本的简单页面上的准确率达到100%,但是当您开始向文档添加更多复杂性时,阅读速度会迅速下降。某些OCR引擎比其他引擎好得多。