使用OCR识别“文本大小”和“文本字体”

Question

使用OCR识别“文本大小”和“文本字体”

androidimage-processingocr

3

我需要从图片中识别文本，这是可能的，因为有很多OCR库，但现在我还需要找到文本大小和字体类型。

我已经搜索了很多但没有得到帮助，这是可以实现的，有一个名为"WhatTheFont"的应用程序可以在商店中获取，它可以找到最匹配的字体类型。如何做到这一点？

- outW

1

请查看此帖子。 - Jeru Luke

你需要一个字体大小识别的参考。因此，可以在同一图像中使用已知大小的对象或校准过的成像系统。字体识别可能很容易，也可能非常困难，这取决于字母与理想情况下应该看起来有多相似。 - Piglet

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- nivlac · Accepted Answer

我直接从评论中的链接（http://stackoverflow.com/questions/4601291/ocr-combined-with-font-recognition?rq=1）复制了这个答案，因为问题和答案已经被删除，只能在Google Cache中找到。我对此很感兴趣，所以不想依赖一个损坏的链接 :)

答案由Andrew Cash提供 (https://stackoverflow.com/users/433635/andrew-cash)

这是常见OCR引擎通常做的事情。看看ABBYY FineReader、Omnipage、Cuneiform、Google Tessetact、Expervision等...

这并不像看起来那么容易，因为许多商业OCR引擎仍然会犯傻瓜错误，大多数引擎已经花费了多年时间进行开发。

查找段落边界框的问题是OCR过程的一部分。对于您的情况，段落划分非常简单，但是想象一下报纸或杂志的一页，这项工作变得更加困难。

保留背景的问题同样困难。简单的单色背景很容易去除，但是添加一些更复杂的内容就会很快变得困难。

将所有三个问题结合在同一图像中，它变得更加困难。添加一些线条和框，灰度阴影，半色调，旋转字体，淡化和其他特殊效果，OCR几乎变得不可能。许多OCR引擎在具有清晰定义文本的简单页面上的准确率达到100％，但是当您开始向文档添加更多复杂性时，阅读速度会迅速下降。某些OCR引擎比其他引擎好得多。