OCR算法-区分文本图像和物体图像

Question

OCR算法-区分文本图像和物体图像

4

我正在编写一个程序，从不同网站的标志中提取内容。我正在使用OCR从标志中提取文本，但我想优化程序并仅对具有文本的标志应用OCR，但我不知道如何确定标志是否包含文本？有任何方法吗？

- Jana

也许你可以尝试机器学习。将图像缩小为20x20，使用标记数据训练分类器。图像包含字母1或-1。然后观察样本内误差和样本外误差的表现如何。如果准确率能够达到90%左右，那么就值得使用了。因为预测会非常容易，你只需要一些时间来训练并查看结果。（libsvm是你要开始使用的工具） - Fivesheep

嗨，Fivesheep，感谢您的回复，但您是在谈论存储文本图像的训练图像吗？简单的OCR算法已经使用了这个...但如果我输入一个复杂的图像，比如PayPal或eBay的标志，它会输出随机值，事实上，对于非文本基础的图像，它也会给出一个随机输出，而我不想要这个，我想跳过这个图像...我从http://code.google.com/p/opencms-backoffice/source/browse/?r=125#svn%2Fbranches%2Ftest-ocr%2Fsrc%2Fcom%2Froncemer%2Focr%2Fmain中获取了简单的OCR代码。 - Jana

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Abid Rahman K · Accepted Answer

这是一个关于判断图片是否含有文本的案例，不同于OCR。

迄今为止被认为是最佳的算法是Stroke Width Transform。它是由Ephstein在2010年设计的，隶属于微软公司，不使用任何机器学习的目的。

你可以从Detecting Text in Natural Scenes with Stroke Width Transform这篇论文中获取更多细节。

或者观看一个视频关于此的介绍。

这里有该算法的实现。