OCR算法-区分文本图像和物体图像

4

我正在编写一个程序,从不同网站的标志中提取内容。我正在使用OCR从标志中提取文本,但我想优化程序并仅对具有文本的标志应用OCR,但我不知道如何确定标志是否包含文本? 有任何方法吗?


也许你可以尝试机器学习。将图像缩小为20x20,使用标记数据训练分类器。图像包含字母1或-1。然后观察样本内误差和样本外误差的表现如何。如果准确率能够达到90%左右,那么就值得使用了。因为预测会非常容易,你只需要一些时间来训练并查看结果。(libsvm是你要开始使用的工具) - Fivesheep
嗨,Fivesheep,感谢您的回复,但您是在谈论存储文本图像的训练图像吗?简单的OCR算法已经使用了这个...但如果我输入一个复杂的图像,比如PayPal或eBay的标志,它会输出随机值,事实上,对于非文本基础的图像,它也会给出一个随机输出,而我不想要这个,我想跳过这个图像...我从http://code.google.com/p/opencms-backoffice/source/browse/?r=125#svn%2Fbranches%2Ftest-ocr%2Fsrc%2Fcom%2Froncemer%2Focr%2Fmain中获取了简单的OCR代码。 - Jana
1个回答

3
这是一个关于判断图片是否含有文本的案例,不同于OCR。
迄今为止被认为是最佳的算法是Stroke Width Transform。它是由Ephstein在2010年设计的,隶属于微软公司,不使用任何机器学习的目的。
你可以从Detecting Text in Natural Scenes with Stroke Width Transform这篇论文中获取更多细节。
或者观看一个视频关于此的介绍
这里有该算法的实现

谢谢Abid Rahman K.,我正在处理。代码是C++的,但我正在用Java做,那有Java代码可用吗? - Jana
抱歉,由於我的SOF聲譽不夠高,我無法給你的回答點贊。 - Jana
关于Java代码,我不确定有没有。事实上它是在微软的管辖下,正如你可以在视频中看到的那样,如果你需要真正的代码,你需要进入微软。而且很难找到关于SWT的足够详细的信息,除了极少数的论文。 - Abid Rahman K

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接