定位图像中的文本

30

我目前正在一个项目中工作,我的目标是在图像中定位文本。OCR并不是我的意图。我想基本上获得图像内文本的边界。我在使用AForge.Net图像组件进行操作。是否可以提供任何形式的帮助?

更新2/5/09: 我已经在我的项目中采取了另一种路线。但是我尝试过使用MODI(Microsoft Office Document Imaging)获取文本。它允许您对图像进行OCR并轻松提取其中的文本。

4个回答

14

这是一个活跃的研究领域。关于这个主题有大量的学术论文。没有更多的具体信息,提供帮助会很困难。您是否正在寻找特定类型的文本?字体?仅限英语?您是否熟悉学术文献?

"文本检测"是任何OCR(光学字符识别)系统中的标准问题,因此互联网上有许多涉及它的代码片段。

我可以列出谷歌的一堆链接,但建议您只需搜索“文本检测”,然后开始阅读 :) 可以获得丰富的示例代码。


3
识别图像中的文本确实是该领域研究人员关注的热门话题,但只有当captcha成为防止垃圾邮件机器人攻击的“标准”时,这一问题才开始失控。为什么要使用captcha作为保护?因为定位(和读取)图像中的文本非常困难!
我提到captcha的原因是因为在这个小领域内取得了最大的进展*,我认为你的解决方案可能最好在这里找到。尤其是因为captcha确实涉及定位文本(或类似文本的东西)在杂乱的图像中,然后尝试正确地读取字母。
因此,如果您可以找到一个好的开源captcha破解工具,那么您可能已经拥有继续探索的所有内容...您甚至可能可以放弃处理字符识别本身的最困难的代码,因为OCR用于读取扭曲的文本,而您不必这样做。
*:在面向“非研究人员”的可见、可用和实用信息方面取得的进展

提及验证码的另一个原因是这可能是他的“项目”。 :-) - T.E.D.

0

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接