MATLAB中的SIFT实现OCR

4

我们的毕业项目是开发一个方便的应用程序,让用户可以用手机拍摄名片,应用OCR技术并以可打印的形式获取所有必要信息。我的问题是SIFT是旋转不变的,即它无法区分"u"和"n"等单词和数字。如果您有任何想法或解决方法,请分享给我们。 :) 谢谢。


SIFT无法区分“u”和“n”的特征是旋转不变性,而不是尺度不变性。尺度不变性意味着它不区分不同大小的物体。您通常可以在使用的任何SIFT实现中关闭旋转不变性。 - user334856
你使用的是哪个 SIFT 实现? - user334856
谢谢您的输入,是的我知道尺度不变性和旋转不变性之间的区别...我在写问题时可能有些混淆了。我们正在使用的SIFT实现最初是为普什图草书设计和编写的...我们已经修改它以适应我们特定的问题。您可以在这里阅读相关信息。 http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5638470 - Azee.
你能更具体地说明如何关闭旋转不变性功能吗?我应该在这里粘贴代码吗? - Azee.
我不知道你正在使用的具体实现细节。代码中应该有一个部分来确定SIFT补丁的主导方向,然后调整所有方向相对于该主导方向。如果没有布尔标志来更改此行为,您可以将主导方向硬编码为0。 - user334856
3个回答

0

SIFT 的确会在处理“u”和“n”等相似字符时遇到困难,但如果您真的想坚持使用 SIFT(您的最终项目现在应该已经完成…),您可以对图像进行一些预处理,如在“u”和“n”下方放置下划线,并让 SIFT 知道带有下划线的“u”是“u”等等。


0

尝试去除图像,然后使用稀释,如果不行就使用神经网络


谢谢您,先生。您能进一步解释一下您的答案吗?我很抱歉我是个新手,非常欢迎您提供任何帮助。 - Azee.

0

是的先生,我们详细地了解情况。哈桑·阿明博士曾经是我们的导师,后来他搬到了拉合尔。我们甚至有普什图语草书版本的源代码,但我们面临的问题的性质有些不同。因此,我们想出了一种独特的方法。 :) - Azee.

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接