MATLAB中的SIFT实现OCR

Question

MATLAB中的SIFT实现OCR

4

我们的毕业项目是开发一个方便的应用程序，让用户可以用手机拍摄名片，应用OCR技术并以可打印的形式获取所有必要信息。我的问题是SIFT是旋转不变的，即它无法区分"u"和"n"等单词和数字。如果您有任何想法或解决方法，请分享给我们。 :) 谢谢。

- Azee.

SIFT无法区分“u”和“n”的特征是旋转不变性，而不是尺度不变性。尺度不变性意味着它不区分不同大小的物体。您通常可以在使用的任何SIFT实现中关闭旋转不变性。 - user334856

你使用的是哪个 SIFT 实现？ - user334856

谢谢您的输入，是的我知道尺度不变性和旋转不变性之间的区别...我在写问题时可能有些混淆了。我们正在使用的SIFT实现最初是为普什图草书设计和编写的...我们已经修改它以适应我们特定的问题。您可以在这里阅读相关信息。 http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5638470 - Azee.

你能更具体地说明如何关闭旋转不变性功能吗？我应该在这里粘贴代码吗？ - Azee.

我不知道你正在使用的具体实现细节。代码中应该有一个部分来确定SIFT补丁的主导方向，然后调整所有方向相对于该主导方向。如果没有布尔标志来更改此行为，您可以将主导方向硬编码为0。 - user334856

3个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Griffin · Answer 1

SIFT 的确会在处理“u”和“n”等相似字符时遇到困难，但如果您真的想坚持使用 SIFT（您的最终项目现在应该已经完成…），您可以对图像进行一些预处理，如在“u”和“n”下方放置下划线，并让 SIFT 知道带有下划线的“u”是“u”等等。

- NightGale · Answer 2

尝试去除图像，然后使用稀释，如果不行就使用神经网络

- Omar Usman · Answer 3

0

你看过以下论文吗？:-)
使用SIFT特征进行草书普什图文字的尺度和旋转不变识别

- Omar Usman

是的先生，我们详细地了解情况。哈桑·阿明博士曾经是我们的导师，后来他搬到了拉合尔。我们甚至有普什图语草书版本的源代码，但我们面临的问题的性质有些不同。因此，我们想出了一种独特的方法。 :) - Azee.