我们的毕业项目是开发一个方便的应用程序,让用户可以用手机拍摄名片,应用OCR技术并以可打印的形式获取所有必要信息。我的问题是SIFT是旋转不变的,即它无法区分"u"和"n"等单词和数字。如果您有任何想法或解决方法,请分享给我们。 :) 谢谢。
我们的毕业项目是开发一个方便的应用程序,让用户可以用手机拍摄名片,应用OCR技术并以可打印的形式获取所有必要信息。我的问题是SIFT是旋转不变的,即它无法区分"u"和"n"等单词和数字。如果您有任何想法或解决方法,请分享给我们。 :) 谢谢。
SIFT 的确会在处理“u”和“n”等相似字符时遇到困难,但如果您真的想坚持使用 SIFT(您的最终项目现在应该已经完成…),您可以对图像进行一些预处理,如在“u”和“n”下方放置下划线,并让 SIFT 知道带有下划线的“u”是“u”等等。
尝试去除图像,然后使用稀释,如果不行就使用神经网络
你看过以下论文吗?:-)
使用SIFT特征进行草书普什图文字的尺度和旋转不变识别