我目前正在研究手写数字识别问题。我发现许多最先进的算法采用一些预处理方法来处理mnist数据集,比如去斜和抖动(我不知道什么是“抖动”)。我谷歌了很久,但没有找到关于如何去斜mnist数据集的具体方法或算法。有人有解决这个问题的想法吗?非常感谢!
我已经搜索了很长时间,也没有找到相关资料,直到看到了这篇论文:
Teow, Loo-Nin, 和 Kia-Fock Loe. "Robust vision-based features and classification schemes for off-line handwritten digit recognition." Pattern Recognition 35.11 (2002): 2355-2364.
请阅读第4.2节。他们描述了一种去斜图像的方法。我不确定这是否与去歪相同,但这是我能够找到的最接近的内容。
希望这个有所帮助,并希望有人可以确认deslanting是否与deskewing相同。
Deskewing是从LeCun的1998年论文中提取的[http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf]。
Deskewing计算像素的惯性二阶矩(将前景像素视为1,背景像素视为0),并通过水平移动行来剪切图像,使主轴垂直。