我目前正在开发OCR软件,我的想法是使用模板来识别发票内部的数据。
然而,扫描的发票可能存在一些问题:
- 并非所有基于单个模板的发票都正确对齐在扫描仪下面。
- 人们可以在发票上写字。
- 等等。
发票示例:(必须通过Google搜索,很遗憾无法添加更具体的版本,因为客户数据显然是机密的)
我根据文本的x值在发票中找到我的数据。
但是,在我能够使用检索到的所有数据进行任何实际计算之前,我需要知道发票的比例和左/右的偏移量。
我到目前为止尝试了什么?
1)使图像单色,并使用第一个黑色像素出现的左右边界。由于人们可以在发票上写字,此方法失败了。
2)将发票划分为垂直部分,使用黑色像素最多的部分。由于分布在类似模板之间并不总是均匀的,所以此方法失败了。
我真的需要您的帮助,关于(1)如何识别发票中的重要点,以及(2)我应该关注哪些重要点。
希望问题已经足够清楚,因为很难解释。