我正在创建一个监控文件夹扫描文件的服务。一旦有新文件,该服务会将其转换为可读取的PDF格式。在此过程中,该服务还会查找条形码,并提取其中的文本信息。然后,将带有文本的文件存储到我们软件的数据库中,其位置基于条形码。
现在,我们使用Atalasoft的SDK进行OCR处理(http://www.atalasoft.com/)。该SDK还包括条形码识别器。
但是,转换后的文本仍然存在一些错误。(我已经使用其他OCR程序进行了测试,但Atalasoft效果不错。)我正在寻找一些软件(SDK套件),可以提高PDF文档的质量以便进行OCR处理。
我已经测试了Kofax VRS Elite(http://www.kofax.com/vrs-virtualrescan/)。我正在寻找类似的东西,但可以使用某种SDK套件实施服务。
是否有人曾经做过这样的事情或遇到过类似的问题?谢谢!
现在,我们使用Atalasoft的SDK进行OCR处理(http://www.atalasoft.com/)。该SDK还包括条形码识别器。
但是,转换后的文本仍然存在一些错误。(我已经使用其他OCR程序进行了测试,但Atalasoft效果不错。)我正在寻找一些软件(SDK套件),可以提高PDF文档的质量以便进行OCR处理。
我已经测试了Kofax VRS Elite(http://www.kofax.com/vrs-virtualrescan/)。我正在寻找类似的东西,但可以使用某种SDK套件实施服务。
是否有人曾经做过这样的事情或遇到过类似的问题?谢谢!