有人给了我一个充满惊人信息的宝库,里面有200MB的.tiff扫描公告图片,可以追溯到40年代。我想将其数字化,但是我对OCR一无所知。早期的一些材料甚至对人类来说都难以阅读,更别说机器了。而且它是用希伯来语写的。
我正在寻求如何处理这个问题的建议。关于书籍、文章、代码库或软件的好建议(所有这些都应该在网上免费提供)。我熟练掌握C++和Python,并且如果需要的话可以学习另一种语言。
谢谢。
我正在寻求如何处理这个问题的建议。关于书籍、文章、代码库或软件的好建议(所有这些都应该在网上免费提供)。我熟练掌握C++和Python,并且如果需要的话可以学习另一种语言。
谢谢。