99得票9回答
什么是最好、最简单的OCR解决方案?

我想扫描一大堆我四处散落的纸张,尽量避免麻烦。我希望使用Simple Scan将它们转换为图像,然后再使用OCR将其转换为文本。有没有一个带有图形用户界面的好用OCR应用程序,只需按下一个按钮就能给我良好的结果?

48得票5回答
如何从图像中提取文本?

如何从图像中提取文本? 我不是在谈论扫描文件,而是普通的图像,比如你在课堂上拍摄黑板的高清照片,上面写得很好;或者当你拍摄食谱书页时,想要将食谱转换为文本格式。 有没有免费开源软件可以做到这一点? 我尝试了tesseract,但结果很糟糕。

41得票1回答
如何在16.04上安装Tesseract的新语言包?

刚刚安装了gscan2pdf v1.3.9和Tesseract。至于后者,起初它出现在我的已安装软件列表底部,但现在似乎消失了,尽管仍在工作(我想是这样)。 无论如何,我试图将一份扫描文档的PDF转换为可编辑的文本,但该文档不是英文,所以gscan处理得一团糟。 当我进入“工具> OCR>...

37得票9回答
如何使用OCR工具从屏幕区域即时提取文字?

在Ubuntu 12.10中,如果我输入 gnome-screenshot -a | tesseract output 它返回: ** Message: Unable to use GNOME Shell's builtin screenshot interface, resortin...

36得票7回答
如何将PDF转换为可搜索的文本PDF?

我有一些以PDF格式扫描的文件,我想要能够对它们进行搜索。我该如何做到这一点? 基本上,我需要对PDF进行OCR处理,然后将提取出的文本混合到一个新的PDF中。我已经尝试过多种不同的解决方案(包括在Adding OCR info to a PDF中找到的方法),但都没有成功。 1. pdf...

35得票9回答
将OCR信息添加到PDF文件中

我有一份文件的高质量扫描件,该扫描件是以pdf格式保存的。 我想知道如何将OCR信息添加到pdf中,使其具备可搜索性。所谓可搜索性是指当使用evince查看pdf时,按下CTRL-F键实际上可以在pdf内容中进行搜索。

15得票5回答
如何在扫描的 .jpeg 图片中编辑文本?

我需要将一张扫描的图像上传为PDF文档。 在扫描文件后,我得到了一个包含小字体的.jpeg文件,我想在转换为PDF之前对其进行编辑以便上传。 我以前从未做过这个,所以真的不知道该怎么办。请问我应该如何操作?