CLARA 是另一个很好的图形选项。
KOOKA 是 一个KDE应用程序,但工作正常。此外,您还需要安装实际的OCR程序,如GOCR和OCRAD。安装Kooka和OCR程序后,您必须指定Kooka的OCR安装位置,以便它能够将JPEG转换为文本。
Tesseract 是 命令行实用程序,非常简单易用。您可以从这里安装语言包tesseract-ocr-eng。
请查看这个页面。
注意:
要运行tesseract,请打开终端并输入以下内容。
tesseract imagefile.tif outputfile.txt
OPTIONS
部分之后,它列出了很多语言。 - isomorphismestesseract
(在Ubuntu 15.10上为3.04.00版本)对于PNG
输入文件没有任何问题。它可以接受JPG
文件,但是由于额外的压缩伪影,结果会比较差,这是可以预料的。 - Volker Siegel图像文件 %PDF-1.6 无法读取!
。 - Léo Léopold Hertz 준영gocr
,如果能提供一个简短的例子就更好了。不过请不要使用gocr -i test.pdf
这样的命令,因为文件太大了。 - Léo Léopold Hertz 준영kooda
和clara
,没有得到适当的维护。我们真的需要更好的答案! - Léo Léopold Hertz 준영tesseract
的封装。它可以自动将输入的PDF文件转换为一堆TIFF文件,然后使用tesseract对它们进行OCR从而生成可搜索的PDF文件。安装和使用信息可以在这里找到:https://askubuntu.com/questions/473843/how-to-turn-a-pdf-into-a-text-searchable-pdf/1187881#1187881。完成后会删除临时文件。使用非常简单:`pdf2searchablepdf input.pdf`。这将生成input_searchable.pdf文件。源代码在这里:https://github.com/ElectricRCAircraftGuy/PDF2SearchablePDF。 - Gabriel StaplesTesseract (ReadMe, FAQ) (Python)
还可用于:Tesseract .NET, Tesseract iOS
Tesseract是一个OCR引擎,它在1985年至1995年间由HP Labs开发... 现在由Google维护。Tesseract可能是目前最准确的开源OCR引擎。
使用方法:
tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
GOCR是一个开源字符识别工具。它可以将扫描图像转换为文本文件。 GOCR可以与不同的前端配合使用,非常容易移植到不同的操作系统和架构上。 它可以打开多种不同的图像格式,并且其质量每天都在不断提高。
OCRopus™ (FAQ) (使用Python、NumPy和SciPy编写)
OCRopus是一个专注于使用大规模机器学习解决文档分析问题的OCR系统, 具有可插拔的布局分析、可插拔的字符识别、统计自然语言建模和多语言能力。
OCRopus引擎基于两个研究项目:一个在90年代中期由美国人口普查局开发并部署的高性能手写识别器, 以及新颖的高性能布局分析方法。
OCRopus的开发由Google赞助,最初用于高吞吐量、大容量的文档转换工作。 我们预计它也将成为许多其他应用程序的优秀OCR系统。
Tessnet2 (开源、OCR、Tesseract、.NET、DOTNET、C#、VB.NET、C++/CLI)
Tesseract是一个C++开源OCR引擎。Tessnet2是一个.NET程序集, 提供非常简单的OCR方法。Tessnet2采用Apache 2许可证(与tesseract相同), 意味着您可以根据自己的需求使用它,包括商业产品中。
wanghaisheng/awesome-ocr
- 一个有前途的OCR资源精选列表。多页PDF或扫描文档的OCR
这可能是最简单的方法。Gscan2pdf是一个图形化工具,不仅可以扫描文件,还可以导入文件并对其进行OCR。
从这里安装gscan2pdf ,可以通过Ubuntu软件中心或在终端中运行以下命令来安装:
sudo apt-get install gscan2pdf
Gscan2PDF可以使用可自定义的OCR引擎,默认为tesseract-ocr。
您可能需要选择适当的语言。在这种情况下,您需要安装tesseract-ocr-LANG软件包,其中LANG是三位字母ISO 639-2语言代码。目前在16.04版本上有108种语言可用。
eng
作为选项...但是我解决了!:) 在终端中运行sudo apt install tesseract-ocr-eng
就解决了问题。如果这在gimageReader的帮助文件或github上的"README"中有记录就好了...或者其他地方。也许像这里一样。 - DɑvïdLinux智能OCR解决方案
免责声明 - 我与这个开源解决方案的开发密切相关
Lios可以使用扫描仪或相机将印刷品转换为文本。
它还可以从其他来源(如PDF、图像或包含图像的文件夹)中的扫描图像生成文本。
该程序对视力受损者具有完全的可访问性。
由于我与之密切相关,我希望得到反馈意见。
pypdfocr your_document.pdf
your_document_ocr.pdf
文件。该应用程序不会改变图像的质量,只是通过添加覆盖文本略微增加文件大小。sudo apt install tesseract-ocr
pip install pypdfocr
pypdfocr
自2016年起不再受支持,我注意到由于未得到维护而出现了一些问题。可以使用类似的工具ocrmypdf
(module)来完成相似的任务,用法如下:
ocrmypdf in.pdf out.pdf
安装方法:
pip install ocrmypdf
或者
apt install ocrmypdf
sudo apt install ocrmypdf
非常好用。我不认为"不那么直接"的评论还是正确的。 - Lexible-s
、--redo-ocr
等选项)。 - Lexibleruby tesseract-ocr pdftk exactimage
./pdfocf.rb -i source.pdf -o output.pdf
如果需要的话,您可以使用-l LANG
参数。在这种情况下,您需要安装tesseract-ocr-LANG
软件包,其中LANG
是三个字母的ISO 639-2语言代码。目前,在16.04仓库中有108种语言可用。
OCRFeeder已被提及为众多选项之一,但我认为值得提及的是它满足您的要求的原因:
此外,它还具有其他使其成为出色选择的特点:
ocrfeeder
)