我在一个目录中有很多JPEG文件,我想将它们转换为PDF并将它们合并在一起成为一个单一的文档。
如何完成这个任务呢?
我希望使用命令行来进行操作,因为这样的处理速度会更快。
如何完成这个任务呢?
我希望使用命令行来进行操作,因为这样的处理速度会更快。
convert *.jpg -auto-orient pictures.pdf
-auto-orient
会读取图像的EXIF数据来旋转图像。sudo apt-get install imagemagick
for f in *.jpg; do convert "$f" "$f.pdf"; done; pdftk *.pdf cat output final.pdf
。 - Elder GeekGrphicMagick
用户应该运行gm convert *.jpg pictures.pdf
- michaelbnconvert
在将图像“打包”到PDF之前会改变图像质量。因此,为了最小化质量损失,最好将原始的jpg
(或.png
)放入PDF中。要做到这一点,您需要按照以下步骤使用img2pdf
:img2pdf
的更简短的一行解决方案如下:
制作PDF
img2pdf *.jp* --output combined.pdf
(可选) 对输出的PDF进行OCR识别
ocrmypdf combined.pdf combined_ocr.pdf
这个命令是将每个jpg
图像转换为pdf
文件,而不会损失分辨率或质量:
ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
这个命令将把pdf
页面合并成一个文档:
pdftk *.pdf cat output combined.pdf
最后,我添加了一个OCR文本层,它不会改变pdf中扫描的质量,以便可以进行搜索:
pypdfocr combined.pdf
或者,作为使用pypdfocr
的替代方案:
ocrmypdf combined.pdf combined_ocr.pdf
img2pdf
支持同时输入多个JPEG文件。请参考其手册中的示例。 - Yai0Phahtesseract-ocr-
包来支持您所使用的语言的OCR。 - jarnoocrmypdf
的无损性,请使用以下命令:ocrmypdf --optimize 0 --output-type pdf combined.pdf combined_ocr.pdf
。 - aksh1618convert `ls -1v` file.pdf
+compress
选项会关闭压缩,导致生成的PDF文件很大!):convert page1.jpg page2.jpg +compress file.pdf
convert -rotate 90 page\*.jpg +compress file.pdf
+compress
帮助它避免了卡住的情况。
注意:+compress选项关闭了压缩功能。当时我使用的机器似乎无限卡住了(虽然我没有等到永远来找出真相)。如果你在压缩过程中遇到慢速或卡住的问题,可能需要仔细阅读imagemagick.org option -compress并尝试使用-compress<type>来找到适合你的解决方案。请自行参考文档以获得更多信息。convert
命令中的 +compress
选项!它实际上会禁用所有压缩,导致生成的 PDF 文件比原始 JPEG 文件大 10 倍。只需不指定压缩选项,convert
就会使用输入文件的压缩格式(JPEG),这在文件大小方面是最佳选项。来源:http://www.imagemagick.org/script/command-line-options.php#compress - user335432$ converet *.jpg file.pdf
在文件大小较小的情况下比使用+compress
参数效果更好。 - doctoratepdfjam --a4paper *.jpg
我会为您创建一个A4格式的PDF文件,适用于所有的.jpg文件,通常以-pdfjam.pdf结尾。如果要强制指定输出名称,您可以使用--outfile <您的输出>选项!
据我所见,该命令没有对文件进行重新编码,与convert相比非常快速。
安装pdfjam,我不确定最有效的方式是什么(它会随LaTeX自动安装),但您可以尝试:
sudo apt install pdfjam
sudo apt install texlive-extra-utils
pdfjam: 失败。调用 /usr/bin/pdflatex 时出现错误
。 - mishadrconvert
,但更加复杂,因为:
pdfimages -j file.pdf img
重新提取原始图像。)目前,这仅适用于PNG格式 - 请参阅@dma_k的评论。操作说明:
使用我的脚本从this answer将每个图像转换为自己的一页PDF文件,页面大小为A4,并且周围有5%的边框。convert some.jpg -format pdf -compress jpeg generated.pdf ; pdfimages -j generated.pdf generated.pdf ; diff -sq some.jpg generated.pdf-000.jpg
。 - Stéphane Gourichonls *.jpg | xargs -I% img2pdf -o %.pdf %
pdfunite *.pdf output.pdf && rm *.jpg.pdf
jpegoptim --overwrite --size=1000k *.jp*
。 - Antonio
pdfcpu
,它是用go
语言编写的,所以是一个单一的二进制文件,并且具有简单的命令行界面。 - SinaMobasheri