关于Ubuntu上最好的PDF阅读器,有很多问题和答案,但我想解析PDF文件并了解PDF的详细信息,比如在给定的PDF文件中可用的图像、字体和链接。
是否有任何可用的PDF元数据查看器/标签编辑器?
是否有任何可用的PDF元数据查看器/标签编辑器?
查看名为Example.pdf的文件的PDF元数据:
pdfinfo Example.pdf
使用终端中的nano编辑器编辑现有的元数据:
pdftk Example.pdf dump_data output Metadata-output.txt
nano Metadata-output.txt
更新元数据:
pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
Nano编辑器键盘快捷键
使用键盘组合 Ctrl + O,然后按下 Enter 将文件保存到当前位置。
使用键盘组合 Ctrl + X 退出nano。
-a
),并按组进行排序(-G1
):exiftool -a -G1 "$File"
支持的PDF相关标签概览:
您可以在Ubuntu上安装exiftool,方法如下:
sudo apt-get install libimage-exiftool-perl
图形用户界面解决方案
如果你正在寻找一个GUI PDF元数据查看器/编辑器,你可以试试PDFMtEd。这是我为使用exiftool管理PDF元数据而编写的一套图形工具:
sudo apt-get install pdfedit
editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA output $OUTPUT
touch -r ${1} ${OUTPUT}
}
.bashrc
文件中,然后打开一个新的终端,它就可以使用了。sudo apt-get install libimage-exiftool-perl
可以通过以下命令完全删除元数据
exiftool -all:all= 文件名
pdfly
。它在内部使用pypdf
(我是这两个项目的维护者)。
pdfly是一个Python包:
pip install pdfly
pdfly meta your-file.pdf
给出: