需要在PDF文件正文和评论中搜索文本字符串,我已经在Ubuntu 18.04 LTS上安装了Acrobat Reader。它的搜索功能正常工作,但我想知道是否还有其他方法来完成这个任务(pdfgrep?)
对于PDF源代码中的注释字符串,您可以安全地假设它们没有进行编码,并且显示为普通的ASCII或UTF-8文本。
因此以下命令应该有效:
strings my.pdf | grep -i 'searchstring'
%
字符标记。pdftotext -layout my.pdf - | grep -i 'searchstring'
pdfgrep
)。以pdfgrep
为例:pdfgrep -n -i 'searchstring' my.pdf
-n
会打印出包含字符串的页码,-i
则表示搜索时不区分大小写。)