在一些PDF查看器/编辑器(如Acrobat、Evince等)中是否有工具,可以导航并查看PDF文档中任何选定点的坐标(即(x,y))?
在一些PDF查看器/编辑器(如Acrobat、Evince等)中是否有工具,可以导航并查看PDF文档中任何选定点的坐标(即(x,y))?
Apache PDFBox PDFDebugger 2.0.*会在状态栏中显示PDF坐标。在此处获取: https://pdfbox.apache.org/download.cgi
在上述链接的命令行工具下载pdfbox-app-2.0.*.jar,然后使用所需文件运行以下命令。
java -jar pdfbox-app-2.0.*.jar PDFDebugger "InputFile"
当你将鼠标悬停在pdf页面上时,你可以看到坐标。你可以从左侧选择特定的页面,相应的页面将显示在右侧。请注意,pdf显示的坐标是从页面的左下角开始的,因此如果您想使用这些坐标提取一些文本,您需要从总高度中减去y轴,然后使用它。在下面的示例中,您将需要使用x:47 y:(792-522)=270。
3.0.0版本有一些额外的功能,与这个问题无关: https://repository.apache.org/content/groups/snapshots/org/apache/pdfbox/pdfbox-debugger/3.0.0-SNAPSHOT/我发现Gimp非常适合这个需求!它甚至有不同的度量单位,因此这是我的选择。
还有一款老牌的GhostView (gv)可以显示坐标。
CanOpener是一款非常强大的PDF文件处理工具。它作为Acrobat Pro插件运行 - http://www.windjack.com/product/pdfcanopener/
另一个选择是使用Foxit Phantom PDF高级编辑器,它允许您选择对象并查看每个对象的属性。
你可以使用Quick PDF Library等库将图像呈现为BMP文件,然后编写一个小工具来滚动和缩放BMP文件,并返回每个坐标位置。http://www.quickpdflibrary.com(注意:我为Quick PDF提供咨询服务)
我相信您可以将PDF加载到Adobe Illustrator中,并在状态栏中获得当前坐标。
安德鲁
我使用InkScape v0.91来绘制PDF矩形以提取文本。它可以将PDF加载到画布中。请注意,打开文档属性后记得将测量单位更改为英寸(Ctrl-Shift-D)。对于页面属性选项卡,请将默认单位设置为英寸,对于网格属性选项卡,请将网格单位设置为英寸。
此页面PDF坐标系解释了PDF坐标系及其度量单位。
我正在寻找一个工具来获取坐标,以便使用PDFBox库中提供的提取选项。 Gimp的方法对我的目的非常有效。 我在Gimp中打开了PDF,并将测量单位设置为点。
<xfdf xmlns="http://ns.adobe.com/xfdf/" xml:space="preserve">
<annots>
<square style="solid" width="4" color="#000000" opacity="1" creationdate="D:20190624111403Z" flags="print" date="D:20190624111403Z" page="0" rect="0,0,135,390.6" subject="ROI" title="ROI" />
</annots>
<pdf-info version="2" xmlns="http://www.pdftron.com/pdfinfo" />
</xfdf>
将“rect”属性的坐标更改为新的坐标,并将文件另存为xfdf格式。然后,在Adobe Reader中打开xfdf文件时,读者会询问PDF文件的位置。定位PDF文档,您将看到矩形绘制在指定的坐标上。
有一个比 Gimp 更轻的 ImageMagick,并且可以在鼠标指针上给出坐标。