我正在尝试提取PDF中的图片,并获取图像的BBox坐标。
我尝试使用pdfrw库,它可以识别图像对象,并具有名为media box的属性,其中包含一些坐标。但是,对于某些PDF文件,它显示了类似于['0','0','684','864']的内容,但是图像并不从页面的开头开始,因此我不认为这是BBox坐标。
我尝试使用以下代码来使用pdfrw:
我尝试使用pdfrw库,它可以识别图像对象,并具有名为media box的属性,其中包含一些坐标。但是,对于某些PDF文件,它显示了类似于['0','0','684','864']的内容,但是图像并不从页面的开头开始,因此我不认为这是BBox坐标。
我尝试使用以下代码来使用pdfrw:
import pdfrw, os
from pdfrw import PdfReader, PdfWriter
from pdfrw.findobjs import page_per_xobj
outfn = 'extract.' + os.path.basename(path)
pages = list(page_per_xobj(PdfReader(path).pages, margin=0.5*72))
writer = PdfWriter(outfn)
writer.addpages(pages)
writer.write()
如何获取图像及其边界框坐标?
示例PDF:https://drive.google.com/open?id=1IVbj1b3JfmSv_BJvGUqYvAPVl3FwC2A-