我一直在研究如何从一个大于300MB的PDF文件中提取图像。我正在使用pdfbox,但由于某些特定原因,我无法弄清楚其中的问题,有些页面无法正确提取。
我正在使用pdfbox的PDFToImage类作为我的代码基础。
所以,你知道其他可能帮助我完成此操作的库吗?我知道可以使用iText,但我读到它不能用于商业产品。
我已经安装了xpdf和xpdf-utils包,并且名为pdfimages的实用程序运行得很完美。但我需要从Java解决这个问题,并且它应该是可移植的。
我正在使用pdfbox的PDFToImage类作为我的代码基础。
所以,你知道其他可能帮助我完成此操作的库吗?我知道可以使用iText,但我读到它不能用于商业产品。
我已经安装了xpdf和xpdf-utils包,并且名为pdfimages的实用程序运行得很完美。但我需要从Java解决这个问题,并且它应该是可移植的。