我需要一个Java库来执行以下任务:1)将Pdf页面转换为图像;2)从PDF页面提取HTML文本以及它们在页面上的位置;3)从PDF页面提取图像。我已经尝试过以下库:
- PDFBox - 该库会出现错误--unsupported/disabled operation: BDC and EMC;
- icePDF - 它可以完成任务1和3,但是需要付费;
- PDFRenderer - 无法完成任务;
- BFO - 该付费库可以完成任务1和3。