我正在使用iText提取嵌入式图像并将它们保存为单独的文件。.jpg和.png文件可以正常输出,但我无法提取具有CCITTFaxDecode编码的tiff图像。
有没有人知道如何保存tiff文件?
我在Extracting image from PDF with /CCITTFaxDecode filter找到了一些使用iTextSharp的示例C#代码。它表明需要一个单独的tiff库来写出结果。根据该文章,“CCITTFaxDecode”压缩对于tiff库来说是Compression.CCITTFAX4。
要使用该文章的方法,我需要:
- 获取一个tiff库。Java Image I/O API允许您读取和写入TIFF文件以及其他格式。BufferedImage image = ImageIO.read(new File("image.tif"));
- 查找从PDF获取位图属性的代码等效项,例如:pd.Get(PdfName.WIDTH).ToString()(这是在C#中)