如何将.doc或.docx文件转换为.pdf文件?

3
如何使用Java中的Apache Tika将.doc或.docx文件转换为.pdf文件?

1
你不能 - Tika 只能将文件转换为 XHTML 或纯文本! - Gagravarr
1个回答

2

使用Tika有特定的要求吗?你可以使用Apache POI和itext API或专门用于文档转换的document4j API。

document4j示例:

File wordFile = new File( ... ), target = new File( ... );
IConverter converter = ... ;
Future<Boolean> conversion = converter
                                 .convert(wordFile).as(DocumentType.MS_WORD)
                                .to(target).as(DocumentType.PDF)
                                .prioritizeWith(1000) // optional
                                .schedule();

是的,实际上我的项目只使用了Apache Tika,我们不想再为特定的工作使用另一个JAR包。我认为一定有某种方法可以做到这一点,但是在网上没有找到任何支持。 - Vipul Jain
1
Documents4j 对我来说非常完美,转换简单而且完美。顺便说一句,你应该使用不止一个,而是更多的 jars 来完成这个特定的工作。不要害怕在项目中包含更多的 jars。 - AMB
1
我不确定并且我个人也没有尝试过。但是请尝试以下示例,将输出格式从“html”更改为“pdf”。https://gist.github.com/amferraz/bded9e9b28f416d20943 - Abhilash Arjaria

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接