在Java中将PDF转换为RTF

3

有没有人知道一个容易获取的库或SDK,可以在Java中将PDF文档转换为RTF格式?

2个回答

2
请看一下iText(我知道不支持直接PDF-> RTF转换-但请继续阅读,以获取惊人的可能性!)。
  1. 去年我们向iText添加了一个PDF文本解析模块。目前,这还有点简陋,但它确实有效,并且很容易扩展。

  2. iText擅长生成RTF。

所以...从PDF中解析文本并基于解析创建RTF应该相对简单(不是易事,但是简单)。
如果您必须保留字体之类的东西,则需要更多的工作(PDF解析器提供字体信息以及每个文本片段的页面位置),但我认为iText的RTF生成器将简化大部分工作。
如果您的PDF包含嵌入的图像,您需要将其带到RTF中,则当前的PDF解析器实际上并没有做太多工作-但是它具有足够的钩子,可以通过一些肘部力量让它发生。
所以我会说iText很可能可以做到您要寻找的内容,并且将帮助您实现开发工作的最小化,但我不会把它放在超级容易的类别中...实际上听起来很有挑战性。
如果您最终实施了这样的东西,请在您有机会玩一下后随时与我联系,以获取问题/想法。如果您最终获得了相当数量的转换代码,我们可能希望将其添加到iText中。
如果您只是想把它搞定,并且您有钱可花,我相信有许多商业转换器可以做到您要寻找的内容。可能不便宜,但比您的开发时间可能更便宜。

0
你可以尝试查看iText,它主要是一个PDF库,但它也有一个可用的RTF包附加组件。

看起来iText不支持这个方向的转换 - http://itext.ugent.be/library/question.php?id=651(除非自那时起它已经改变..?) - Dexter
好的 - 我没有使用过RTF插件,只是看到它的存在。 - RodeoClown

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接