有没有一种易于编程地将PDF文件转换为docx格式的方法?

4
我们有一些第三方系统提供PDF文档。我们希望将这些PDF文档转换为网页上的可视化格式,而不使用Adobe产品。理想情况下,我们想使用Silverlight来呈现PDF文档,但是我们在从PDF转换为Xaml或使用docx格式作为中间文件时遇到了问题。虽然有很多库可以提供PDF文档,但那并不是我们需要的。
如果存在一个库能够实现这个功能,最好是一个.NET库,但是如果通过命令行执行转换也是可选的。

有没有人知道.NET原生的免费选项,而不是运行第三方应用程序(如Ghostscript)? - Rob
是的,Mono项目实现了许多所需的类。我不确定它在Silverlight方面的当前状态,但计划是实现所有相关的类。 - Charles Stewart
4个回答

2

Aspose销售 .Net 转换库。


他们没有任何可以将PDF转换为doc、docx、RTF或类似格式的工具。 - JTtheGeek
@JTtheGeek,是的,他们可以。您可以使用此库将其导出为DOCX、XLSX或PPTX。https://products.aspose.com/pdf/net - Mark
@Mark,没错,自原问题提出以来,Aspose的产品线大大扩展了,我们现在几乎使用他们所有的产品,它们非常棒。 - JTtheGeek
我实际上点赞了这个帖子,因为在我使用 Aspose PDF for .NET 进行测试后——在 2020 年——它看起来像是在做正确的事情:PDF 转 SVG 转换器能够智能地保留矢量路径。 - scrat.squirrel

1

将PDF转换为SVG(使用ghostscript即可),并将其作为一系列图像导入:我不是.NET程序员,但我知道可以使用system.io.packaging类来完成这项工作。值得一提的是,该类是由Mono项目在.NET之外实现的。


1

如果您实际上不需要更改PDF文档中的任何内容,另一个选择是使用pdf.js将PDF文档呈现为HTML 5。有关更多信息,请参见此博客文章。

http://andreasgal.com/2011/06/15/pdf-js/


0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接