将HTML转换为doc(x)和/或PDF

4
我需要将HTML转换为doc(x)和pdf格式。
我发现Aspose可以完成更多的工作,而且价格不便宜。
是否有类似的工具,只能进行这种转换?
我需要在没有安装Word/Office的桌面应用程序上使用此工具。
*仅供参考,最终购买了Aspose Words。所有其他选项都不如此工具好。

你的 HTML 是来自于你的 Web 服务器还是只有文件? - Cymbals
它存储在数据库中。它们是导入的电子邮件消息。 - Boas Enkler
VsWord 是由 Raskin Veniamin 创建的一个包,它允许您通过将 HTML 转换为 .DOCX 来动态创建文件 DOCX。- http://www.phpclasses.org/blog/post/315-Create-Microsoft-Word-DOCX-files-from-HTML-in-PHP-Part-1-Simple-Example.html - Geoffrey Hale
https://pandoc.org/ 可以做到这一点,而且是免费和开源的。 - drkvogel
5个回答

3
也许这个http://kitpdf.com能帮到你。我试过它,它是免费的且使用起来非常简单易懂。

该网站不再工作或未提供所需的结果。 - Edd

3

假设这些基本上是“文档”,而不是花哨的图形网页(即,您希望它们易读,但并不过分关注 Web 布局格式的细节),您可以使用 LibreOffice 进行转换;可以手动执行(打开、导出为……)或使用“无头”模式,例如:

soffice -headless -convert-to pdf -outdir pdfs/ *.html
soffice -headless -convert-to doc -outdir docs/ *.html

免费、跨平台,但安装包有点大。(我认为完整套件加上所有插件已经接近半GB了,但你只需要Writer组件)


1
如果您想要转换“花哨的图形页面”,您可以使用GrabzIt的HTML到DOCX API:https://grabz.it/html-to-word-docx-api.aspx它使用浏览器确保正确呈现。 - user1474090

1

1

我不能代表docx格式发言,但你可以考虑使用DocRaptor将HTML转换为PDF格式。它绝对比其他类似的程序更好地处理CSS样式,并且不像使用Photoshop创建PDF那样只给你一张图片。


0
如果网页已经或可以被托管,那么您可以下载一个名为“屏幕截图”的Google Chrome扩展程序,它允许您对网页进行全屏截图,然后您可以将其粘贴到Photoshop中并另存为.pdf文件(前提是您有Photoshop)。

抱歉,我忘了提到我有一个桌面应用程序(Winform / WPF),现在安装了Office。 - Boas Enkler
这将给您一个有图片的PDF,而不是有文字的PDF。这可能对Boas来说是可以接受的,但值得指出它们之间的区别。 - Stephen P

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接