20得票4回答
将PDF转换为HTML

如何将PDF文档转换为可在浏览器中查看的HTML文件是最佳解决方案?该网站包含多个PDF文档,访问者可以单击“以HTML格式查看”,应在屏幕上以HTML文件的形式查看。 标准网站运行PHP,Linux,Apache。

14得票9回答
什么是适用于Ruby on Rails的好的PDF转HTML转换器?

我正在尝试通过编程将PDF转换为HTML。到目前为止,我一直在使用pdftohtml,但是我们的用户对结果不满意。 以下是我需要的内容: 我使用的是Ruby on Rails,但任何在Unix上工作的工具都可以,因为我可以从命令行调用它。当然,一个好的gem或插件会更完美。 最好是开源的...

12得票2回答
从PDF中提取表格数据

有没有一种一致的方法可以从PDF文件中提取表格? 有什么工具可用? 我目前为止做了什么: 我尝试使用pdftotext工具。 它有一个选项可以转换为HTML布局。 这个方法存在的问题: 表格信息在HTML输出中未保留 我期望看到<table>标签,但所有内容都在&lt...