如何将PDF文档转换为可在浏览器中查看的HTML文件是最佳解决方案?该网站包含多个PDF文档,访问者可以单击“以HTML格式查看”,应在屏幕上以HTML文件的形式查看。
标准网站运行PHP,Linux,Apache。
如何将PDF文档转换为可在浏览器中查看的HTML文件是最佳解决方案?该网站包含多个PDF文档,访问者可以单击“以HTML格式查看”,应在屏幕上以HTML文件的形式查看。
标准网站运行PHP,Linux,Apache。
pdftohtml的功能很好:快速、稳定,但是HTML的结果最多只能算丑陋。我已经在一个拥有许多工作简历的网站上使用了它相当长的一段时间。
然而,它是提取文本内容的好解决方案。
我建议尝试scribd API或Google应用文档API。谷歌在显示和转换PDF文件方面做得非常出色。
您是否考虑将PDF数据保存在数据库中,然后根据访问者的选择动态创建PDF或HTML页面呢?
如果你准备从PHP中调用Java,你可以看一下http://www.jpedal.org/html_index.php