请问如何使用PHP从PDF文档中提取内容?我面临的主要问题是格式。因此,请告诉我是否有一些方法可以提取具有相同格式的内容,并在在线文本编辑器上显示它。
谢谢
请看一下XPDF
我想你可以这样做
$text = shell_exec("pdftotext $pdffile");
基本用法
pdftohtml -noframes -c test.pdf test.html
将它导入您喜欢的编辑器中
echo file_get_contents('test.html');
你可能需要将一些内容封装在PHP函数/类中。而且你可能想要添加安全措施等等。