如何从PDF文档中提取文本?

69

链接无效!请纠正! - cwiggo
27
不明白为什么这个问题被认为是不相关的,因为它非常有用,即使它可能吸引“主观”的答案,看到不同的观点总是更好的。访问量也很高。 - user3574492
1个回答

59

2
如果PDF文件中有任何表格,则它不会显示出来。我想提取与PDF附加的扫描图像文本一样显示在PDF中的内容。有什么解决办法吗? - user1360768
非常感谢...那个类很有用。在这里,我只想从 PDF 中找到一个 URL。有什么办法可以找到吗...? - CJ Ramki
该类包括一个输出缓冲刷新,可能会导致“头已发送”错误。如果禁用它(对于任何合理大小的文档),似乎没有任何不良影响。 - Geoff Kendall
1
是的,类并不适用于所有情况。您有其他建议吗? - Kamaldeep singh Bhatia
3
你可以尝试使用http://pdfparser.org/。 - Pedro Lobito
显示剩余5条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接