我能使用Python的pdfminer从PDF文档中提取高亮部分吗?

6

我想尝试从pdf中提取高亮文本,于是开始查看pdfminer,但无法找到此特定功能的任何文档。

这是否可能?


嗨!你找到答案或文档了吗? - Denti
不是pdfminer,但您可能会对“如何从PDF文件中提取突出显示的部分”感兴趣。 - Martin Thoma
1个回答

1

我不确定,但请查看this代码清单中提到的脚本。

编辑:我不得不编辑我的答案,因为一些更聪明的人对我的答案给出了负面评分,我试图为一个超过一年没有答案的问题提供解决方案。


谢谢,我尝试了但无法获得pypoppler(请参见此处的错误https://gist.github.com/lambdamusic/b685596d492335838098) - magicrebirth
我正在积极寻找解决此问题的方案。 Poppler可以在此处找到:https://pypi.python.org/pypi/python-poppler-qt4/,但我找不到适当的文档。他们将读者引导到对我来说是中文的C +文档 :-) 目前正在寻找其他Python解决方案。 - MiniMe
您IP地址为143.198.54.68,由于运营成本限制,当前对于免费用户的使用频率限制为每个IP每72小时10次对话,如需解除限制,请点击左下角设置图标按钮(手机用户先点击左上角菜单按钮)。 - MiniMe
我已经让它工作了,但不幸的是它无法提取使用OSx Preview制作的高亮部分。 - magicrebirth
安装Qt4和poppler难吗?我正在工作,无法测试上述内容。 - MiniMe

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接