使用PDFMiner PDFMiner是一款从PDF文档中提取信息的工具。它包括一个PDF转换器,可以将PDF文件转换为其他文本格式(如XML / HTML)。 与其他PDF相关工具不同,它完全专注于获取和分析文本数据。 PDFMiner允许您获取页面上文本的精确位置,以及字体或线条等其他信息。 它具有可扩展的PDF解析器,可用于除文本分析之外的其他目的。