有没有一个PDF库可以处理可访问性？

Question

3

我目前正在尝试解析PDF文件的语义结构。我认为添加到PDF文件以使其可访问的元数据是正确的方法，但我找不到一个可以干净处理它的库。

我已经在iOS上尝试了PDFLib TET，但我无法打开某些测试文档，而它返回的错误太模糊，无法通过Google搜索到。

是否有其他可以做同样事情的库？

- ruipacheco

解析语义的目标是什么？你要渲染成HTML吗？ - ckundo

需要更多的解释。您是否希望为某些不存在结构的内容添加结构？哪个库可以将一些文本字符串解释为h1或h2，或者将一组信息解释为表格？如果您正在处理源内容并希望生成标记的PDF，则情况就不同了。 - Kevin Brown

正如@ckundo所说，我想读取一个带标签的PDF文件并将其转换为HTML。 - ruipacheco

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- heiglandreas · Answer 1

我建议您查看pCOS-Library（也来自http://pdflib.com）。对于在PHP中使用，您可以查看http://www.setasign.com/提供的替代方案。他们可能有适用于此目的的工具。