有没有一个PDF库可以处理可访问性?

3
我目前正在尝试解析PDF文件的语义结构。我认为添加到PDF文件以使其可访问的元数据是正确的方法,但我找不到一个可以干净处理它的库。
我已经在iOS上尝试了PDFLib TET,但我无法打开某些测试文档,而它返回的错误太模糊,无法通过Google搜索到。
是否有其他可以做同样事情的库?

解析语义的目标是什么?你要渲染成HTML吗? - ckundo
需要更多的解释。您是否希望为某些不存在结构的内容添加结构?哪个库可以将一些文本字符串解释为h1或h2,或者将一组信息解释为表格?如果您正在处理源内容并希望生成标记的PDF,则情况就不同了。 - Kevin Brown
正如@ckundo所说,我想读取一个带标签的PDF文件并将其转换为HTML。 - ruipacheco
1个回答

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接