PDF文件类型解释(例如PDF/A-1)

4
我正在开发存储法律文件的软件,考虑使用PDF格式可能是一个理想的工作方式。但是,关于PDF文件的格式最适合我的需求,我还有些困惑。
我对文档有以下要求:
- 如果不是更长时间,将保存至少7年 - 不可编辑 - 包含图像和文本(最好用.jpg格式存储图像)
我最初考虑使用PDF / A-1,但是我发现该格式似乎不喜欢使用JPEG图像,或者至少在使用JODConverter时不支持。
如果您对此有任何建议/解释,哪种格式最符合这些需求,我们将不胜感激!

您的软件是否需要将传统文件格式转换为PDF/A?或者您可以从头开始自由工作,并设置一个系统,只有新创建的文档需要通过您的软件进行归档? - Kurt Pfeifle
一些旧文件需要转换成PDF格式,但我只考虑支持Open Office支持的格式,此外,7年前的大多数文档应该很容易转换成PDF格式,因为人们当时使用的是MS Word。只有仍然需要保留的文件(即7年前的文件)需要转换为PDF格式。 - Matthew Pigram
2个回答

6
对于您所描述的要求,PDF/A-1b(是的,在结尾处有b!)是理想的格式。 b 代表 basic - 它比 PDF/A-1a(在结尾处有a)的要求更少,PDF/A-1a 是为了实现可访问性(或者我会用助记诀说,是“高级”的),要实现 PDF/A-1a 可能会因为需要对文件内容进行额外的标记以实现可访问性功能而非常困难甚至几乎不可能。
至于 JPEG:当然,PDF/A-1b 支持 JPEG。 这不允许使用JPEG2000 压缩,因为在定义 PDF/A-1b 标准时该算法受到专利限制。 因此,生成 PDF/A-1b 的软件必须使用其他方法之一重新压缩对象,这并不构成大问题。
您还可以查看The PDF/A Competence Center (PDFA) 网站。 (声明:我是 PDFA 的成员。)

@user1543083:PDF/A-1b 还需要在 PDF 元数据中声明自己为 PDF/A-1b 的某个标志。否则,它可能符合所有标准,但查看器不会将其识别为这样的文件。 - Kurt Pfeifle
@KurtPfeifle 我有这些文档的访问权限,并且已经检查过它们并使用单个jpg图像进行了测试,但当转换为PDF/A-1时,无法正常工作。据我所知,通过使用库来编写代码无法将其转换为PDF/A-1b,这可能是库的问题,与规范无关,因此我可能无法做任何事情来使其正常工作... - Matthew Pigram
@MatthewPigram:我提供给您分析样本并告诉您哪些PDF/A-1b标准未达到的服务。 - Kurt Pfeifle
@KurtPfeifle 好的,那你想要什么,我转换成PDF的JPG图像还是完成的PDF 1.6? - Matthew Pigram
@MatthewPigram:就像我之前说的那样:“...你的“PDF/A-1b”有2个(虚拟)样本...”,因为你提到了“...我已将单独的页面转换为PDF/A-1...”。 - Kurt Pfeifle
显示剩余9条评论

1

PDF/A-1是一种用于长期存储的良好格式(因为这是它的意图),因此它尝试消除外部依赖关系。这包括一些东西,如嵌入字体和禁用外部超链接(这也是有道理的,但可能会出现问题)。有一些有用的信息在Adobe网站上(查看关键规格选项卡)。PDF听起来似乎是符合您要求的正确答案。

嵌入的图像不应该是一个问题。JODReports可能做错了什么(或者您正在使用的OpenOffice/LibreOffice版本下方的版本)。您可以尝试切换基础架构(OO/LO)的某些部分,直接从OpenOffice/LibreOffice GUI进行实验 - 导出PDF/A-1并查看结果,或尝试链中的其他工具(例如,虽然Docmosis是基于类似技术的)。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接