我对压缩几乎一无所知,所以请容忍我(这可能是一个愚蠢和非常明显的问题)。
假设我有一个带有几个标签的XML文件。
<verylongtagnumberone>
<verylongtagnumbertwo>
text
</verylongtagnumbertwo>
</verylongtagnumberone>
现在假设我有很多这样的长标签,并且在我的多个 XML 文件中有许多属性。我需要将它们压缩到最小的尺寸。最好的方法是使用一个 XML 特定的算法,为单个标签分配类似 vlt1 或 vlt2 的伪名称。然而,这不是一种“开放”的方式,而我希望使用像 DEFLATE 或 LZ 这样的常见算法。如果存档是 .zip 文件,则也会有所帮助。
由于我处理的是纯文本(没有像图像这样的二进制文件),因此我想要适合纯文本的算法。哪个算法产生的文件大小最小(首选无损算法)?
顺便说一下,情景是这样的:我正在创建一个包含 XML 文件并打包成 .zip 的文档标准,例如 ODF 或 MS Office XML。
编辑:'加密'这件事是一个打字错误;应该是 '压缩'。