近年来(1995年以后),像bz2、lzma(7-zip)和rar这样的压缩算法可以对单调文件进行惊人的压缩,而一层压缩就足以将超大的内容包装成可管理的大小。
另一种方法是创建一个极大尺寸(exabytes)的稀疏文件,然后使用一些理解稀疏文件的普通压缩工具(例如tar)进行压缩,现在如果检查员流式传输文件,检查员需要读取所有这些零,这些零仅存在于文件实际内容之间的填充中,但是如果检查员将其写入磁盘,假设压缩解包工具行为良好并且使用现代文件系统,则只会占用很少的空间。
我不知道ZIP是否使用了游程编码,但如果使用了,这样一个压缩文件将包含一小段数据和非常大的游程值。游程值将指定小数据片段被重复多少次。当你有一个非常大的值时,结果数据就会相应地变得很大。