我想快速评估gzip文件的行号。我的方法是检查文件的未压缩大小,从文件开头采样100行(例如使用zcat filename | head -n 100
),并将未压缩大小除以这100行的平均行大小。
问题在于,我从gzip -l获得的数据是无效的。大多数情况下,未压缩大小过小,在某些情况下产生负压缩值。例如,在一个案例中,压缩文件大小为1.8gb,而gzip -l列出的未压缩大小为0.7gb,但解压后实际上为9gb。我尝试过解压和重新压缩,但仍然得到相同的未压缩大小。
系统环境:Ubuntu 18.04.3,gzip版本为1.6。